Каква е разликата между ecc памет и нормална памет. Обяснете какво е „ECC поддръжка“ на RAM

Въпроси

Какви ограничения на паметта се налагат от съвременните операционни системи от семейството Windows?

Остарели, но все още се срещат на места, работещи Windows системи 9x/ME може да работи само с 512 MB памет. И въпреки че конфигурациите с голям обем са напълно възможни за тях, това причинява много повече проблеми, отколкото ползи. Модерен 32-битов Windows версии 2000/2003/XP и Vista теоретично поддържат до 4 GB памет, но реално не повече от 2 GB са налични за приложения. С няколко изключения, операционната система от начално ниво Windows XP Starter Edition и Windows Vista Starter може да работи съответно с не повече от 256 MB и 1 GB памет. Максималният поддържан размер на 64-битовата Windows Vista варира според версията и е:

  • Home Basic - 8 GB;
  • Home Premium - 16 GB;
  • Ultimate - Над 128 GB;
  • Бизнес - Повече от 128 GB;
  • Enterprise - Повече от 128 GB.

Какво е DDR SDRAM?

памет тип DDR(Double Data Rate - двойна скорост на трансфер на данни) осигурява трансфер на данни по шината на паметта-чипсет два пъти на такт, по двата фронта на тактовия сигнал. Така, когато системната шина и паметта работят на една и съща тактова честота, пропускателна способностшината на паметта е два пъти по-голяма от тази на конвенционалната SDRAM.

Два параметъра обикновено се използват при обозначаването на модулите памет DDR: или работната честота (равна на удвоената стойност тактова честота) - например тактовата честота на паметта DR-400 е 200 MHz; или пикова пропускателна способност (в Mb/s). Същият DR-400 има честотна лента от приблизително 3200 Mb / s, така че може да се нарече PC3200. В момента DDR паметта е загубила своето значение и в новите системи тя е почти напълно изместена от по-модерната DDR2. въпреки това, за да се задържи на повърхността голям брой по-стари компютри, които имат инсталирана DDR памет, тя все още се пуска. Най-често срещаните 184-пинови DDR модули са PC3200 и в по-малка степен PC2700. DDR SDRAM може да има регистрирани и ECC варианти.

Какво е DDR2 памет?

DDR2 паметта е наследник на DDR и в момента е доминиращият тип памет за настолни компютри, сървъри и работни станции. DDR2 е проектиран да работи на повече от високи честоти, отколкото DDR, се характеризира с по-ниска консумация на енергия, както и набор от нови функции (предварително извличане на 4 бита на такт, вградено терминиране). Освен това, за разлика от DDR чиповете, които се произвеждат както в TSOP, така и в FBGA пакети, DDR2 чиповете се предлагат само в FBGA пакети (което им осигурява по-голяма стабилност при високи честоти). DDR и DDR2 модулите памет са не само електрически и механично съвместими един с друг: 240-пинови скоби се използват за DDR2, докато 184-пинови скоби се използват за DDR. Днес най-често срещаната памет работи на честота от 333 MHz и 400 MHz и се нарича съответно DDR2-667 (PC2-5400/5300) и DDR2-800 (PC2-6400).

Какво е DDR3 памет?

Отговор: Третото поколение DDR памет - DDR3 SDRAM скоро трябва да замени сегашната DDR2. Производителността на новата памет се е удвоила в сравнение с предишната: сега всяка операция за четене или запис означава достъп до осем групи DDR3 DRAM данни, които от своя страна, използвайки два различни референтни осцилатора, се мултиплексират през I / O щифтовете на честота четири пъти по-голяма от тактовата честота. Теоретично, ефективните DDR3 честоти ще бъдат в диапазона от 800 MHz - 1600 MHz (при тактови честоти от 400 MHz - 800 MHz), като по този начин маркировката на DDR3 в зависимост от скоростта ще бъде: DDR3-800, DDR3-1066, DDR3 -1333, DDR3-1600. Сред основните предимства на новия стандарт, на първо място, заслужава да се отбележи значително по-ниската консумация на енергия (захранващо напрежение DDR3 - 1,5 V, DDR2 - 1,8 V, DDR - 2,5 V).

Какво представлява паметта, готова за SLI?

Отговор: SLI-Ready-memory, с други думи - памет с EPP (Enhanced Performance Profiles - профили за повишаване на производителността), е създадена от маркетинговите отдели на NVIDIA и Corsair. EPP профили, в които освен стандартните тайминги на паметта, стойността на оптималното захранващо напрежение на модулите, както и някои Допълнителни опции, се записват в SPD чипа на модула.

Благодарение на EPP профилите, сложността на самооптимизирането на работата на подсистемата на паметта е намалена, въпреки че "допълнителните" времена не оказват значително влияние върху производителността на системата. Така че няма значителна печалба от използването на SLI-Ready памет в сравнение с конвенционалната ръчно оптимизирана памет.

Какво е ECC памет?

ECC (Error Correct Code - откриване и коригиране на грешки) се използва за коригиране на произволни грешки в паметта, причинени от различни външни фактори, и е подобрена версия на системата за "паритетна проверка". Физически ECC е реализиран като допълнителен 8-битов чип памет, инсталиран до основните. По този начин ECC модулите са 72-битови (за разлика от стандартните 64-битови модули). Някои типове памет (регистрирана, пълна буферирана) са налични само във версия ECC.

Какво е регистрирана памет?

Регистрираните (регистрирани) модули памет се използват главно в сървъри, които работят с големи количества RAM. Всички имат ECC, т.е. са 72-битови и в допълнение съдържат допълнителни регистрови чипове за частично (или пълно - такива модули се наричат ​​Full Buffered или FB-DIMM) буфериране на данни, като по този начин намаляват натоварването на контролера на паметта. Буферираните DIMM модули обикновено са несъвместими с небуферираните.

Възможно ли е вместо това конвенционална паметизползвате регистриран и обратно?

Въпреки физическата съвместимост на конекторите, обикновената небуферирана памет и регистрираната памет не са съвместими една с друга и съответно използването на регистрирана памет вместо обикновена памет и обратното е невъзможно.

Какво е SPD?

Всеки DIMM модул памет има малък SPD (Serial Presence Detect) чип, в който производителят записва информация за работните честоти и съответните забавяния на чиповете памет, необходими за осигуряване нормална операциямодул. Информацията от SPD се чете от BIOS по време на фазата на самодиагностика на компютъра преди зареждане операционна системаи ви позволява автоматично да оптимизирате параметрите за достъп до паметта.

Могат ли модули памет с различна честота да работят заедно?

Няма фундаментални ограничения за работата на модули памет с различна честота. В този случай (в автоматична настройкапамет според SPD данни), скоростта на цялата подсистема на паметта ще се определя от скоростта на най-бавния модул.

Да, можеш. Високата стандартна тактова честота на модула с памет не влияе върху способността му да работи при по-ниски тактови честоти, освен това, поради ниските тайминги, които са постижими при ниски работни честоти на модула, забавянето на паметта намалява (понякога значително).

Колко и какви модули памет трябва да се монтират в системната платка, за да може паметта да работи в двуканален режим?

В общия случай, за да се организира работата на паметта в двуканален режим, е необходимо да се инсталира четен брой модули памет (2 или 4), като по двойки модулите трябва да са с еднакъв размер и за предпочитане (макар и не е задължително) ) от същата партида (или в най-лошия случай от същия производител). В съвременните дънни платки слотовете за памет на различните канали са маркирани с различни цветове.

Последователността на инсталиране на модули памет в тях, както и всички нюанси на работата на тази платка с различни модули памет, обикновено са подробно описани в ръководството за дънната платка.

Кои производители трябва да обърнат внимание на паметта на първо място?

На нашия пазар има няколко производители на памети, които заслужават добра репутация. Това ще бъдат например модулите на марката OCZ, Kingston, Corsair, Patriot, Samsung, Transcend.

Разбира се, този списък далеч не е пълен, но когато купувате памет от тези производители, можете да сте сигурни в нейното качество с голяма степен на вероятност.

Доколкото разбирам, аргументите му са следните:

  1. Google не използваха ECC, когато изградиха сървърите си през 1999 г.
  2. Повечето грешки в RAM са систематични, а не случайни.
  3. Грешките в RAM са редки, защото Хардуерподобрен.
  4. Ако ECC паметта действително имаше важност, тогава ще се използва навсякъде, не само в сървъри. Плащането за този вид незадължителен материал очевидно е твърде съмнително.
Нека прегледаме тези аргументи един по един:

1. Google не използва ECC през 1999 г

Ако правите нещо само защото Google някога го е направил, тогава опитайте:

A. Поставете вашите сървъри в транспортни контейнери.

Днес все още пишат статии, че това е страхотна идея, въпреки че Google току-що проведе експеримент, който беше счетен за провал. Оказва се, че дори експериментите на Google не винаги дават резултат. Всъщност прословутата им привързаност към „революционни проекти“ („loonshots“) означава, че имат повече неуспешни експерименти от повечето компании. Според мен това е значително конкурентно предимство за тях. Не правете това предимство по-голямо, отколкото е, като сляпо копирате неуспешни експерименти.

Б. Запалете пожари в собствените си центрове за данни.

Част от публикацията на Atwood обсъжда колко невероятни са тези сървъри:

Някои може да погледнат тези ранни сървъри на Google и да видят непрофесионализма по отношение на опасността от пожар. Не съм аз. Виждам тук далновидно разбиране за това как евтиният готов хардуер ще оформи съвременния интернет.

Последната част от казаното е вярно. Но в първата част има известна истина. Когато Google започна да проектира свои собствени платки, едно поколение от тях имаше проблем с „растеж“ ( ), който причини различен от нула брой пожари.

Между другото, ако отидете на публикацията на Джеф и погледнете снимката, посочена в цитата, ще видите, че има много джъмперни кабели на платките. Това създаде проблеми и беше коригирано в следващото поколение хардуер. Вижда се и доста небрежно окабеляване, което допълнително създаваше проблеми и също беше бързо коригирано. Имаше и други проблеми, но ще ги оставя като упражнение за читателя.

C. Създайте сървъри, които нараняват вашите служители

Острите ръбове на едно от поколенията сървъри на Googleспечелиха им репутацията, че са направени от „остриета за бръснене и омраза“.

Г. Създайте свое собствено време във вашите центрове за данни

След разговор със служители на много големи технологични компании изглежда, че повечето компании са толкова контролирани от климата, че в техните центрове за данни се образуват облаци или мъгла. Бихте могли да го наречете изчислен и коварен план на Google да възпроизведе времето в Сиатъл, за да грабне служители на Microsoft. Като алтернатива можеше да е план за създаване в буквалния смисъл на " облачни изчисления". Или може би не.

Моля, обърнете внимание, че всичко, посочено от Google, е изпробвано и след това променено. Правенето на грешки и след това тяхното поправяне е обичайно за всяка успешна организация за развитие. Ако идолизирате инженерната практика, тогава трябва да се придържате поне към съвременната практика, а не към това, което е направено през 1999 г.

Когато през 1999 г. Google използва сървъри, различни от ECC, те показаха редица симптоми, за които в крайна сметка беше установено, че са повреда на паметта. Включително индекс за търсене, който връща почти произволни резултати в заявки. Действителният режим на повреда тук е поучителен. Често чувам, че ECC може да се игнорира на тези машини, тъй като грешките в индивидуалните резултати са приемливи. Но дори ако считате случайните грешки за приемливи, пренебрегването им означава, че има опасност от пълна повреда на данните, освен ако не бъде извършен внимателен анализ, за ​​да се уверите, че една грешка може само леко да изкриви един резултат.

В проучвания, проведени на файлови системиах, многократно е показано, че въпреки героичните опити да се създадат системи, които са устойчиви на една грешка, е изключително трудно да се направи това. По същество всяка сериозно тествана файлова система може да има сериозен отказ поради една единствена грешка (). Няма да атакувам разработчиците на файлови системи. Те са по-добри в този вид анализ от 99,9% от програмистите. Просто проблемът многократно е показван като толкова труден, че хората не могат разумно да го обсъждат, а автоматизираният инструмент за такъв анализ все още далеч не е просто натискане на бутон. В техния Наръчник за складови компютри Google обсъжда откриването и коригирането на грешки, а ECC паметта се счита за най-добрата опция, когато е очевидно, че трябва да се използва корекция на хардуерни грешки ( ).

Google разполага с отлична инфраструктура. От това, което съм чувал за инфраструктурата в други големи технологични компании, Google изглежда е най-добрият в света. Но това не означава, че трябва да копирате всичко, което правят. Дори ако се вземат предвид само техните добри идеи, няма смисъл повечето компании да ги копират. Те създадоха заместител на планировчика на кукичката за работа на Linux, който използва както информация за времето на изпълнение на хардуера, така и статични следи, за да им позволи да се възползват от новия хардуер в сървърните процесори на Intel, позволявайки динамично разделяне на кеша между ядрата. Ако използвате това на цялото им оборудване, тогава Google спестява за една седмица повече париотколкото Stack Exchange е похарчил за всички свои машини в своята история. Това означава ли, че трябва да копирате Google? Не, освен ако вече не сте били ударени с манна небесна, като например основната ви инфраструктура да е написана на силно оптимизиран C++, а не на Java или (не дай Боже) Ruby. И факт е, че за по-голямата част от компаниите писането на програми на език, който води до 20-кратно намаляване на производителността, е напълно разумно решение.

2. Повечето RAM грешки са системни грешки

Аргументът срещу ECC възпроизвежда следния раздел от изследването на грешките на DRAM (акцентът е добавен от Джеф):
Нашето изследване има няколко основни резултата. Първо, открихме, че приблизително 70% от повреди на DRAM са повтарящи се (напр. постоянни) повреди, докато само 30% са периодични (интермитентни) повреди. Второ, открихме, че големите многобитови повреди, като повреди, които засягат цял ​​ред, колона или блок, представляват над 40% от всички повреди на DRAM. Трето, открихме, че почти 5% от отказите на DRAM засягат схеми на ниво платка, като например линии за данни (DQ) или порта (DQS). Накрая открихме, че функцията Chipkill намалява честотата на системните повреди, причинени от DRAM повреди, с фактор 36.

Цитатът изглежда някак ироничен, тъй като не изглежда да е аргумент срещу ECC, а аргумент за Chipkill - определен ECC клас. Като оставим това настрана, публикацията на Джеф показва, че систематичните грешки са два пъти по-често срещани от случайните грешки. След това публикацията казва, че те изпълняват memtest на своите машини, когато възникнат системни грешки.

Първо, съотношението 2:1 не е достатъчно голямо, за да игнорира просто случайни грешки. Второ, публикацията предполага убеждението на Джеф, че систематичните грешки са по същество неизменни и не могат да се появят след известно време. Това не е вярно. Електрониката се износва по същия начин, по който се износват механичните устройства. Механизмите са различни, но ефектите са подобни. Наистина, ако сравним анализа на надеждността на чипа с други видове анализ на надеждността, можем да видим, че те често използват едни и същи семейства от разпределения за моделиране на отказ. Трето, линията на разсъждение на Джеф предполага, че ECC не може да помогне за откриване или коригиране на грешки, което не само е погрешно, но и директно противоречи на цитата.

И така, колко често ще стартирате memtest на вашите машини в опит да ги уловите системни грешкии каква загуба на данни сте готови да понесете? Едно от ключовите приложения на ECC не е да коригира грешки, а да сигнализира за грешки, така че хардуерът да може да бъде заменен, преди да настъпи „тиха корупция“. Кой би се съгласил да затваря всичко на машината всеки ден, за да изпълнява memtest? Би било много по-скъпо от просто закупуване на ECC памет. И дори да успеете да ме убедите да пусна тест на паметта, memtest няма да открие толкова грешки, колкото може ECC.

Когато работех за компания с флот от около хиляда машини, забелязахме, че имаме странни грешки при проверката за целостта на данните и след около шест месеца разбрахме, че грешките на някои машини са по-вероятни от други. Тези повреди бяха доста редки (може би няколко пъти седмично средно), така че отне много време, за да се натрупа информация и да се разбере какво се случва. Без да се знае причината, анализирането на регистрационните файлове, за да се види дали грешките са причинени от обръщане на единични битове (с голяма вероятност), също беше нетривиално. Имахме късмет, че като страничен ефект от процеса, който използвахме, контролните суми бяха изчислени в отделен процес на различна машина по различно време, така че грешка да не може да повреди резултата и да разпространи тази повреда в контролната сума.

Ако просто се опитвате да се защитите с контролни суми в паметта, има голям шанс да извършите операция с контролна сума върху вече повредени данни и да получите правилната контролна сума на лошите данни, освен ако не правите някои наистина фантастични изчисления които дават свои собствени контролни суми. И ако сте сериозни относно коригирането на грешки, вероятно все още използвате ECC.

Така или иначе, след като завършихме анализа, открихме, че memtest не може да открие никакви проблеми, но подмяната на RAM на лоши машини доведе до намаляване на процента грешки с един до два порядъка. Повечето услуги нямат вида контролни суми, които имахме ние; тези услуги просто тихо ще запишат повредени данни в постоянното хранилище и няма да видят проблема, докато клиентът не се оплаче.

3. Поради развитието на хардуера, грешките станаха много редки.

Данните в публикацията не са достатъчни за подобно твърдение. Имайте предвид, че тъй като използването на RAM се увеличава и продължава да нараства експоненциално, грешките на RAM трябва да намаляват с по-голяма експоненциална скорост, за да се намали действително честотата на повреда на данните. Освен това, тъй като чиповете стават все по-малки, елементите стават по-малки, правейки повече актуални въпросиизносване, разгледано във втори параграф. Например, с 20nm технология, един DRAM кондензатор може да акумулира около 50 електрона и този брой ще бъде по-малък за следващото поколение DRAM, като същевременно продължава да намалява.

Друга забележка: когато плащате за ECC, вие не плащате само за ECC памет - вие плащате за части (процесори, платки), които са с по-високо качество. Това може лесно да се види с честотата на отказ на дискове и съм чувал, че много хора забелязват това в личните си наблюдения.

За да цитирам публично достъпно изследване, доколкото си спомням, групата на Андреа и Рамзи пуснаха доклада SIGMETRICS преди няколко години, който показа, че SATA устройство е 4 пъти по-вероятно да се провали при четене, отколкото SCSI устройство, и 10 пъти по-вероятно да има скрита повреда на данните. Това съотношение се запазва дори при използване на дискове от същия производител. Няма особена причина да мислим, че SCSI интерфейсът трябва да бъде по-надежден от SATA интерфейс, но не става въпрос за интерфейса. Говорим за закупуване на високонадеждни сървърни компоненти в сравнение с клиентските. Може би не се интересувате конкретно от надеждността на диска, защото имате всичко на контролните суми и лесно се откриват повреди, но има някои видове нарушения, които са по-трудни за откриване.

4. Ако ECC паметта беше наистина важна, тогава тя щеше да се използва навсякъде, не само в сървърите.

За да перифразираме леко този аргумент, можем да кажем, че "ако тази характеристика беше наистина важна за сървърите, тогава тя щеше да се използва и в несървъри." Можете да приложите този аргумент към доста сървърен хардуер. Всъщност това е един от най-разочароващите проблеми, пред които са изправени големите доставчици на облачни услуги.

Те имат достатъчно ливъридж, за да получат повечето от компонентите на правилната цена. Но договарянето ще работи само когато има повече от един жизнеспособен доставчик.

Една от малкото области, в които няма жизнеспособни конкуренти, е производството процесории видео ускорители. За щастие на големите доставчици, те обикновено не се нуждаят от видео ускорители, имат нужда от процесори, много - това отдавна е така. Имаше няколко опита от доставчици на процесори да навлязат на сървърния пазар, но всеки такъв опит винаги имаше фатални недостатъци от самото начало, правейки очевидно, че е обречен (а това често са проекти, които изискват поне 5 години, т.е. беше необходимо да прекарват много време без увереност в успеха).

Усилията на Qualcomm предизвикаха много шум, но когато говоря с моите контакти в Qualcomm, всички те ми казват какво е направено в този моментчипът е предназначен основно за вземане на проби. Това се случи, защото Qualcomm трябваше да се научи как да направи сървърен чип от всички хора, които бяха отвлечени от IBM, и че следващият чип ще бъде първият, който може да се надяваме да бъде конкурентен. Имам големи надежди за Qualcomm, а също и за усилията на ARM да направи добри сървърни компоненти, но тези усилия все още не са довели до желания резултат.

Почти пълната неподходящост на текущите ARM (и POWER) опции (освен хипотетичните опции за впечатляващия ARM чип на Apple) за повечето сървърни натоварвания по отношение на производителността на долар от общата цена на притежание (TCO) е тема, която е малко встрани от утъпкания път , така че ще оставя това за сега друга публикация. Но въпросът е, че Intel има позиция на пазара, която може да принуди хората да плащат допълнително за сървърни функции. И Intel го прави. Освен това някои функции са наистина по-важни за сървърите, отколкото за мобилни устройствас няколко гигабайта RAM и енергиен бюджет от няколко вата, мобилни устройства, които все още се очаква периодично да се сриват и рестартират.

Заключение

Трябва ли да купя ECC RAM? Зависи от много неща. За сървърите вероятно е така добър варианткато се вземат предвид разходите. Наистина е трудно обаче да се направи анализ на разходите и ползите, тъй като е доста трудно да се определи цената на латентната повреда на данните или цената на риска от загуба на половин година от времето на разработчика за проследяване на периодични сривове, само за да се установи, че са причинени от използване на памет без ECC.

За настолни компютри аз също съм привърженик на ECC. Но ако не правите редовно архивиране, тогава е по-полезно за вас да инвестирате в редовни архиви, отколкото в ECC памет. И ако имате резервни копиябез ECC, тогава можете лесно да записвате повредени данни в основното хранилище и да копирате тези повредени данни в архива.

Благодаря на Прабхакар Рагда, Том Мърфи, Джей Уайскопф, Лия Хансън, Джо Уайлдър и Ралф Кордерой за дискусията/коментари/корекции. Освен това, благодаря (или може би не благодаря) на Лия, че ме убеди да напиша този устен импровизиран текст като публикация в блог. Извиняваме се за всякакви грешки, липса на препратки и възвишена проза; това по същество е запис на половината дискусия и аз не обясних условията, не предоставих връзки или проверих фактите до нивото на детайлност, което обикновено правя.

Един забавен пример е (поне за мен) магическата самовъзстановяваща се стопяема връзка. Въпреки че има много реализации, представете си стопяема връзка на чип като вид резистор. Ако прекарате някакъв ток през него, тогава трябва да получите връзка. Ако токът е твърде висок, резисторът ще се нагрее и в крайна сметка ще се счупи. Това обикновено се използва за деактивиране на елементи на чипове или за дейности като настройка на тактовата честота. Основният принцип е, че след като джъмперът е изгорял, няма начин да се върне в първоначалното си състояние.

Преди много време имаше производител на полупроводници, който беше малко прибързан с техния производствен процес и донякъде прекалено намалени толеранси в определено поколение технологии. След няколко месеца (или години) връзката между двата края на такъв джъмпер успя да се появи отново и да я възстанови. Ако имате късмет, такъв джъмпер ще бъде нещо като най-значимия бит на умножителя на часовника, който, ако бъде променен, ще деактивира чипа. Ако нямате късмет, това ще доведе до скрита повреда на данните.

Чувал съм от много хора в различни компании за проблемите в това технологично поколение на този производител, така че това не са изолирани случаи. Когато казвам, че е смешно, имам предвид, че е смешно да чуеш тази история в бар. По-малко смешно е да разберете след година тестване, че някои от вашите чипове не работят, защото техните настройки на джъмпера са безсмислени и трябва да преправите чипа си и да забавите пускането с 3 месеца. Между другото, тази ситуация за възстановяване на стопяема връзка е друг пример за клас грешки, които могат да бъдат смекчени с ECC.

Не е проблем с google; Споменавам това само защото много от хората, с които говоря, са изненадани как хардуерът може да се провали.

Ако не искате да ровите из цялата книга, ето фрагмента:

В система, която може да издържи поредица от повреди на софтуерно ниво, минималното изискване за хардуерната част е грешките на тази част винаги да се откриват и докладват. софтуердостатъчно навреме, за да позволи на софтуерната инфраструктура да ги съдържа и да предприеме подходящи действия за възстановяване. Не е необходимо хардуерът изрично да обработва всички повреди. Това не означава, че хардуерът за такива системи трябва да бъде проектиран без възможност за коригиране на грешки. Когато и да е функционалносткорекциите на грешки могат да бъдат предложени на разумна цена или сложност, поддръжката им често се отплаща. Това означава, че ако коригирането на хардуерни грешки беше изключително скъпо, тогава системата може да използва по-евтина версия, която предоставя само възможности за откриване. Съвременни системи DRAM са добър примерситуация, в която може да се осигури мощна корекция на грешки при много ниски допълнителни разходи. Облекчаването на изискването за откриване на хардуерни грешки обаче би било много по-трудно, тъй като би означавало, че всеки софтуерен компонент ще бъде обременен с необходимостта да проверява правилното си изпълнение. В началото на своята история Google трябваше да се справя със сървъри, където DRAM дори нямаше паритет. Създаването на индекс за търсене в мрежата по същество се състои от много голяма операция за сортиране/сливане с използване на множество машини по дължина. През 2000 г. една от месечните актуализации на уеб индекса на Google се провали при предварителна проверка, когато беше открито, че подмножество от тестваните заявки връщат документи, очевидно на случаен принцип. След известно проучване в нов индексни файловебеше идентифицирана ситуация, която съответстваше на фиксиране на бит на нула на определено място в структурите от данни, което беше отрицателен страничен ефект от поточно предаване на голямо количество данни през дефектен DRAM чип. Проверките за съгласуваност бяха добавени към структурите от данни на индекса, за да се сведе до минимум шансът този проблем да се появи отново и не е имало повече проблеми от този характер. Все пак трябва да се отбележи, че този метод не гарантира 100% откриване на грешки при преминаването на индексирането, тъй като не всички позиции в паметта се проверяват - инструкциите, например, остават непроверени. Това проработи, защото индексните структури от данни бяха толкова по-големи от всички други данни, включени в изчислението, че наличието на тези самонаблюдаващи се структури от данни направи много вероятно машини с дефектна DRAM да бъдат идентифицирани и изключени от клъстера. Следващото поколение машини Google вечесъдържаше откриване на паритета на паметта и след като цената на ECC паметта падна до конкурентни нива, всички следващи поколения използваха ECC-DRAM.

Тагове: Добавете тагове

#ECC #Registered #Buffered #Parity #SPD

Код за правилна грешка (ECC)

ECC или Error Correct Code - откриване и коригиране на грешки (възможни са и други интерпретации на същото съкращение) - алгоритъм, който замени "паритетната проверка". За разлика от последния, всеки бит е включен в повече от една контролна сума, което позволява, в случай на грешка в един бит, да се възстанови адреса на грешката и да се коригира. По правило се откриват и грешки в два бита, въпреки че не се коригират. За реализиране на тези възможности на модула се инсталира допълнителен чип и той става 72-битов, за разлика от 64-битовите данни на конвенционалния модул.

ECC се поддържа от всички съвременни дънни платки, предназначени за сървърни решения, както и някои чипсети с "общо предназначение". Някои типове (регистриран, пълен буфер) са налични само във версия ECC. Трябва да се отбележи, че ECC не е панацея за дефектна памет и се използва за коригиране на случайни грешки, намалявайки риска от неизправности на компютъра от случайни промени в съдържанието на клетките на паметта, причинени от външни фактори, като фонова радиация.

буфериран

Buffered - буфериран модул. Поради високия им общ електрически капацитет, дългите им времена на "зареждане" водят до отнемащи време операции за запис. За да се избегне това, някои модули (обикновено 168-пинови DIMM) са оборудвани със специален чип (буфер), който съхранява входящите данни относително бързо, което освобождава контролера. Буферираните DIMM модули обикновено са несъвместими с небуферираните. Частично буферираните модули се наричат ​​също "регистрирани" ( Регистриран), и модули с пълно буфериране (Full Buffered) - FB-DIMM. В този случай "небуфериран" се отнася до обикновени модули памет без буферни съоръжения.

Паритет

Parity - паритет, модули с паритет, също и паритет. Доста стар принцип за проверка на целостта на данните. Същността на метода е, че за байта данни на етапа на запис се изчислява контролна сума, която се съхранява като специален бит за паритет в отделен чип. Когато данните се четат, контролната сума се изчислява отново и се сравнява с бита за паритет. Ако съвпадат, данните се считат за автентични, в противен случай се генерира съобщение за грешка при паритет (обикновено води до спиране на системата). Очевидните недостатъци на метода включват високата цена на паметта, необходима за съхраняване на допълнителни битове за четност, несигурност срещу двойни грешки (както и фалшиви положителни резултати в случай на грешка в бита за четност), изключване на системата дори при незначителна грешка (да речем, във видеокадър). В момента не е приложимо.

SPD чип

SPD е чип на DIMM модул памет, който съдържа всички данни за него (по-специално информация за скоростта), необходими за осигуряване на нормална работа. Тези данни се четат на етапа на самотестиране на компютъра, много преди зареждането на операционната система, и ви позволяват да конфигурирате настройките за достъп до паметта, дори ако в системата има едновременно различни модули памет. Някои дънни платки отказват да работят с модули, които нямат SPD чип, но такива модули вече са много редки и са предимно PC-66 модули.

Обяснете какво е „ECC поддръжка“ на RAM

  1. проверка на паметта за грешки
  2. това е функция за коригиране на грешки. такава памет се поставя на сървъри, защото е невъзможно те да забавят, изключват или претоварват поради грешки. за домашен компютър това не е необходимо нещо, въпреки че е полезно. ако решите да инсталирате такъв за себе си, уверете се, че вашата дънна платка поддържа този тип RAM с ECC.
  3. Така че можете да се ограничите до програмата memtest? Или тази технология непрекъснато наблюдава и коригира малки стойности в данните от паметта?
  4. ECC (Error Correct Code) - откриване и коригиране на грешки (възможни са и други интерпретации на същото съкращение) - алгоритъм, който замени "паритетната проверка". За разлика от последния, всеки бит е включен в повече от една контролна сума, което позволява, в случай на грешка в един бит, да се възстанови адреса на грешката и да се коригира. По правило се откриват и грешки в два бита, въпреки че не се коригират. За реализиране на тези възможности на модула се инсталира допълнителен чип памет и той става 72-битов, за разлика от 64-битовите данни на конвенционалния модул. ECC се поддържа от всички съвременни дънни платки, предназначени за сървърни решения, както и някои чипсети с "общо предназначение". Някои типове памет (регистрирана, пълна буферирана) са налични само във версия ECC. Трябва да се отбележи, че ECC не е панацея за дефектна памет и се използва за коригиране на случайни грешки, намалявайки риска от неизправности на компютъра от случайни промени в съдържанието на клетките на паметта, причинени от външни фактори, като фонова радиация.
    Регистрираните модули памет се препоръчват за използване в системи, изискващи (или поддържащи) 4 GB или повече RAM. Те винаги са 72 бита, тоест са ECC модули и съдържат допълнителни регистрови чипове за частично буфериране.
    PLL-Phase Locked Loop - верига за автоматично управление на честотата и фазата на сигнала, служи за намаляване на електрическото натоварване на контролера на паметта и повишаване на стабилността при използване на голям брой чипове памет, използва се във всички модули с буферирана памет.
    Buffered - буфериран модул. Поради високия общ електрически капацитет на днешните модули памет, тяхното дълго време за „зареждане“ води до голямо количество време, изразходвано за операции по запис. За да се избегне това, някои модули (обикновено 168-пинови DIMM) са оборудвани със специален чип (буфер), който съхранява входящите данни относително бързо, което освобождава контролера. Буферираните DIMM модули обикновено са несъвместими с небуферираните. Модулите с частично буфериране се наричат ​​също „Регистрирани“ („Регистрирани“), а модулите с пълно буфериране (Пълно буфериране) - „FB-DIMM“. В този случай „небуфериран“ се отнася за обикновени модули памет без буферни съоръжения.
    Parity - паритет, модули с паритет, също и паритет. Доста стар принцип за проверка на целостта на данните. Същността на метода е, че за байта данни на етапа на запис се изчислява контролна сума, която се съхранява като специален бит за паритет в отделен чип. Когато данните се четат, контролната сума се изчислява отново и се сравнява с бита за паритет. Ако съвпадат, данните се считат за автентични, в противен случай се генерира съобщение за грешка при паритет (обикновено води до спиране на системата). Очевидните недостатъци на метода включват високата цена на паметта, необходима за съхраняване на допълнителни битове за четност, несигурност срещу двойни грешки (както и фалшиви положителни резултати в случай на грешка в бита за четност), спиране на системата дори при нефундаментална грешка (да речем във видеокадър). В момента не е приложимо.
    SPD е микрочип на DIMM модул памет, който съдържа всички данни за него (по-специално информация за скоростта), необходими за осигуряване на нормална работа. Тези данни се четат на етапа на самотестиране на компютъра, много преди зареждането на операционната система, и ви позволяват да конфигурирате настройките за достъп до паметта, дори ако в системата има едновременно различни модули памет. Някои дънни платки отказват да работят с модули, които нямат SPD чип, но такива модули вече са много редки и са предимно PC-66 модули.
  5. memtest относно проверката може да не разкрие грешки, но проверката в memtest -Test 1 Addresstest, задълбочен тест на ownaddress за откриване на грешки при регистрация на адресиране на паметта - открива такива грешки добре, така че ако имате сини екраниосновно рам ли е или хард диск
  6. Тук вече казаха, използвайте windowsfix.ru

ECC (Error Correct Code - откриване и коригиране на грешки) се използва за коригиране на произволни грешки в паметта, причинени от различни външни фактори, и е подобрена версия на системата за "паритетна проверка".

Физически ECC е реализиран като допълнителен 8-битов чип памет, инсталиран до основните.

По този начин ECC модулите са 72-битови (за разлика от стандартните 64-битови модули).

Някои типове памет (регистрирана, пълна буферирана) са налични само във версия ECC.

Шофьор AMD RadeonСофтуер Adrenalin Edition 19.9.2 По избор

Нова версия на AMD драйвер Софтуер Radeon Adrenalin Edition 19.9.2 Optional подобрява производителността в Borderlands 3 и добавя поддръжка за Radeon Image Sharpening.

Кумулативен актуализация на windows 10 1903 KB4515384 (добавен)

На 10 септември 2019 г. Microsoft пусна кумулативна актуализация за Windows 10 версия 1903 - KB4515384 с редица подобрения на сигурността и корекция на грешка, която се повреди Windows работиТърсене и предизвика високо натоварване на процесора.

Драйвер за игри GeForce 436.30 WHQL

NVIDIA пусна пакета драйвери Game Ready GeForce 436.30 WHQL, който е предназначен за оптимизация в игри: "Gears 5", "Borderlands 3" и "Call of Duty: Modern Warfare", "FIFA 20", "The Surge 2" и „Code Vein“ поправя редица грешки, наблюдавани в предишни версии, и разширява списъка с дисплеи в категорията G-Sync Compatible.

AMD Radeon Software Adrenalin 19.9.1 Edition Driver

Първо септемврийско издание на графика AMD драйвери Radeon Software Adrenalin 19.9.1 Edition е оптимизиран за Gears 5.



Зареждане...
Връх