Процессоры | Системные платы | Видеосистема |
Обзор процессора AMD Athlon "ThunderBird" 700ВведениеБитва за пальму технологического первенства между процессорным гигантом Intel и еще два года назад практически аутсайдером рынка, а теперь игроком вряд ли менее сильным, чем соперник, фирмой AMD, достигла своего апогея. Причем если раньше борьба самоуверенного Intel и страдающего от недостатка производительности своих продуктов AMD велась в пределах правил и на каждый выпад противника Intel отвечал ударом более сильным, а параллельно накапливал миллиарды долларов и десятки компаний-производителей сетевого оборудования, работая на перспективу, то с выходом Athlon ситуация поменялась кардинально. Athlon стал таким мощным прорывом, что позволил за считанные месяцы отобрать треть рынка у такой непоколебимой с виду империи, как Intel. Но на какие жертвы пришлось пойти AMD, чтобы нанести столь сокрушительный удар! Были проданы все направления деятельности, кроме производства Flash-памяти и собственно процессоров, акции неуклонно падали. Со стороны казалось, что последний что-либо представляющий собой конкурент Intel'а находится в предсмертной агонии. Более того, существуют слухи о финансовых вливаниях в AMD со стороны Intel для того, чтобы не стать объектом пристального внимания со стороны распоясавшегося последнее время антимонопольного комитета США. Своим спасением компания AMD обязана тому, кто сегодня переживает свое второе рождение - процессору Athlon, в котором отныне бьется новое сердце с гордым именем - Thunderbird, что означает, ни много, ни мало, Буревестник. Почему появился T-Bird?Процессор с ядром К7 и с именем Athlon дебютировал на рынке в августе 1999 года с частотами 500, 550 и 600 мегагерц, а к марту 2000 года безумная гонка вооружений подняла частоту главного оплота AMD в битве за мировое господство до заветного 1 гигагерца. Однако, после триумфального 700 мегагерцового процессора, чей 512 килобайтный кэш второго уровня работал на максимальной для Athlon частоте в 350 мегагерц. Каждый следующий новый Athlon с повышенной на 50 мегагерц частотой давал все меньший прирост по производительности и становился все большим разочарованием. В чем же причина, спросите Вы? Все просто - частота процессора росла, штурмовались все новые десятки мегагерц, поменялся техпроцесс и даже изменилось кодовое название ядра - изготовленное по .18 микрон техпроцессу ядро получило имя К75, но… Оказалось, что никто и не думает соблюдать традиции первых Athlon, кэш L2 которых работал на 1/2 частоты ядра. Да и невозможно было этого сделать - микросхемы кэш-памяти, стабильно работающие на частоте более 350 мегагерц, найти практически невозможно. Вот так и стал процессор Athlon 700 тем последним из собратьев, чей делитель кэша был равен ?. Дальше - хуже. Сначала появились полувялые 750, 800 и 850 мегагерцовые процессоры с делителем 2/5 и частотами кэша от 300 до 340 МГц. Потом и вовсе колоссы на глиняных ногах - 900, 950 и гигагерцовый монстры несли на своей плате "тормоза" в лице кэша, работающего на 1/3 частоты ядра, что составляло всего от 300 до 333 МГц. В битве со своим главным соперником - Intel Pentium III Coppermine, или, сокращенно CuMine, наметилась нехорошая тенденция. В то время как по частотам процессоры-конкуренты шли, что называется, ноздря в ноздрю, относительная производительность на каждый мегагерц частоты становилась у Athlon все хуже, а CuMine, вдохновленный успехом, начал все дальше уходить в отрыв. Частоты процессоров Pentium III росли в строгом соответствии с частотами интегрированного в ядро 256 килобайтного L2 кэша, работающего на полной частоте процессора, в то время как якорь в лице внешнего кэша процессора Athlon, так и не превысившего частоты в 350 МГц, все сильнее тянул на дно прекрасное ядро К7. Итак, исчерпав свои силы, Athlon таки "утонул" и больше не производится. А на корону самого быстрого х86 процессора теперь претендует его наследник - Thunderbird, или, сокращенно T-Bird, которому современный техпроцесс .18 микрон позволил принять на борт те же 256 килобайт интегрированного в ядро L2 кэша, что и у CuMine. И вот теперь, когда соперники снова находятся в равных условиях, борьба разгорается с новой силой. Становится понятно, что основная разница в двух процессорах AMD - ни что иное, как L2 кэш, который и будет предметом нашего подробного рассмотрения. Что такое кэш?Тем, кто представляет, что такое кэш и зачем он нужен, следующие абзацы можно не читать - они представляют чисто теоретическую информацию и абстрагированы от предмета нашего сегодняшнего рассмотрения. Казалось бы, каждый, кто имеет отношение к компьютеру, знает красивое словосочетание "кэш-память", все постоянно его употребляют, но вот что же это действительно такое и как это работает, знают лишь немногие, и уж практически никто не может внятно объяснить. Хочется надеяться, что хотя бы часть читателей заинтересуется нижеследующим повествованием. Для каждого введенного понятия будет приводиться его англоязычный эквивалент, что поможет Вам провести сопоставление нижеизложенного с оригинальными спецификациями процессоров. Итак, существует так называемый принцип локальности обращений, суть которого состоит в том, что программы не обращаются ко всем своим командам и данным равновероятно, а отдают предпочтение какой-либо части адресного пространства. Также во всех современных компьютерах существует иерархия памяти, т.е. память компьютера состоит из нескольких уровней ( … - L1 кэш - L2 кэш - оперативная память - … ), причем более высокий уровень меньше по объему, быстрее и имеет большую стоимость в пересчете на байт, чем более низкий уровень. Уровни иерархии взаимосвязаны: все данные на одном уровне могут быть также найдены на более низком уровне, и все данные на этом более низком уровне могут быть найдены на следующем нижележащем уровне и так далее. Все это сделано для того, чтобы соотношение цена/производительность Вашего питомца находилась на приемлемом уровне. Минимальная единица информации, которая может либо присутствовать, либо отсутствовать в иерархии, называется строкой (line). Размер строки может быть либо фиксированным, либо переменным. Успешное или неуспешное обращение к более высокому уровню иерархии называются соответственно попаданием (hit), или промахом (miss). Попадание - обращение к объекту в памяти, который найден на более высоком уровне (т.е. в кэше), в то время как промах означает, что он не найден на этом уровне. Существует три основных типа организации кэш-памяти, которые определяются принципом размещения строк в кэше:
(адрес строки кэш-памяти) = (адрес строки основной памяти) mod (число строк в кэш-памяти) Достоинство такой организации заключается в том, что поиск по кэшу производится максимально быстро, но при этом процент попаданий (hit rate) относительно низок, из-за того, что порой невозможно одновременно кэшировать две секции часто используемых данных, т.к. они норовят занять одно и то же место в кэше.
Такая организация позволяет достичь максимально возможного процента попаданий, однако скорость поиска снизится весьма значительно.
Если некоторая строка основной памяти может располагаться на ограниченном множестве мест в кэш-памяти, то кэш называется множественно-ассоциативным (set associative). Обычно множество представляет собой группу из двух или большего числа строк в кэше. Если множество состоит из n строк, то такое размещение называется множественно-ассоциативным с n каналами (n-way set associative). Для размещения строки, прежде всего, необходимо определить множество. Множество определяется младшими разрядами адреса строки (индексом): (адрес множества кэш-памяти) = (адрес строки основной памяти) mod (число множеств в кэш-памяти) Нетрудно догадаться, что первые два варианта организации представляют собой подмножество третьего - кэш-память с прямым отображением есть просто одноканальная множественно-ассоциативная кэш-память, а полностью ассоциативная кэш-память с m строками может быть названа m-канальной множественно-ассоциативной. Осталось два интересных вопроса. Первый вопрос - как найти строку, находящуюся в кэш-памяти? У каждого строки в кэш-памяти имеется адресная метка - тег (tag), указывающий, какую строку в основной памяти данная строка кэш-памяти представляет. Теги обычно одновременно сравниваются с выработанным процессором адресом строки памяти. Кроме того, необходим способ определения того, что строка кэш-памяти содержит достоверную или пригодную для использования информацию - тег имеет бит достоверности (Invalid). Адресация множественно-ассоциативной кэш-памяти осуществляется путем деления адреса, поступающего из процессора, на три части: поле смещения используется для выбора байта внутри строки кэш-памяти, поле индекса определяет номер множества, а поле тега используется для сравнения. Если общий размер кэш-памяти зафиксировать, то увеличение степени ассоциативности приводит к увеличению количества строк во множестве, при этом уменьшается размер индекса и увеличивается размер тега. Второй вопрос, какая строка кэша при промахе подлежит замене? Выбором строки, подлежащей замене, занимается контроллер кэш-памяти. Если кэш с прямым отображением, то на попадание проверяется всего одна строка, и именно она подлежит замене. При множественно-ассоциативной организации кэш-памяти имеются несколько строк, из которых надо выбрать кандидата на замену в случае промаха. Чтобы уменьшить вероятность выбрасывания информации, которая скоро может потребоваться, все обращения к строкам фиксируются. Заменяется та строка, которая не использовалась дольше всех (LRU - Least-Recently Used). И напоследок разъясним еще два термина, относящихся к кэш-памяти - write-back cache и write-through cache. Когда выполняется запись в кэш-память, имеются две базовые возможности:
Разумеется, более медленный write-through кэш сейчас практически не используется. Подробное описание технологии LRU (LRU - Least-Recently Used), полное описание битов MESI (Modify/Exclusive/Shared/Invalid), и еще множество информации для тех, кому мало - на страничке http://developer.intel.com/design/intarch/techinfo/Pentium/operatn.htm Вот теперь, имея достаточное представление о кэш-памяти, можно переходить непосредственно к рассмотрению нашего героя. Встречайте - AMD Athlon with… (короче, Thunderbird)
Новый процессор от AMD называется почти также как и раньше - "AMD Athlon™ Processor with performance-enhancing full-speed cache memory", что означает "с увеличивающей производительность полно-скоростной кэш-памятью", а T-Bird - это всего лишь название ядра.
Поэтому, придя покупать процессор, не стоит пугаться, что все они называются Athlon. Мы еще расскажем, как отыскать заветную птицу - Буревестник. Выпускается новый процессор AMD Athlon Thunderbird c частотами 750, 800, 850, 900, 950 и 1000 МГц. Однако есть и более медленные версии для OEM, что подтверждает наш экземпляр - его частота 700 мегагерц. Процессоры с частотами 850 МГц и ниже рассчитаны на напряжение питания ядра 1,70 В, а 900 МГц и выше - 1,75 В. Интегрированный в ядро 256 килобайтный L2 кэш увеличивает площадь .18 микрон ядра примерно на 20%. Таким образом, площадь ядра T-Bird составляет 120 кв. мм, тогда как .18 микрон ядро К75 - 102 кв. мм, а .25 микрон ядро К7 - 184 кв. мм. Для сравнения, согласно слухам, ядро Intel Pentium 4 Willamette будет занимать 170 кв. миллиметров. С приходом в ядро T-Bird 256 килобайт кэша количество транзисторов в нем возросло на 15 миллионов и теперь составляет 37 миллионов. Для сравнения, ядро PIII Katmai имеет 9,5 миллионов транзисторов при площади 106 кв. мм, а ядро PIII CuMine - 28 миллионов и площадь 128 кв. миллиметров. Все производимые сегодня процессоры, как от Intel, так и от AMD, имеют интегрированный в ядро L2 кэш. Вот и настало время поговорить о тех преимуществах, которые он предоставляет. Их три:
Подводя итог, отметим, что интегрированный в ядро L2 кэш позволяет одновременно повысить производительность и снизить стоимость системы. "Исключительный" кэш ThunderbirdТрадиционная "включительная" архитектура построения кэш-памяти (inclusive cache) подразумевает, что если строка содержится в L1 кэше, то она также дублируется и в L2 кэше, ну и, естественно, в основной памяти, т.е. каждая память более низкого уровня содержит в себе все содержимое памяти более высокого уровня. Такая архитектура имеет один недостаток, который мы рассмотрим на примере процессора Intel Coppermine, построенного с ее применением. Процессор CuMine имеет 32 килобайта кэша L1 (по 16 килобайт на команды и данные) и 256 килобайт кэша L2, но так как L2 кэш содержит копию L1 кэша, то эффективный размер L2 кэша оказывается равным 256 - 32 = 224 килобайта. А представляете, что случится с эффективным размером L2 кэша процессора от AMD, если L1 кэш имеет размер не 32, как у CuMine, а 128 килобайт (по 64 килобайта на команды и данные) - он снизится на 50%!
Естественно, инженеры AMD не могли потратить такое количество драгоценных транзисторов впустую, и предложили прекрасное решение - "исключительный" кэш (exclusive cache). Таким образом, в T-Bird кэш L2 не содержит копии кэша L1, а дублирует только write-back строки, модифицированные и ожидающие записи в основную память.
Таким образом, заявления AMD об эффективном объеме кэша в 384 килобайта на ядре T-Bird не являются рекламной фальсификацией. Все именно так и обстоит, другое дело, не сделало ли именно это невозможным увеличение шины между процессором и кэшем L2?! Вероятнее всего, одинаковая ширина шины L2 кэша у T-Bird и обычного Athlon не позволит нашему герою обогнать своего предшественника так, как когда-то CuMine опередил Katmai. Скоро мы это проверим. Отметим также, что AMD использует в своем новом процессоре T-Bird 16-канальный множественно-ассоциативный L2 кэш, а Intel в CuMine - 8-канальный, что гарантирует больший процент попаданий у T-Bird. Для сравнения - кэш L2 у старого Athlon'а всего 2-х канальный. Socket-A или Slot-A?Только успела пропасть насущная необходимость в процессорной плате, AMD в очередной раз удивила всех новым гнездом с умопомрачительным количеством дырочек - их целых 462 штуки. И назвала его крайне оригинально - Socket-462, хотя в простонародье его чаще именуют Socket-A . Причем, хотя дырочек стало намного больше, чем, например, в гнезде под CuMine, по внешним размерам гнездо унифицировано с более ранними Socket-7 и Socket-370, что позволяет использовать те же кулеры, что и в более ранних системах. А пустого места в центре гнезда остается все меньше, посмотрим, чей процессор первым разопрет за рамки старого доброго Socket'а. Что касается T-Bird, практически все процессоры будут выпускаться в Socket варианте, и только поддержка крупных ОЕМ-заказчиков вынуждает производить Slot-версии. Но, поскольку в официальной продаже серьезный дефицит плат под Socket-A, слотовые T-Bird'ы еще достаточно долго будут пользоваться спросом и на Retail-рынке. Тут покупателя подстерегает другая беда. Гарантированно нормальной работой со Slot-A T-Bird'ом может похвастаться только чипсет AMD750, а вот KX133 от VIA - не пара новому Буревестнику. Некоторые западные сайты сообщают, что проблемы возникают только при использовании процессоров с частотой свыше 800 МГц, некоторые производители, например ASUS, сообщают, что в своей плате К7V эта проблема и вовсе решена полностью. Тем не менее, счастливым обладателям материнских плат на KX133 будет целесообразно воздержаться от покупки T-Bird'а, пока ситуация окончательно не прояснится. Маркировка - как выбрать T-Bird?Осталось только понять, как отличить T-Bird и обычный Athlon под Slot-A друг от друга, а также что написано на процессоре T-Bird, предназначенном для Socket-A. Рассмотрим примеры, приведенные в официальной документации на Athlon, которые наглядно расшифровывают OPN (ordering part number), нанесенные на процессорах. Кстати, во всех документах процессор Athlon с ядром K7 называется Model 1, с ядром K75 - Model 2, а, собственно, T-Bird - Model 4. Пропустим поросшую мхом Мodel 1, тем более что она уже почти не встречается. Начнем с Model 2 - Athlon .18 микрон . AMD-K7 750MTR52B
Теперь - Model 4 - T-Bird. AMD-A 0850MPR24B
И, наконец, T-Bird под Socket-462 - у него маркировка нанесена прямо на кристалле, для чтения рекомендуются очки с большими диоптриями: A 0850APT3B
Интересный момент - если для процессоров под Socket предусмотрена разная температура ядра, то значит, процессоры с индексом Q должны греться меньше всего, следовательно, - лучше разгоняться!? Но, стоп! Разгон - тема следующей статьи, в которой, также, будет подробно рассмотрен аспект работы T-Bird под Slot-A в материнских платах на KX133. Настало время разобраться с Athlon'ами, попавшими на наш операционный стол. Кто есть кто в нашей лаборатории. Тестирование
Предметом тестирования стал AMD Athlon Thunderbird с частотой 700 МГц в исполнении Slot 1 c маркировкой A 0700MPR24B. Разобраться в том, что все это значит, сможет каждый, кто догадается заглянуть чуть-чуть назад.
В качестве конкурентов были выбраны:
Также потребовалось следующее оборудование:
И программное обеспечение:
Для процессоров Intel использовались самые распространенные на сегодняшний день платформы, чтобы обладатели и плат на BX, и VIA 694X не чувствовали себя обделенными и могли сравнить новый процессор с похожей на свою конфигурацией. Из особенностей настроек тестовых платформ стоит отметить, что тестирование производилось с включенным режимом AGP2x для Intel BX и AMD 750, и включенным AGP4x для VIA 694X. На каждой из диаграмм будет представлена разница между показателями процессоров в процентах, причем показатели T-Bird приняты за единицу. Отрицательный процент показывает проигрыш данного процессора T-Bird'у, а положительный, соответственно, выигрыш. Для объективной оценки процессора CuMine 733 МГц, рассчитанного на 133 шину, поможет следующее процентное соотношение (733/700 = 1,047 = 104,7%) - т.е. его можно считать быстрее в расчете на один мегагерц частоты только в случае, если он обогнал T-Bird больше чем на 4,7%.
Посмотрим, как ведут себя процессоры в синтетических тестах:
Тест CPUMark из пакета WinBench анализирует производительность целочисленной части процессоров, при этом интенсивно загружая шину данных. Такой вывод можно сделать, сравнивая производительность одного и того же процессора - Intel CuMine - на разных чипсетах. Максимальную производительность продемонстрировал наш новый герой - T-Bird, обогнавший даже CuMine, работающий на частоте, большей на 33 МГц.
Тест FPUMark анализирует производительность математического сопроцессора, при этом, не затрагивая остальных компонентов системы, в том числе, не используя L2 кэш. Диаграмма демонстрирует, что ядро процессора Athlon не изменилось, а некогда слабое место AMD - операции с плавающей запятой - теперь его сильная сторона. Нельзя сказать, что выигрыш Athlon'ов у CuMine'ов весьма значителен, но, тем не менее, и 3 с половиной процента - весьма неплохой результат.
Бенчмарк CPU 3D Marks, входящий в состав 3D Mark 2000, демонстрирует производительность процессоров при рендеринге типовых 3-х мерных сцен в играх. Тест производился с оптимизацией под Hardware T&L карты GeForce2 GTS, что давало возможность оценить производительность нового процессора в тандеме с самым мощным на сегодняшний день ускорителем. Оба Athlona продемонстрировали просто потрясающую производительность.
Теоретически получается, что новый Athlon быстрее не только своего предшественника, но также и своего главного конкурента - CuMine. Посмотрим, подтвердит ли это Quake 3 - самый правдивый игровой бенчмарк.
Снова видим достойные показатели у нашего претендента - пусть практика не так впечатляет, как теория, но все равно лидерство - за T-Bird.
И вот самая главная сенсация - реванш AGP4x! Платформа на VIA 694x выглядит более чем достойно, демонстрируя неоспоримую важность режима AGP4x для игр в высоких разрешениях. Однако T-Bird по силам и здесь потягаться с лидерами, хотя максимум что можно выжать из AMD750 - AGP2x, как и у ВХ. Итог - чистая победа, в которой впечатлил не столько отрыв гениального творения AMD от конкурентов, сколько стабильность показанных результатов - лидерство во всех тестах. Заключение - А стоит ли покупать?Несомненно, у AMD получился прекрасный процессор. Его стоит купить. Поговорим о тех, кто растаял в пользу изделий AMD. Если вы уже являетесь счастливым обладателем Athlon'а, то не стоит рвать его из корпуса, топтать и мчаться за T-Bird'ом - старичок сполна отрабатывает вложенные в него деньги и пока держится молодцом. А разница в производительности в 5 - 10 процентов - поверьте, это пустое… Копите лучше на GTS! А вот тем, для кого старый компьютер превратился из игрового снаряда в предмет насмешек друзей, выбирать между старым Athlon'ом и T-Bird'ом не приходится - новый процессор лучше по всем аспектам. Еще один фактор в пользу T-Bird'а - у него не так сложно сменить коэффициент умножения, а с упрятанным в ядро кэшем он сполна вознаградит своего хозяина хорошим разгоном. Другое дело, что, возможно, следует подождать, пока появятся в продаже Athlon'ы под Socket-A и материнские платы на вылизанном чипсете KT133, который почти в точности повторяет KX133, изначально рассчитан под T-Bird, и поддерживает AGP4x, которого так не хватает, в общем-то, достаточно хорошему AMD750. А если совсем невмоготу, выбор пал на процессор от AMD, а купюры так и рвутся из карманов в руки нового хозяина - отличным выбором будет плата на AMD750 и T-Bird под Slot-A. Сложнее убедить приверженцев Intel. Если Вы владелец Pentium III с ядром CuMine, да к тому же стабильно работающего на нештатных частотах :), то незачем и помышлять об AMD. А тех, кто решил поменять свой более старый, чем CuMine, процессор на что-то новое, AMD убеждает ценой - T-Bird'ы стоят на 10 - 30 процентов дешевле соперников. Комментарии излишни, а доводы лагеря под гордым стягом "Intel Inside" о том, что "нормальную мать под Athlon не купишь, а если купишь, то за $200" - уже несостоятельны. Пример - обе тестовые материнские платы от ASUS - K7M и CUBX - стоят одинаково - примерно по $140, а стабильность работы и предоставляемые возможности практически идентичны. В результате привлекательность системы на базе T-Bird, выигрывающей по производительности и стоящей меньше, становится все выше.
"Буря, скоро грянет буря…" … и ураган покупательского спроса будет сметать с прилавков горячие пирожки этого лета - Duron'ы и Thunderbird'ы.
Отдельное спасибо за помощь компании "NT" Александр Полувялов ([email protected])
Опубликовано -- 6 июля 2000 г. |
Комментарии? Поправки? Дополнения? [email protected] |
Процессоры | Системные платы | Видеосистема |
Copyright (c) by iXBT.1997-2001. Produced by iXBT. Дизайн (с) 1998 студия РусАрт |