Athlon XP 2800+: 333МГц FSB и nForce 2

Johan De Gelas, http://www.aceshardware.com/

Введение

Новая модификация, как и Athlon 2600+, имеет увеличенную габаритную высоту. С принудительной вентиляцией обычный Athlon XP 2400+ или 2600+ разгоняется до 2,3 – 2,4 ГГц. AMD использовала это пространство, чтобы представить сегодня Athlon XP 2400+ (2.25 ГГц) и 2700+ (2.16 ГГц).

К сожалению, это не означает, что вы сможете купить самый быстрый процессор AMD уже через пару недель. В ноябре, 2700+ будет доступен только для OEM и в декабре новейший AMD процессор дойдет до обывателя. Athlon XP 2800+ будет доступен в малом количестве в конце 2002, и в тоже время AMD планирует широкое распространение в начале 2003. Это, конечно, смягчает ситуацию…


AMD Athlon XP 2800+: Скачок скорости “Thoroughbred B”

Последнее время Athlon XP 2600+ сравнивают c Pentium 4 2,53 ГГц. Несомненно, что Athlon XP 2600+ достиг рейтинга “2600”, но были сомнения относительно рейтинга “+”. Теперь, самый быстрый Athlon будет сравнен с более продвинутым процессором Intel, а именно Pentium 4 2,8 ГГц.

AMD, понимает что простое увеличение скорости не сделает Athlon XP 2800+ конкурентоспособным. Часть новых процессоров Athlon 2800+ и 2700+ работают с шиной процессора 166 МГц DDR (333 МГц). И AMD указывает, что новый чипсет Force 2 сделает производительность Athlon еще выше.

Глубже взглянем на баталию между Pentium 4 и Athlon. И для начала исследуем, как сравнивают платформы Athlon и Pentium 4.

Состязание процессоров

Хотя тема «Intel Prescott против AMD Hammer» и обсуждается, но Athlon и Pentium 4 еще минимум год будут основными актерами в нынешней войне процессоров AMD и Intel. Скорости шины процессора и памяти, а также оптимизация SSE-2 существенно влияют на эту баталию.

Этот обзор не будет полон без некоторого анализа этих важных факторов. И мы нашли прекрасный инструмент для такого анализа: ScienceMark 2.0. «Лучшие вещи в жизни бесплатны», и ScienceMark 2.0 лучший тому пример. MemBench позволяет определить время ожидания и пропускную способность для каждой платформы.

Athlon XP 2800+ тестировали, во-первых, на “нормальной” KT333 платформе с множителем 17, шиной процессора 133 МГц DDR (266 МГц), памятью 166 МГц DDR (333 МГц), CAS – 2, “RAS to CAS” – 3, “Precharge” – 3. Вторая KT333 платформа была ASUS A7V333 с шиной процессора 166МГц (333МГц) и множителем – 13,5.

Процессор Тип DRAM FSB Частота DRAM
(МГц)
Задержка
64-байтный шаг
(циклы)
Задержка
128-байтный шаг
(циклы)
Пропускная
способность
(Мб/с)
Athlon 2.26 ГГц - KT333 PC2700 266 333 181 246 1926
Athlon 2,25 ГГц - KT333 PC2700 333 333 185 250 2202
Athlon 2,25 ГГц - nForce PC2700 333 333 160 218 2425
Pentium 4 2,8 ГГц - i845G PC2700 533 333 78 252 2315
Pentium 4 2,8 ГГц - i850E RIMM4200 533 1066 73 318 2803

С чего начать? В этой таблице находится большой объем информации. Давайте начнем со сравнения 266 МГц и 333 МГц шин процессора.

Было много сообщений о том, что Athlon не сильно выиграл от увеличения скорости шины с 266МГц до 333МГц. MemBench дает точное объяснение этому факту. Во-первых, сравним время задержки KT333 при 64-байтной шаге. Все установки BIOS были одинаковыми, кроме скорости шины и связанного с ней множителя. Можно ожидать, что при всех остальных равных условиях, Athlon с шиной 166 МГц уменьшит задержку на 25%, но процессор на практике только увеличивает её! Это показывает, что в ASUS KT333 для увеличения стабильности увеличено время ожидания памяти. При этом пропускная способность увеличена меньше ожидаемого, только на 14%.

Что происходит с “реальной” производительностью? Многие программы или не получат или получат очень малый прирост производительности. Задержка, а не пропускная способность, наиболее важна для этого. Давайте разберемся более детально.

Выбор с упреждением … AMD еще работает?

Для лучшего понимания того, что происходит, вы должны понимать разницу между задержкой при 64-байтном и 128-байтном шагах. Когда идет выборка данных и инструкций 64-байтными шагами или точнее кэшируется строка памяти, выборка информации высокоорганизованна. В лучшем случае это нужно хорошо написанному оптимальному коду, работающему с памятью (движок Quake 3, Kribi и др.). Это очень легко позволит «выборщику» выдать и получить информацию до того как она понадобится. На самом деле такая выборка эффективна только для простых структур. Например, в массивах, можно параллельно ссылаться на разные элементы.

Однако значение задержки при 128-байтном или большем шаге показывает работу процессора при остановке «выборщика». Иногда программист использует структуры данных связанные с другими структурами. И вы можете получить цепочку связанных данных («Указатель на указатель объекта»), что (почти) не позволит при выборке угадать следующий кусок данных.

Давайте, сравним Athlon и Pentium 4. Pentium 4 3,06 ГГц скоро уже будет доступен, и вероятно в больших количествах, чем Athlon 2700+. Intel уже представил процессор на 4,7 ГГц с экзотическим охлаждением. Почему я об этом говорю? Потому что может показаться, из-за безумия с «ГГц», что архитектура «демонов скорости» идеальна, позволяя достигать максимальных частот в ущерб количеству операций за такт (IPC). И она предпочтительней более «Разумных» решений с большим IPC. Если Pentium 4 и выиграет битву процессоров, то конечно не только из-за больших скоростей.

Кроме ошибок при прогнозе переходов, «демоны скорости» имеют проблемы с ожиданием памяти. Чтобы понять это, давайте забудем о «выборщиках» и допустим, что Athlon и Pentium 4 работают на одной платформе и материнской плате, как это было с процессорами Intel и AMD в 1997. Далее предположим, что Athlon 2800+ выполняет программы из кэш также быстро, как и 2,8 ГГц Pentium 4. Тогда Athlon имеет преимущество, так как 2,25 ГГц ядро работает только в 6,75 раз быстрее памяти (333 МГц). Ядро Pentium 4 работает в 8,4 раза быстрее, чем память и поэтому время ожидания процессора должно быть теоретически на 25% больше. В связи с этим, Athlon должен иметь меньшее время ожидания памяти.

Но что мы видим на самом деле?

Процессор Тип DRAM FSB Частота DRAM
(МГц)
Задержка
64-байтный шаг
Задержка
128-байтный шаг
Пропускная
способность
Athlon 2.25 ГГц - KT333 PC2700 333 333 185 250 2202
Pentium 4 2,8 ГГц - i845G PC2700 533 333 78 252 2315

Реальность противоречит нашей теории. Задержка при 128-байтном шаге показывает, что лучшая поддержка чипсета и более быстрая шина (533 МГц) Pentium 4 компенсирует преимущество Athlon в разнице скоростей между процессором и памятью. И у «интеллектуального» Athlon нет преимущества во времени ожидания.

При 64-байтном шаге и того хуже. Измерения показывают, что «выборщик» Pentium 4 гораздо лучше, чем у Athlon XP. Вспомним что для одинакового уменьшения задержки, «выборщик» Pentium 4 должен быть или «умнее», то есть лучше опознавать области необходимой памяти, или он должен быть быстрее, чем у Athlon. Значения задержки Pentium 4 отличаются от Athlon. Они в два раза лучше!

AMD нужно еще работать над «выборщиком», если она хочет сравняться с Intel, которая тоже хочет уменьшить задержки в том коде, где «выборщик» не работает. Теоретическая оценка Intel дает скачок производительности в небольшом коде от 7 до 45%! Из-за заурядного «выборщика» в Athlon XP можно думать, что у Hammer он будет усовершенствован. Но вернемся к Athlon XP 2800+…

Другими словами, Athlon не имеет преимуществ на более скоростных шинах процессора, потому что:

Nvidia nForce2 против VIA KT333/KT400

Приятным сюрпризом было то, что плата ASUS A7V333 (KT333) может быть легко обновлена с Athlon XP 2800+. Просто обновив BIOS до версии 1.013, подтвердилась хорошая разработка платы ASUS и поддержка BIOS.


ASUS A7V333: нет проблем обновить шину процессора до 166 ГГц DDR

Плата была неизменна во всех тестах. Но как вы увидите ниже, производительность практически не улучшилась.

Да, комплект обзоров, присланный AMD, пришел с прототипом платы ASUS nForce 2. Отметим слово «прототип». Иногда приятно быть обозревателем «железа» из-за доступа к новейшему оборудованию. Но бывает, что сидишь перед экраном с красными глазами и головной болью кучу времени, потому что некоторые прототипы оборудования ведут себя «нестабильно» и нелогично. Прототип платы был довольно упрям и ненадежен при нагрузках на «железо» во многих играх, особенно при использовании звука. Поэтому вы не найдете контрольных тестов звука на платформе nForce 2.

И Nvidia и ASUS уверяли много раз, что настоящая серийная модель, которая будет доступна публике в конце октября, будет работать идеально и стабильно на все 100%. Nvidia сообщила, что AMD послала нам «ранний прототип» платы, «которые возможно трудно» заставить надежно работать. Так почему же AMD послал эту плату, не смотря на ее незавершенность? Взглянув на результаты ScienceMark 2.0, понимаешь, что контроллер памяти nForce 2 просто быстрее работает.

Процессор Тип DRAM FSB Частота DRAM
(МГц)
Задержка
64-байтный шаг
Задержка
128-байтный шаг
Пропускная
способность
Athlon 2,66 ГГц - KT333 PC2700 266 333 181 246 1926
Athlon 2,25 ГГц - KT333 PC2700 333 333 185 250 2202
Athlon 2,25 ГГц - nForce PC2700 333 333 160 218 2425

У чипсета nForce 2 пропускная способность на 10% лучше и что важнее время ожидания ниже на 16%, выделяя его при сравнении с KT333 166 ГГц. Хотя KT333 на 166 ГГц не много быстрее чем на 133 ГГц, далее вы увидите, что nForce2 в сочетании с более быстрой шиной процессора обладает превосходной производительностью.

Плате MSI KT400 для работы с Athlon XP 2800+ требуется обновлении BIOS. Так как это обновление BIOS еще не доступно то и сравнение KT400 и nForce 2 пока невозможно. По некоторым сведениям KT400 лишь немного уменьшает время ожидания.

Так или иначе, отложим пока обзор nForce 2на потом, так как невозможно выносить суждения по нестабильному прототипу. Ведь возможно, что задержки в BIOS могут оказаться менее агрессивными для достижения промышленного качества стабильности. Но если промышленный образец платы будет обладать текущей производительностью и будет более стабилен, то NVIDIA nForce 2 имеет большое будущее.

Чипсет nForce 2 очень похож на nForce. Ниже показаны новшества в чипсете NVIDIA:

Материнские платы на основе nForce 2 будут выпускать ABIT, ASUS, Chaintech EPOX, MSI и Leadtek.

Тестируемые конфигурации

Все системы тестировались с драйверами NVIDIA Detonator 30.82. Экран имел разрешение 1024х768х32 с частотой 85 Гц. Вертикальная синхронизация была выключена.

Использовались Corsair XMS 3200 CAS 2 DDR (DDR400) для максимально возможного разгона и стабильности. Модули XMS3200 работали на 166 МГц DDR (333 МГц) и настроены для работы во всех системах с CAS задержкой – 2.

Системы

Athlon XP 2000+, Athlon XP 2200+, Athlon XP 2600+, Athlon XP 2800+

Pentium 4 (Northwood) 2 ГГц (400 МГц FSB), 2.4 ГГц (400 МГц FSB), 2.4 ГГц (533 МГц FSB), 2.53 ГГц (533 МГц FSB) и 2.8 ГГц

Общие компоненты

Программное обеспечение

Благодарности людям за их поддержку и важный вклад в этот обзор:

Игровые тесты

Перед разбором тестов поясним некоторые вещи:

Первый тест - Comanche 4, симулятор боевого вертолета.

Comanche 4 (800x600x32, звук включен)
Процессор FPS
P4 2,0 ГГц 38,8
 
Athlon XP 2200+ 41,4
 
P4 2,4 ГГц 43,6
 
P4 2,4 ГГц - 533 FSB 47,3
 
Athlon XP 2600+ 47,4
 
Athlon XP 2800+ KT333 (266) 48,0
 
Athlon XP 2800+ KT333 48,4
 
P4 2,53 ГГц 49,9
 
P4 2,8 ГГц 54,8
 
P4 2,8 ГГц i850E - PC1066 57,7
 

Comanche содержит SSE-2 оптимизацию, но хорошие показатели Pentium 4 достигаются малыми задержками «выбранной» памяти. Платформа nForce 2 будет работать только с отключенным звуком.

Comanche 4 (800x600x32, звук отключен)
Процессор FPS
Athlon XP 2800+ KT333 (266) 49,9
 
Athlon XP 2800+ KT333 50,1
 
P4 2,53 ГГц 51,5
 
Athlon XP 2800+ nForce2 52,8
 
P4 2,8 ГГц 55,5
 
P4 2,8 ГГц i850E - PC1066 60,1
 

Результаты теста подтверждают, что SSE-2 не единственная причина низкой производительности Athlon по сравнению с Pentium 4. Уменьшение времени задержки nForce 2 на 16% делают эту платформу на 5% быстрее KT333. В результате производительность Athlon XP 2800+ лучше P4 2,6 ГГц с DDR памятью. Но Athlon не имеет шансов перед P4 с Rambus 1066 МГц, который лидирует в этом тесте.

Обычно для тестирования используется также NASCAR 2002. Однако было обнаружено, что один из пяти тестов для платформы Pentium 4 выдает очень низкие результаты и эта проблема еще исследуется, чтобы сделать тест более воспроизводимым. Работа идет ...

Но не беспокойтесь, Pentium 4 без сомнений лучший процессор для NASCAR 2002, оптимизированной для SSE-2.

Другие игровые тесты

В противоположность гонкам NASCAR результаты C&C Renegade более воспроизводим. Как наиболее популярная «стрелялка» C&C может быть достойным тестовым инструментом, даже притом, что нагрузка в нем больше на видеокарту, чем на процессор (сравнивая с Comanche).

C&C Renegade (1024x768)
Процессор Результат FPS
P4 2,0 ГГц - 400 FSB Средний 86,3
 
Минимум 41,0
 
P4 2,4 ГГц - 400 FSB Средний 92,8
 
Минимум 40,0
 
P4 2,4 ГГц - 533 FSB Средний 99,0
 
Минимум 41,0
 
P4 2,53 ГГц Средний 104,9
 
Минимум 40,0
 
Athlon 2100+ Средний 106,0
 
Минимум 61,0
 
P4 2,8 ГГц Средний 107,0
 
Минимум 42,0
 
P4 2,8 ГГц - PC1066 Средний 111,4
 
Минимум 42,0
 
Athlon XP 2200+ Средний 112,9
 
Минимум 65,0
 
Athlon XP 2800+ KT333 Средний 119,4
 
Минимум 73,0
 
Athlon XP 2600+ Средний 120,4
 
Минимум 71,0
 

На этот раз даже RIMM4200 не спасла Pentium 4, и Athlon лидирует. Похоже, что Athlon заставляет Geforce 4 Ti4400 работать на пределе, даже Athlon XP 2800+ не может преодолеть значение в 120 кадр/с. К сожалению, не удалось протестировать платформу nForce 2, так как она зависала.

Jedi Knight 2 1.02 (640x480, звук включен)
Процессор FPS
P4 2,0 ГГц - 400 FSB 77,2
 
P4 2,4 ГГц - 400 FSB 84,71
 
Athlon XP 2200+ 88,7
 
Athlon XP 2600+ 93,5
 
P4 2,4 ГГц - 533 FSB 94,2
 
Athlon XP 2800+ KT333 (266) 95,1
 
Athlon XP 2800+ KT333 95,1
 
P4 2,53 ГГц 97,9
 
P4 2,8 ГГц - DDR 333 103,8
 
P4 2,8 ГГц i850E - PC1066 114,3
 

Pentium 4 уже хорошо зарекомендовал себя с Quake 3. Многие отмечали, что это произошло благодаря отличному «выборщику» и хорошо написанному коду, что было в последствии подтверждено. Пропускная способность не является главной причиной хорошей производительности Pentium 4 на движке Quake 3. Действительная причина выяснится в следующем тесте (с отключенным звуком), включающем платформу nForce 2.

Jedi Knight 2 1.02 (640x480, звук выключен)
Процессор FPS
Athlon XP 2800+ KT333 114,9
 
Athlon XP 2800+ KT333 (266) 115.9
 
P4 2,8 ГГц 127,6
 
Athlon XP 2800+ nForce2 132,5
 
P4 2,8 ГГц i850E - PC1066 137,2
 

Движок Quake 3 основан на упорядоченном доступе к памяти. Последовательности данных и кода находятся в смежных адресах. Чтобы понять, почему задержка при «выборе» в 64-байтном шаге кажется очень важным фактором для движка Quake 3, сравним тест Jedi Knight со значениями MemBench. Давайте снова взглянем на них.

Процессор Тип DRAM FSB Частота DRAM
(МГц)
Задержка
64-байтный шаг
(циклы)
Задержка
128-байтный шаг
(циклы)
Пропускная
способность
(Мб/с)
Athlon 2.26 ГГц - KT333 PC2700 266 333 181 246 1926
Athlon 2,25 ГГц - KT333 PC2700 333 333 185 250 2202
Athlon 2,25 ГГц - nForce PC2700 333 333 160 218 2425
Pentium 4 2,8 ГГц - i845G PC2700 533 333 78 252 2315
Pentium 4 2,8 GHz - i850E RIMM4200 533 1066 73 318 2803

Хотя KT333 166 МГц предоставляет большую пропускную способность, производительность KT333 133 МГц чуть лучше или точнее такая же в пределах ошибки. Чуть большая частота (2266 МГц против 2251 МГц) и несколько меньшая задержка делает 133 МГц шину препятствием теоретическим рассуждениям. Это показывает что пропускная способность не главное для движка Quake 3.

В то же время nForce 2 просто вне конкуренции с KT333 с увеличенной производительности на 15,4%. Это разность в производительности идентична измеренной в MemBench разности времен задержки. Поэтому можно считать, что 10% преимущество в пропускной способности по сравнению со временем задержки дает меньший вклад в производительность.

Это подтверждает то, что P4 с 1066 МГц RDRAM лишь на 7% быстрее. Пропускная способность PC1066 имеет 20% преимущество перед DDR333, но по времени ожидания только на 6,8% лучше.

1066 МГц RDRAM также демонстрирует хорошую организацию памяти движка Quake 3. Если бы память была хаотична, то производительность RDRAM была бы ниже DDR333.

Тесты с RPG

RPG игры довольно популярны и потому здесь приводится тест на Dungeon Siege от Криса Тейлора.

Dungeon Siege (1024x768)
Процессор FPS
P4 2,0 ГГц - 400 FSB 51,7
 
P4 2б4 ГГц - 400 FSB 55,8
 
P4 2,4 ГГц - 533 FSB 61,1
 
P4 2,53 ГГц 62,7
 
Athlon XP 2200+ 63,0
 
P4 2,8 ГГц 66,5
 
Athlon XP 2600+ 66,6
 
Athlon XP 2800+ KT333 67,0
 
P4 2,8 ГГц i850E - PC1066 68,0
 

Пока P4 на высоте, но есть подозрение, что nForce 2 может выдвинуть Athlon 2800+ перед Intel. Перед тем как попробовать RTS, взглянем на поведение процессоров в смешанной RPG-RTS игре – Warcraft III.


Одна из сцен игры использованная в тесте

Warcraft III (1024x768x32)
Процессор FPS
P4 2,8 ГГц 64,8
 
P4 2,8 ГГц i850E - PC1066 67,2
 
Athlon XP 2800+ KT333 69,9
 

Кажется, жанр RPG предпочитает Athlon XP. Пока ошибка измерения в этом тесте очень высока (+/- 1,5 кадр/с) Athlon XP 2800+ работает лучше.

Стратегии

Далее попробуем RTS игру. Warrior Kings возможно одна из самых продвинутых RTS на сегодня, так как имеет 3D ландшафт и уровень деталей (LOD), масштабируемый относительно размера объекта на экране.

Warrior Kings
Процессор Разрешение FPS
P4 2,0 ГГц - 400 FSB 1024x768 11.4
 
1600x1200 10,9
 
P4 2,4 ГГц - 400 FSB 1024x768 12,65
 
1600x1200 11,4
 
P4 2,4 ГГц - 533 FSB 1024x768 13,2
 
1600x1200 11,8
 
P4 2,53 ГГц 1024x768 13,8
 
1600x1200 12,16
 
P4 2,8 ГГц 1024x768 14,3
 
1600x1200 13,9
 
Athlon XP 2200+ 1024x768 17,3
 
1600x1200 16,8
 
Athlon XP 2600+ 1024x768 19,5
 
1600x1200 18,9
 
Athlon XP 2800+ KT333 1024x768 19,5
 
1600x1200 19,0
 

Athlon остается лучшим для игроков Warrior Kings. И хотя патч для SSE-2 пока не готов, вряд ли он поможет догнать Athlon.

Сетевые игры

Будучи одними из самых популярных сетевых игр, тестировались Unreal Tournament 4.36 и демка Demoace2.

Unreal Tournament 4.36 (1024x768x32)
Процессор FPS
P4 2,0 ГГц 88,5
 
P4 2,4 ГГц 99,9
 
Athlon XP 2200+ 101,0
 
P4 2,4 ГГц - 533 FSB 102,0
 
P4 2,4 ГГц - 533 FSB 104,9
 
P4 2,53 ГГц 106,4
 
Athlon XP 2600+ 107,5
 
P4 2,8 ГГц 111,2
 
Athlon XP 2800+ KT333 114,2
 
P4 2,8 ГГц i850E - PC1066 120,7
 

Pentium 4 2,8 ГГц с 1066 МГц RDRAM уверено лидирует во многих тестах. Основываясь на предыдущем опыте с nForce 2, можно утверждать что Athlon XP на этой платформе должен показывать близкие результаты.

3DSMax

Тест был на архитектурной сцене SPECapc 3DS MAX R4.2. В тесте движущаяся камера показывает сложное здание, виртуальный тур масштабируемой модели. Это сложная сцена содержит не меньше 600.000 многоугольников и 7 источников света. Включен показ лучей и туман. От 20 до 22 кадров 500х300 представлены в буфере памяти.

3DSMax 4.26 Architecture (Секунды: меньше - лучше)
Процессор Секунды
P4 2,0 ГГц 1578
 
Athlon XP 2200+ 1370
 
P4 2,4 ГГц 1320
 
P4 2,4 ГГц 1307
 
P4 2,53 ГГц 1260
 
Athlon XP 2600+ 1211
 
Athlon XP 2800+ KT333 1180
 
P4 2,8 ГГц 1165
 
P4 2,8 ГГц - PC1066 1155
 
Athlon XP 2800+ nForce2 1100
 

И снова nForce 2. Так как тест 3DSMax не делает большой нагрузки на память, nForce 2 выигрывает испытания с 7% преимуществом! Это делает Athlon XP 2800+ лучшим для 3DSMax.

AutoCAD

Для тестирования AutoCAD был использован AUGI Gauge тест от AutoDesk Users Group International. С AUGI Gauge сайта:

AUGI Gauge – это тестовый инструмент производительности, необходимый разработчикам скриптов, тестирующих разные операции и рисунки. Инструмент содержит интерфейс Visual Basic и тестовый движок AutoLISP. AUGI Gauge записывал хронологию хода теста в текстовый файл, импортируемый в таблицу для манипуляций с данными. AUGI Gauge разработан для работы с AutoCAD Release 12 (DOS), Release 13 (Windows) и Release 14. Текущая версия работает с AutoCAD Release 14 и AutoCAD 2000.

Сам тест состоял из двух разделов и использовал реалистичный тест с 30 операциями, изменения файлов, редактирования и воспроизведения, на каждую серию из 15 картинок по 2 Мб.

AutoCAD 2002 - 2D (Секунды: меньше - лучше)
Процессор Секунды
P4 2,8 ГГц i845G - DDR333 119,4
 
Athlon XP 2800+ KT333 115,0
 

К сожалению, тест AutoCAD 2002 занимает много времени, и не было возможности его завершить. Но первые шаги показывают небольшое преимущество Athlon в производительности 2D задач.

Рисующая программа

Для чего необходима мощность процессора? Вы сэкономите на OpenGL плате, используя Kribi. Этот продукт от Adept Development, очень мощная программа с 3D-рисующим движком. Изначально разработанная Эриком Броном, она предназначена для управления 10 млрд. многоугольников и их фото реалистичного отображения в реальном времени. Движок Kribi - 100% программный рисовальщик (чистый тест процессора), работающий с SSE. Это своеобразный SSE и FPU тест.

Движок предназначен для разработчиков полнофункционального 3D приложения. Тест был на KribiBench версии 1.1.

KribiBench 1.1: City Ultra
Процессор Тест FPS
Athlon XP 2800+ KT333 Текстурированный 0,341
 
Реалистичный 0.245
 
P4 2,8 ГГц i845G - DDR333 Текстурированный 0,356
 
Реалистичный 0,252
 
P4 2,8 ГГц i850E - PC1066 Текстурированный 0,387
 
Реалистичный 0,277
 
KribiBench 1.1: Jet Shadow
Процессор Тест FPS
Athlon XP 2800+ KT333 Текстурированный 10,19
 
Реалистичный 3,97
 
P4 2,8 ГГц i845G - DDR333 Текстурированный 11,96
 
Реалистичный 4,9
 
P4 2,8 ГГц i850E - PC1066 Текстурированный 12,2
 
Реалистичный 5,3
 

Производительность SSE за высокочастотными Pentium 4. Выигрывает процессор с наибольшей частотой, не озадаченный ошибками предугадывания переходов или зависимостей.

Профессиональные тесты: Научные расчеты

ScienceMark 2.0 (16/08/2002) конечно больше чем MemBench. Хорошо оптимизированный тест и для Athlon, и для Pentium 4, определяющий производительность процессоров при научных расчетах.

Методами молекулярной термодинамики моделируется поведение вещества вычислением сил действующих на его молекулы. В этой модели вычисляется динамика 216 атомов аргона при 140 К. Дополнительная информация на web.physics.uiuc.edu

ScienceMark 2.0 Moldyn (секунды: меньше лучше)
Процессор Секунды
P4 2 ГГц 148,0
 
P4 2,4 ГГц - 400 FSB 118,8
 
P4 2,4 ГГц - 533 FSB 116,8
 
Athlon XP 2200+ 113,3
 
P4 2,53 ГГц 110,7
 
Athlon XP 2600+ 97,0
 
P4 2,8 ГГц 94,7
 
Athlon XP 2800+ KT333 87,2
 
Athlon XP 2800+ nForce2 85,7
 

Следующий тест – Primordia с sciencemark.org:

Этот код вычисляет квантовомеханические орбитали Хартри-Фока для каждого электрона элементов периодической таблицы. Проблема расчета орбиталей здесь подробно рассматривается. Выполняется вложенный цикл. При каждом шаге в цикле Хартри происходит обмен, и коррелируются потенциалы. Пользователь может выбрать алгоритм, вычисляющий потенциалы.

ScienceMark 2.0 Primordia (секунды: меньше лучше)
Процессор Секунды
P4 2 ГГц 855,0
 
P4 2,4 ГГц - 400 FSB 738,7
 
P4 2,4 ГГц - 533 FSB 709,5
 
P4 2,53 ГГц 673,6
 
P4 2,8 ГГц 593,6
 
Athlon XP 2200+ 543,9
 
Athlon XP 2600+ 485,4
 
Athlon XP 2800+ KT333 475,0
 
Athlon XP 2800+ nForce2 435,2
 

nForce 2 снова играет мускулами и опережает KT333 на целых 9%. На самом деле интересно, смогут ли промышленные платы nForce2 показать такую же хорошую производительность.

Заключение

Вопреки общему мнению, Athlon вполне может извлечь пользу из 166 МГц шины. nForce2 показал, что точно настроенный чипсет может увеличить производительность Athlon XP на 15%. Что вполне достаточно для конкурентоспособности Athlon 2800+ с 2.8 ГГц Pentium 4.

Однако это всего лишь предварительный обзор nForce 2. Контроллер памяти силен, но остается открытым вопросом, сможет ли быть настроена промышленная плата так же, как и нестабильный прототип. Кажется, об этом говорить еще рано. Хотелось бы провести тесты на полностью стабильной платформе nForce 2 с процессором Athlon XP, который будет доступен читателю позже.

Тем не менее, этот обзор показывает, что платформа Athlon может конкурировать с Pentium 4. AMD маленьким кэш L2 и заурядным выборщиком сильно снижает производительность. AMD может устранить эти изъяны с будущими версиями Athlon или/и Hammer.

обсудить данный материал в форуме

31/10/2002

© Компьютерная Столица 1997-2002