Тестирование производительности
Простейшими методами оценки плотности кодов 32-разрядных RISC систем, являются методы типа выполнения двух 16-разрядных выборок и выполнение только 16-разрядных команд на 32-разрядном ядре. Однако, оба эти подхода ведут к большим потерям в показателях производительности.
Великолепная производительность
Эти эталонные тесты должны показать, что даже с превосходной плотностью кода ядра Thumb , его производительность в 16-разрядных системах превосходит и стандартные ядра ARM и общие решения конкурентов.
Снова результаты сравниваются для Dhrystone 1.1, поскольку эти данные по конкурирующим ядрам свободно доступны. Данные для ARM7TDMI ядра были сгенерированы с использованием симулятора Thumb-ориентированных команд (ARMulator). Этот симулятор обеспечивает замер тактовой частоты, при которой вычисляются значения Dhrystone.
Чтобы гарантировать честность результатов, сравнение выполнялось в два этапа:
- Для процессоров, работающих 16-разрядной памятью
- Для процессоров, работающих с 32-разрядной памятью.
Ядра ARM - превосходные решения для портативных встроенных применений, поскольку имеют очень малое потребление. Поэтому показываются значения и Dhrystone 1.1 MIPS и MIPS/Watt. Процессоры, отмеченные звездочкой оснащены встроенным кэш.
Рисунок 16: Dhrystone 1.1 MIPS и MIPS/Watt при напряжении питания 5 В для процессоров 16-разрядных систем
Таблица 6: Процессоры в 16-разрядных системах памяти при напряжении питания 5 В
Источник: Microprocessor Forum 1993 и данные поставщиков
Процессор |
Тактовая частота, напряжение питания |
Потребление (W) |
Ds1. 1 MIPS |
MIPS/Watt |
ARM7TDMI |
33MHz 5V |
0,181 |
21,2 |
117 |
ARM7D |
33MHz 5V |
0,165 |
16,3 |
99 |
ARM710 (*) |
33MHz 5V |
0,424 |
38,2 |
90 |
Z380 |
18 MHZ |
0,04 |
3,1 |
78 |
SH7032 (*) |
20MHz 5V |
0,5 |
16,4 |
33 |
H8/500 |
10MHz 5V |
0,1 |
1 |
10 |
486SLC (*) |
33MHz 5V |
2,25 |
18 |
8 |
H8/300H |
16MHz 5V |
0,25 |
1,9 |
8 |
386SLC |
25 MHZ 5V |
2,5 |
8 |
3 |
Рисунок 17: Drystone 1.1 MIPS и MIPS/Watt для процессоров с 32-разрядных систем при напряжении питания 5 В
Таблица 7: Процессоры в 32-разрядных системах памяти при напряжении питания 5 В
Источник: Microprocessor Forum 1993 и данные поставщиков
Процессор |
Тактовая частота, напряжение питания |
Потребление (W) |
Ds1. 1 MIPS |
MIPS/Watt |
ARM7D |
33MHz 5V |
0,165 |
30,6 |
185 |
ARM7TDMI |
33MHz 5V |
0,181 |
25,8 |
143 |
ARM710 |
40MHz 5V |
0,424 |
37 |
87 |
PC403GA |
40MHz 5V |
1 |
39 |
39 |
V810 |
25MHz 5V |
0,5 |
18 |
36 |
ARM610 |
25MHz 5V |
0,625 |
14 |
22 |
PC/кристалл |
14,3MHz 5V |
0,216 |
3 |
14 |
68349 |
25MHz 5V |
0,96 |
9 |
9 |
29200 |
16MHz 5V |
1,1 |
8 |
7 |
486DX |
33MHz 5V |
4,5 |
27 |
6 |
I960SA |
16MHz 5V |
1,25 |
5 |
4 |
Для завершенности, фирма ARM генерировала также значения Dhrystone 2.1 для ARM7TDMI в 16 и 32-разрядных системах памяти при напряжении питания 5 В. Опубликованных данных Dhrystone 2.1 для конкурирующих ядер нет.
Производительность и значения потребляемой мощности моделировались также при 3 В, и для ARM7D и ARM7TDMI, выполняющих Dhrystones 1.1/2.1 при тактовой частоте 20 MHZ и напряжении питания 3,3 В:
Таблица 8: Ядра ARM в 16-разрядной системе памяти при напряжении питания 3 В
Процессор |
Эталонный тест |
Потребление (W) |
DS MIPS |
MIPS/Watt |
ARM7TDMI |
Dstone 2.1 |
0,036 |
11,6 |
322 |
ARM7D |
Dstone 1.1 |
0,033 |
9,9 |
300 |
ARM7D |
Dstone 2.1 |
0,033 |
9,1 |
276 |
Таблица 9: Ядра ARM в 32-разрядной системе памяти при напряжении питания 3 В
Процессор |
Эталонный тест |
Потребление (W) |
DS MIPS |
MIPS/Watt |
ARM7TDMI |
Dstone 1.1 |
0,036 |
15,6 |
433 |
ARM7TDMI |
Dstone 2.1 |
0,036 |
14,0 |
389 |
ARM7D |
Dstone 1.1 |
0,033 |
19,1 |
579 |
ARM7D |
Dstone 2.1 |
0,033 |
18,0 |
545 |
Важно помнить, что ARM7TDMI способен выполнять команды и Thumb и ARM. Следовательно, в 32-разрядной системе памяти, ARM7TDMI обеспечит производительность в MIPS такую же как ARM7D, если будет работать в ARM режиме все 100 % времени.
Исключительная плотность кода и производительность
Приведенные выше результаты четко показывают, что концепция Thumb не только предоставляет исключительную плотность кода, но и превосходную производительность. Обратите внимание, что даже при том, что Dhrystone 1.1 - полностью кэшируется в 2 Кбайтах, ARM7TDMI легко обгоняет конкурирующие кэшированные процессоры на Dhrystone 1.1 MIPS. ARM710 обеспечивает самые лучшие рабочие характеристики, поскольку полностью кэширует Dhrystone 1.1 и, вследствие этого, на него не влияет ширина внешней системы памяти.
Ведущая Dhrystone MIPS производительность
Чрезвычайно малое потребление семейств ARM7 и ARM7TDMI делает их идеальным выбором для портативных применений. Да и для применений, где потребляемая мощность не так важна, решения фирмы ARM обеспечивают ведущую Dhrystone MIPS производительность .
В 16-разрядной системе ARM7TDMI превосходит по быстродействию ARM7 на 150%, поскольку не выполняет двух выборок на команду; в 32-разрядной системе, Thumb-совместимое ядро сохраняет всю производительность ARM7 просто работая в ARM режиме все 100% времени.
|