Konec Intelu, konec Moorova zákona, konec světa takového jaký známe
Apple oznámil, že plánují opustit procesory Itelu a chtějí přejít k vlastním čipům. Zatím se neví, jakou architekturu zvolí, zdali to bude ARM nebo nějaká proprietární ISA. Všichni však blahořečí Apple a vyzdvihují, že jejich mobilní procesory jsou v jednovláknovém provozu stejně rychlé jako křemík od Intelu.
Když to čtu, skřípu zuby. Samozřejmě, že mají stejně výkonné čipy, bylo by mnohem víc neobvyklé, kdyby je neměli. To co předvádí Apple ve svých A11 nebo Intel v Xeonech je velice blízko nejzazšího maximum. Za současných podmínek není možné z jednoho vlákna vytěžit nic víc.
Procesor běžící na 2-3 GHz, který dokáže v ideálním případě provést 4 instrukce každý takt (IPC) představuje limit. Nic lepšího křemíkový průmysl nesvede vyprodukovat. Tedy aspoň co se obecného kódu týká.
Vyšší takty vedou k obrovsky narůstajícím ztrátám tepla, proto ty 2-3 GHz, a nespecializovaný kód neobsahuje instrukční paralelismus, který by bylo možno vytěžit, proto ~4 IPC.
Intelovské procesory mají praktické maximální IPC někde mezi 4-5. Power od IBM nebo Sparc od Oraclu jsou širší, plánované pro odpravení 8 instrukcí každý takt, ale to je jen kvlůli 8× SMT (tedy to, čemu Intel říká hyperthreading).
Některé z těchto instrukcí můžou být SIMD, které dokáží o něco navýšit výkon. SIMD ale začínají přesahovat do sféry specializovaných programů, které provádějí masivní množství výpočtů, ne typický general purpose kód plný podmínek a větvení. Pro tyto speciálních trapně paralelní případy už máme ideální nástroj: GPU.
Příslib architektury Mill o tom, že statický velice široký VLIW stroj dokáže vydolovat nebývalý instrukční paralelismus (ILP), se setkává s oprávněnou skepsí. Když už se jim podaří uspět, bude to spíš v oblasti MIPS na watt. Specializace pro danou mikro-architekturu a jádra bez masivní OOO mašinérie (ale zato s obrovským počtem funkčních jednotek), může být energeticky efektivní.
Je ale stále ve hvězdách jestli se něco ze slibů zcela nové architektury skutečně vyplní. Jednovláknový IPC se moc nezlepší a nezáleží kolik plochy čipu tomu věnujeme, změna bude vždy jen v jednotkách procent. Zcela jisté je, že budoucnost bude patřit specializovanému hardwaru. Jinak není možné dosáhnout žádného razantního zvýšení efektivity.
Jsme na konci jedné éry. Všichni mají nejlepší procesory na světě a nestojí to za řeč. Teď je potřeba udělat další velký krok do divočin, kde už neplatí Moorův zákon.
Pozn:
- Intel nejvíce profituje ze serverového trhu, kam prodává velký silikon. V této oblasti slibuje několik zajímavostí jako mnohajádrový je Xeon Phi nebo Xeony s FPGA.
- Pro ukázku bona fide specializovaného hardwaru se podívejte třeba na TPU.
- Doufám, že uspěje otevřená architektura RISC-V, která je na tuto budoucnost připravovaná.
Relevantní čtení:
- Čím více se věci mění, tím více zůstávají stejné (historická perspektiva)
- Závislost je špatná (pro vaše programy i pro váš hardware) (závislosti limitují užitečné ILP)
- Za jak dlouho procesor vynásobí tisíc čísel
- Úvod do podivností moderního hardwaru, které vás budou budit ze spaní
- Von Neumannovy lži
- Dualismus hardwaru a softwaru, strojů a virtuálních strojů