#17
Ha rajtam múlna, én elhagynám az L1 és L3 cache-t, ha egyszer már megvannak az adatok egy példányban, minek többször tárolni őket.
Inkább lenne egy egyesített memória cache elérés vezérlő, és az L1 cache helyett meg árnyék regisztereket használnék.
Leredukálnám a magméretet 1-2 millió tranzisztorra, mindent leegyszerűsítenék, és aszinkron áramköröket használnék fel, amivel ilyen kis magméret mellett, elérhető lenne a több tíz Ghz-vel egyenértékű sebesség.
Több magot tennék a prociba, mondjuk kb 64 et, egy multiplikált memória vezérlőn lógnának.
Üresjáratban nem igen fogyasztana, kb tized wattokat.
Meghajtva sem fogyasztanának 10-20 watnál többet, mivel aszinkron áramkörök vannak benne. Lehet hogy egy ciklus alatt valamivel kevesebb műveletet hajtana végre mint a több millió tranzisztoros óriások, de az egyszerű felépítés és kis magméret miatt időegység alatt több teljes ciklust válik lehetővé. Akár tízszer-húszszor több művelet is.
Volt ez az IBM kísérlet a GeSi csipekkel, ahol egy egyszerű művelet végrehajtó áramkört felhúztak 300 Ghz-re , közel nulla fok közelében meg 500 ra.
Amíg ilyen brutális nagyok és komplexek a magok, az órajelet nem igen lehet majd emelni. Lásd Geforce GTX 200 as chipekknél a nagy magméret milyen hátrányos a sebességre, és a fogyasztásra. Üresjáratban mindent le kell kapcsolni a teljes áramkörben hogy kibírható legyen a fogyasztása, és ne keljen kéményt szerelni a pc-re.