0xDEADBEEF

RSS odkazy english edition

SIMD


6. 7. 2021 Bitonic sort
Situace se má takhle: je potřeba seřadit obrovské množství malých polí fixní předem známé délky. Každé pole má pouze 20 intů, ale jsou jich jsou desítky milionů, možná stovky. Jak to udělat co nejrychleji? Neptejte se proč. Když situace nastane, je pozdě na otázky, záleží jen na rychlosti. celý článek →
12. 3. 2021 Jak přesunout 1 až 16 bajtů do SIMD registru
Zase jsem zašel příliš hluboko. Zkouším, jak rychlá může být hash-mapa pro jedno specifické použití a měl jsem už dávno přestat. Ale na tom pocitu, když mikro-benchmarku spadne další nanosekunda, je něco návykového. I když ve finále je zajímavější, co se člověk naučí cestou, než finální výsledek. celý článek →
10. 8. 2020 Rychlý průnik množin a Jaccardův index přes SIMD instrukce
Na funkcionálně.cz jsem kdysi psal, jak rychle počítat Jaccardův index podobnosti. Jaccard udává míru, do jaké jsou si dvě množiny podobné jako velikost průniku vydělenou velikostí sjednocení. Ke své práci potřebuje co nejrychleji spočítat velikost průniku a to jsem v článku rozebíral. Od… celý článek →
9. 6. 2018 ISPC, SPMD a SIMD
Maxime Chevalier tweetla odkaz na zajímavou sérii článků mapující počátky a vývoj kompilátoru ISPC (Intel SPMD program compiler) + do toho vysvětlí jak funguje SPMD programovací model, který je využívaný pro programování grafických karet. celý článek →
Starší články publikované na funkcionálně.cz.
15. 6. 2017Hořící křemík & násobení matic
8. 12. 2015Jaccardovo tajemství - jak počítat podobnost množin pomalu, jak ji počítat rychle a jak při výpočtu podvádět
4. 3. 2016Někdy je nejchytřejší nedělat nic chytrého (další kapitola nekonečného příběhu o optimalizaci)
17. 5. 2015Za jak dlouho procesor vynásobí tisíc čísel
7. 11. 2013Poznámka k Moorovu zákonu a rychlosti procesorů
píše k47 (@kaja47, k47)