A legjobb tömörítő program
-
#62
Soha nem adom el.
Csak a használati jogokat , bizonyos időre, és úgy képzelem ,hogy a belőlle származó haszon egy kis részét elkérem.
Részben C++ ban szeretném, a megját meg ASM-ben.
Baromi gyors lesz.
Van ez a shanon limit, amit még egy tömörítő program sem tudott átlépni.
Ennél a programnak pont az a lényege,hogy ha megnő a minta entrópiája akkor megy jól a tömörítés.
Abból a feltevésből indultam ki, hogy akármilyen féle mintákra fel lehet álítani olyan szabályokat ami alapján jó lesz a tömörítés.
A sorhossz kódolás akkor hatékony ha sok azonos érték van egymás mellett, a huffman ha adott értékből fajtákból jelentősen több van az állományban. Az lzw akkor jó ha bizonyos adott mintákból jelentős van az állományban.
Az enyém úgy működne, hogy akkor hatékony ha minél nagyobb az entrópiája, minél véletlenszerűbbek az adatok... azaz, ugyanazon "szimbólumok" aránylag közel helyezkednek el a kódban.
De a legnagyobb különbség az, hogy az eddigi alkalmazásokkal elvégett átkodolás után megnő az adatok entrópiája, közel a shanon limithez és már nem érhető további méretcsökkenés, esetleg nagyon pici.. mivel ezek az algoritmusok az ismétlődéseket "redundanciát" veszik ki a kódból.
Amit én készítek annál a kódolás után ugyan olyan nagy lesz a kimenő entrópia mint a bemenő adatoknál, azaz akárhányszor megyünk át rajta , mindig kisebb és kisebb lesz, és ahogy mélyebre megyünk egyre jobban a rekurzióba, annál hatékonyabb lesz a tömörítés is. Érdekes. Én sem számítottam rá. Egy menetben átlagosan 10-20% al lesz kisebb az adat, és kicsomagolással egyértelműen vissza is lehet álítani minden bitet a kezdeti állapotra.
Ami lehetővé teszi a működést, az az,hogy a "véletlen" egymás után következő száoknak , szimbólumoknak , mintázatuk van.
És akármilyen véletlennek tűnő sorozatot nézel, azokban is benne vannak a minták. Úgy néz ki a mi világunkban mindenhól felbukkannak ezek a minták. Gyanítom ,hogy ez egy mester fraktál lehet.