kvp#6
"Nálad is azt érzem, hogy tudtodon kívül állandóan valótlanságokat állítasz itt az sg kommentek között."
Sajnos nem. A gond az, hogy a nagy nyelvi modellek gyakorlatilag szoveg predikcios rendszerek, tehat a bemeno szovegekbol es a sajat elozmenyeikbol allitjak ossze a legvaloszinubb kovetkezo szoveget. Ez a valaszuk.
A betanitasnal viszont nem helyessegre mentek hanem valasz tetszesre, tehat minel jobban tetszett a valasz a betanito szemelyzetnek annal magasabb pontszamot kapott. Ez azt jelenti, hogy a formailag jo, meggyozo valaszokat preferaltak es nem a helyeseket. Utobbihoz ugyanis egy fact check-elt tanito adatbazis kellett volna ami jelenleg senkinek sincs. Ennek a celfuggvenynek az eredmenye hogy a valasz tetszesre es nem josagra van kihegyezve es ezert van minden valasz a kerdezohoz igazitva. Ha kreativ iras a feladat ez jo, ha a helyes tenyek akkor borzaszto rossz.
A fentiek melle raktak meg be a homerseklet alapu veletlent, azaz a kinezett iealis valasztol megengedett elterest. Ha meg jo is lenne veletlen a valasz egy magasabb homerseklet nagyon el tudja vinni a veletlen fele. Ha meg eleve rossz akkor meg messzebbre.
Itt tartunk. A nyelvi modellel nem logikailag valaszolnak hanem a szoveg tenyleges megertese nelkul egy hibas celfuggvennyel betanotott statiszikai modellel. A gond az, hogy ellenorzott betanito adatok nem nagyon vannak es azokkal merven tenyszeru josagra tanitani sokkal tovabb tartana. Egyszeruen nem gazdasagos...