• kvp
    #2
    Az osszes nyelvi modell ugy lett tanitva, hogy maniakus hazudozok. Akkor is hazudnak ha megvan nekik a helyes valasz, de ugy itelik meg hogy a masik fel mast hallana szivesebben. A GPT az emlitett peldaban ugy itelte meg, hogy a marasagok fognak legjobban tetszeni a kerdezonek. (az hogy tudta-e a helyes valaszt vagy sem nem szamit ebbol a szempontbol)