Ugrás a tartalomra
Szintetikus Perszóna

LLM-ek mint szintetikus szemtanúk — mit lehet tőlük kérni, mit nem?

Nagy nyelvi modellek (LLM) nem emberi viselkedést modelleznek, csak szöveget. Cikkünk pontosan leírja, milyen feladatokra alkalmasak szintetikus szemtanúként, é

A nagy nyelvi modellek csodálatos szimulálói emberi hangnak. Az emberi viselkedésnek már kevésbé.


TL;DR

Egy nagy nyelvi modell (LLM) képes arra, hogy embernek tűnő szöveget generáljon. Ez azt az illúziót keltheti, hogy emberi perspektívát is tükröz. De az LLM nem az emberi viselkedés modellje — az emberi szöveg modellje. A kettő között nagy a különbség. Ez a cikk pontosan megmutatja, mit lehet kérni LLM-alapú szintetikus perszónától, mit nem — és milyen kiegészítő rétegek kellenek ahhoz, hogy a határok tágítsák.


Aula csendje

A padló deszkái alatt rekedten recsegnek, ahogy a súlyom elosztódik rajtuk. A magas, boltíves mennyezet fölött valahol madár csicsereg, de a hang úgy tör be a színes üvegablakon, mintha egy másik világból jönne. A falakon sorakozó professzorok arcképei néznek maguk elé, vakon. A levegőben por és régi könyv illata leng. Ülök, és a csend olyan sűrű, hogy majdnem hallom a gondolataim zúgását. Ez a tér tele van szavakkal, amiket már rég kimondtak, és mégis itt lebegnek, láthatatlanul. Pont most, amikor annyi új szó születik, ami soha nem volt itt. Kíváncsi vagyok, vajon melyikük marad meg, és melyikük csak visszhang – üres, de tökéletes formájú.

1. Mit csinál az LLM valójában?

A nagy nyelvi modellek (GPT-4, Claude, Llama stb.) szöveg-előrejelző rendszerek. Tanítási adatuk: az emberiség által írt szövegek óriási gyűjteménye. Az LLM azt tanulja meg, melyik szöveg melyik szöveg után következik valószínűleg.

Ez rendkívül erős képesség. Az emberiség szövegei tartalmazzák az emberiség tudásának, tapasztalatának és gondolkodásmódjának hatalmas részét.

De van egy alapvető korlát: az LLM azt tanulja meg, hogyan ír az ember — nem azt, hogyan gondolkodik, dönt vagy érez.

Ez a különbség kulcsfontosságú a szintetikus perszóna szempontjából.


2. Az LLM erősségei szintetikus perszóna kontextusban

Mit tud jól:

  1. Emberi hang szimulálása: Az LLM kiválóan tudja utánozni, hogyan fogalmaz egy adott demográfiai csoport tagja. A szöveg természetesnek, emberinek hat.

  2. Sémák és sztereotípiák felidézése: Ha egy tipikus szituációt kérsz szimulálni, az LLM a tanítási adatokból rekonstruálja a leggyakoribb reakciókat. Ez működik, ha a szituáció nem szokatlan.

  3. Perspektíva-váltás: Az LLM képes különböző nézőpontokból megszólalni — ha azt kéred, hogy „egy ötvenéves vidéki tanár szemszögéből” válaszoljon, megpróbálja.

  4. Szituáció-értelmezés és kontextus-kezelés: Hosszabb szituáció-leírásokat is tud kezelni, és kontextuálisan releváns válaszokat adni.


3. Az LLM korlátai szintetikus perszóna kontextusban

Mit nem tud jól:

3.1 Overcoherence

Az LLM szövegei rendkívül koherensek. De a valódi ember tele van ellentmondással, ambivalenciával, önmaga ellen ható impulzussal. Ha a szimulált perszóna mindig koherens, az az LLM természetéből fakad — nem az emberből.

3.2 A „tipikus ember” felé húzás (average-person collapse)

Az LLM a tanítási adatok statisztikai átlagát reprodukálja. Még ha megkéred, hogy egy „alacsony neuroticism-értékű, magas IoU-jú, elkerülő coping-stílusú” perszónát játsszon el — a válasz hajlamos visszahúzódni az átlagos emberi válasz irányába. A perszóna-profil felülíródik.

3.3 Predikciós érvényesség hiánya

Az LLM nem embert szimulál — szöveget generál, amely emberinek tűnik. Nincs belső állapotmodell. Nincs BIS/BAS motor. Nincs IoU-érzékenységi szint. Ha a perszóna-profil csak promptban van megadva, az LLM nem tartja konzisztensen az összes döntési szituációban.

3.4 Kultúra-specifikus torzítás

A nagy LLM-ek tanítási adatai erősen angolszász, nyugati, városi középosztálybeli torzítással rendelkeznek. Magyar kulturális kontextus, CEE-piaci normák, helyi fogyasztói minták — ezek alulreprezentáltak. A magyar perszóna szimulálása megbízhatatlanabb, mint például egy angol.

3.5 Stressz és dinamika hiánya

Az LLM pillanatkép-állapotban van. Nem tudja modellezni, hogy 6 hónap krónikus stressz után hogyan változna a perszóna — hacsak ezt nem kódolják be explicit rétegként.


4. Az LLM és a perszóna-motor különbsége

Ez a különbség kulcsfontosságú:

LLM-prompt alapú perszónaPszichológiai motoros perszóna
ÁllapotmodellNincs (minden promptban újrakezdődik)Van (rétegelt, frissülő)
Trigger-logikaNincs (szituáció leírásból inferred)Van (explicit trigger library)
Coping-rétegNincs (szöveg-átlag alapján szimulálja)Van (explicit, stílus + flexibility)
OvercoherenceMagasAktívan ellenőrzött
Prompt fragilityMagas (kérdés-megfogalmazástól függ)Alacsony (belső modell stabil)
Kulturális kalibrációGyenge (angolszász bias)Tervezetten kalibrálható
ValidálhatóságNehéz (minden prompt más)Tesztelhető, mérhető

5. Hogyan erősítheti az LLM-et a pszichológiai motor?

Az LLM nem tud pszichológiai motort helyettesíteni — de kiváló kimenet-generáló, ha az inputot a motor adja.

A helyes architektúra:

Pszichológiai motor → Állapot-kimenet → LLM → Természetes szöveg
  1. A motor meghatározza: a perszóna jelenlegi állapota (stressz szint, aktív trigger, coping mód, dominális érzelem)
  2. Ezt az állapotot strukturált leírásként adja át az LLM-nek
  3. Az LLM nem „eljátszik egy karaktert” — hanem egy pontosan leírt belső állapotból generál természetes szöveget

Ez a megközelítés ötvözi a motor prediktív pontosságát és az LLM szöveg-generálási képességét — anélkül, hogy az LLM-re bíznánk az állapotmodellezést.


6. Mit lehet tőlük kérni, mit nem?

✅ Igen — kérj LLM-alapú szintetikus perszónától:

  • Természetes szöveg, amely emberi hangon szól
  • Egy adott szituáció általános reakciójának első megközelítése
  • Hipotézis-lista, amelyet aztán validálni kell
  • Különböző perspektívák gyors összehasonlítása
  • Forgatókönyv-bejárás exploratív célra (nem operatív döntéshez)

❌ Ne kérj LLM-alapú szintetikus perszónától:

  • Prediktív érvényességet igénylő döntési előrejelzést
  • Stressz-szenzitív, dinamikus reakciók pontos szimulációját
  • Kulturálisan kalibrált, magyar piaci viselkedési előrejelzést
  • Statisztikailag reprezentatív adatot
  • Bármit, amit egyértelmű vörös zászlóval kellene megjelölni (érzékeny csoport, magas tétű döntés)

7. A validitás-korlát: amit a „Perils of Synthetic Replacements” tanulmány megmutatott

Sharma et al. (2024) „Synthetic Replacements: The Perils” (cit:109) tanulmánya empirikusan vizsgálta, mennyire helyettesíthetők valódi survey-válaszolók LLM-szimulációkkal.

A fő megállapítások:

  • Az LLM-válaszok szisztematikusan eltérnek a valódi emberi válaszoktól, különösen szélsőséges attitűdökre és érzékeny témákra
  • Az eltérés nem véletlenszerű: az LLM-ek összenyomják a vélemények szórását (az átlag felé húznak)
  • Az eltérés demográfiai csoportonként különbözik — bizonyos csoportoknál lényegesen nagyobb a torzítás
  • A promptolási módszer erősen befolyásolja az eredményt — nincs stabil, reprodukálható kimenet

Ez nem azt jelenti, hogy az LLM-alapú perszónák haszontalanok — azt jelenti, hogy pontosan ismerni kell a korlátaikat.


8. Összefoglalás

Az LLM-ek kiváló szöveg-generálók — és átlagos perszóna-szimulálók. Jók arra, hogy embernek tűnő szöveget adjanak. Gyengék arra, hogy pszichológiailag validált viselkedést szimulálnak.

A helyes megközelítés: az LLM-et kimenet-generálóként alkalmazni, de az állapotmodellezést, a trigger-logikát és a validációt pszichológiai motorra bízni. Így ötvözhető a kettő erőssége anélkül, hogy az LLM korlátaiba ütközünk.


Ez a cikk a Szintetikus Perszónák sorozat huszonharmadik része. A következő rész: Longitudinális perszóna — hogyan öregszik a szintetikus ember?


Varga Zoltán | vargazoltan.ai — Piackutatás, mesterséges intelligencia, szintetikus gondolkodás

Beszéljünk erről

Ha ez a cikk gondolatokat ébresztett — foglalj egy 1 órás beszélgetést.

Időpont foglalás