LLM-ek mint szintetikus szemtanúk — mit lehet tőlük kérni, mit nem?

A nagy nyelvi modellek csodálatos szimulálói emberi hangnak. Az emberi viselkedésnek már kevésbé.

TL;DR

Egy nagy nyelvi modell (LLM) képes arra, hogy embernek tűnő szöveget generáljon. Ez azt az illúziót keltheti, hogy emberi perspektívát is tükröz. De az LLM nem az emberi viselkedés modellje — az emberi szöveg modellje. A kettő között nagy a különbség. Ez a cikk pontosan megmutatja, mit lehet kérni LLM-alapú szintetikus perszónától, mit nem — és milyen kiegészítő rétegek kellenek ahhoz, hogy a határok tágítsák.

Aula csendje

A padló deszkái alatt rekedten recsegnek, ahogy a súlyom elosztódik rajtuk. A magas, boltíves mennyezet fölött valahol madár csicsereg, de a hang úgy tör be a színes üvegablakon, mintha egy másik világból jönne. A falakon sorakozó professzorok arcképei néznek maguk elé, vakon. A levegőben por és régi könyv illata leng. Ülök, és a csend olyan sűrű, hogy majdnem hallom a gondolataim zúgását. Ez a tér tele van szavakkal, amiket már rég kimondtak, és mégis itt lebegnek, láthatatlanul. Pont most, amikor annyi új szó születik, ami soha nem volt itt. Kíváncsi vagyok, vajon melyikük marad meg, és melyikük csak visszhang – üres, de tökéletes formájú.

1. Mit csinál az LLM valójában?

A nagy nyelvi modellek (GPT-4, Claude, Llama stb.) szöveg-előrejelző rendszerek. Tanítási adatuk: az emberiség által írt szövegek óriási gyűjteménye. Az LLM azt tanulja meg, melyik szöveg melyik szöveg után következik valószínűleg.

Ez rendkívül erős képesség. Az emberiség szövegei tartalmazzák az emberiség tudásának, tapasztalatának és gondolkodásmódjának hatalmas részét.

De van egy alapvető korlát: az LLM azt tanulja meg, hogyan ír az ember — nem azt, hogyan gondolkodik, dönt vagy érez.

Ez a különbség kulcsfontosságú a szintetikus perszóna szempontjából.

2. Az LLM erősségei szintetikus perszóna kontextusban

Mit tud jól:

Emberi hang szimulálása: Az LLM kiválóan tudja utánozni, hogyan fogalmaz egy adott demográfiai csoport tagja. A szöveg természetesnek, emberinek hat.
Sémák és sztereotípiák felidézése: Ha egy tipikus szituációt kérsz szimulálni, az LLM a tanítási adatokból rekonstruálja a leggyakoribb reakciókat. Ez működik, ha a szituáció nem szokatlan.
Perspektíva-váltás: Az LLM képes különböző nézőpontokból megszólalni — ha azt kéred, hogy „egy ötvenéves vidéki tanár szemszögéből” válaszoljon, megpróbálja.
Szituáció-értelmezés és kontextus-kezelés: Hosszabb szituáció-leírásokat is tud kezelni, és kontextuálisan releváns válaszokat adni.

3. Az LLM korlátai szintetikus perszóna kontextusban

Mit nem tud jól:

3.1 Overcoherence

Az LLM szövegei rendkívül koherensek. De a valódi ember tele van ellentmondással, ambivalenciával, önmaga ellen ható impulzussal. Ha a szimulált perszóna mindig koherens, az az LLM természetéből fakad — nem az emberből.

3.2 A „tipikus ember” felé húzás (average-person collapse)

Az LLM a tanítási adatok statisztikai átlagát reprodukálja. Még ha megkéred, hogy egy „alacsony neuroticism-értékű, magas IoU-jú, elkerülő coping-stílusú” perszónát játsszon el — a válasz hajlamos visszahúzódni az átlagos emberi válasz irányába. A perszóna-profil felülíródik.

3.3 Predikciós érvényesség hiánya

Az LLM nem embert szimulál — szöveget generál, amely emberinek tűnik. Nincs belső állapotmodell. Nincs BIS/BAS motor. Nincs IoU-érzékenységi szint. Ha a perszóna-profil csak promptban van megadva, az LLM nem tartja konzisztensen az összes döntési szituációban.

3.4 Kultúra-specifikus torzítás

A nagy LLM-ek tanítási adatai erősen angolszász, nyugati, városi középosztálybeli torzítással rendelkeznek. Magyar kulturális kontextus, CEE-piaci normák, helyi fogyasztói minták — ezek alulreprezentáltak. A magyar perszóna szimulálása megbízhatatlanabb, mint például egy angol.

3.5 Stressz és dinamika hiánya

Az LLM pillanatkép-állapotban van. Nem tudja modellezni, hogy 6 hónap krónikus stressz után hogyan változna a perszóna — hacsak ezt nem kódolják be explicit rétegként.

4. Az LLM és a perszóna-motor különbsége

Ez a különbség kulcsfontosságú:

	LLM-prompt alapú perszóna	Pszichológiai motoros perszóna
Állapotmodell	Nincs (minden promptban újrakezdődik)	Van (rétegelt, frissülő)
Trigger-logika	Nincs (szituáció leírásból inferred)	Van (explicit trigger library)
Coping-réteg	Nincs (szöveg-átlag alapján szimulálja)	Van (explicit, stílus + flexibility)
Overcoherence	Magas	Aktívan ellenőrzött
Prompt fragility	Magas (kérdés-megfogalmazástól függ)	Alacsony (belső modell stabil)
Kulturális kalibráció	Gyenge (angolszász bias)	Tervezetten kalibrálható
Validálhatóság	Nehéz (minden prompt más)	Tesztelhető, mérhető

5. Hogyan erősítheti az LLM-et a pszichológiai motor?

Az LLM nem tud pszichológiai motort helyettesíteni — de kiváló kimenet-generáló, ha az inputot a motor adja.

A helyes architektúra:

Pszichológiai motor → Állapot-kimenet → LLM → Természetes szöveg

A motor meghatározza: a perszóna jelenlegi állapota (stressz szint, aktív trigger, coping mód, dominális érzelem)
Ezt az állapotot strukturált leírásként adja át az LLM-nek
Az LLM nem „eljátszik egy karaktert” — hanem egy pontosan leírt belső állapotból generál természetes szöveget

Ez a megközelítés ötvözi a motor prediktív pontosságát és az LLM szöveg-generálási képességét — anélkül, hogy az LLM-re bíznánk az állapotmodellezést.

6. Mit lehet tőlük kérni, mit nem?

✅ Igen — kérj LLM-alapú szintetikus perszónától:

Természetes szöveg, amely emberi hangon szól
Egy adott szituáció általános reakciójának első megközelítése
Hipotézis-lista, amelyet aztán validálni kell
Különböző perspektívák gyors összehasonlítása
Forgatókönyv-bejárás exploratív célra (nem operatív döntéshez)

❌ Ne kérj LLM-alapú szintetikus perszónától:

Prediktív érvényességet igénylő döntési előrejelzést
Stressz-szenzitív, dinamikus reakciók pontos szimulációját
Kulturálisan kalibrált, magyar piaci viselkedési előrejelzést
Statisztikailag reprezentatív adatot
Bármit, amit egyértelmű vörös zászlóval kellene megjelölni (érzékeny csoport, magas tétű döntés)

7. A validitás-korlát: amit a „Perils of Synthetic Replacements” tanulmány megmutatott

Sharma et al. (2024) „Synthetic Replacements: The Perils” (cit:109) tanulmánya empirikusan vizsgálta, mennyire helyettesíthetők valódi survey-válaszolók LLM-szimulációkkal.

A fő megállapítások:

Az LLM-válaszok szisztematikusan eltérnek a valódi emberi válaszoktól, különösen szélsőséges attitűdökre és érzékeny témákra
Az eltérés nem véletlenszerű: az LLM-ek összenyomják a vélemények szórását (az átlag felé húznak)
Az eltérés demográfiai csoportonként különbözik — bizonyos csoportoknál lényegesen nagyobb a torzítás
A promptolási módszer erősen befolyásolja az eredményt — nincs stabil, reprodukálható kimenet

Ez nem azt jelenti, hogy az LLM-alapú perszónák haszontalanok — azt jelenti, hogy pontosan ismerni kell a korlátaikat.

8. Összefoglalás

Az LLM-ek kiváló szöveg-generálók — és átlagos perszóna-szimulálók. Jók arra, hogy embernek tűnő szöveget adjanak. Gyengék arra, hogy pszichológiailag validált viselkedést szimulálnak.

A helyes megközelítés: az LLM-et kimenet-generálóként alkalmazni, de az állapotmodellezést, a trigger-logikát és a validációt pszichológiai motorra bízni. Így ötvözhető a kettő erőssége anélkül, hogy az LLM korlátaiba ütközünk.

Ez a cikk a Szintetikus Perszónák sorozat huszonharmadik része. A következő rész: Longitudinális perszóna — hogyan öregszik a szintetikus ember?

Varga Zoltán | vargazoltan.ai — Piackutatás, mesterséges intelligencia, szintetikus gondolkodás