Utoljára frissítve:
GFIS Rendszer · Spoke
GFIS Lite: AI-kutatási pipeline 1 hét alatt, GPU nélkül
A teljes GFIS pipeline komoly infrastruktúrát igényel — de a kutatási feladatok 60–70%-ára elég két API kulcs és egy strukturált prompt. Ez a Lite verzió: Brave Search + Claude API, 5 lépésben, GPU és szerver nélkül.
A GFIS Lite a Brave Search API (WSEARCH + SSEARCH) és a Claude API kombinációja. Nincs Qdrant, nincs GPU, nincs helyi modell. Havi ~$15 alatt üzemben tartható, és egy tapasztalt kutató hat hónap alatt sem tud manuálisan annyit feldolgozni, amennyit egy nap alatt lefuttat.
beüzemeléséhez
költség (Brave + Claude)
kutatási ciklus
Miért érdemes GFIS Lite-tal kezdeni
A teljes GFIS pipeline hat réteget tartalmaz: webes keresés, Reddit-diskurzus, YouTube-szintézis, 1,48 milliós vektorizált corpus, reranker és LLM-szintézis. Ez a stack Qdrant Docker konténert, llama-server processt, CUDA-képes GPU-t és dedikált gépi erőforrást igényel — ha mindezt a semmiből kell felépíteni, heteket vesz igénybe.
A Lite verzió ezzel szemben teljesen felhő-alapú. Két API kulcson kívül semmi nem szükséges hozzá. A WSEARCH (webes keresés) és az SSEARCH (Reddit-diskurzus) az esetek nagy részében elegendő ahhoz, hogy megalapozott, forrásjelölt szintézist kapjunk.
Mikor elegendő a Lite? Általános piackutatásnál, competitor intelligence-nél (mit mondanak a valódi felhasználók a versenytársak termékeiről), iparági trendek figyelésénél, tartalom-gap azonosításnál és döntés előtti gyors háttérkutatásnál a Lite verzió teljes értékű eredményt ad.
Mikor nem elegendő? Ha saját belső dokumentumok között kell keresni (CSEARCH), ha YouTube-tartalmak feldolgozása szükséges (VSEARCH), vagy ha a reranking pontossága kritikus (pl. jogi vagy orvosi kutatás) — ezekhez a Standard verzió szükséges. De ezek a szükségletek a legtöbb felhasználónál hónapokig nem merülnek fel.
A GFIS Lite komponensei és azok szerepe
| Komponens | Technológia | Szerepe | Becsült cost |
|---|---|---|---|
| WSEARCH | Brave Search API | Webes keresés — hírek, blogok, cégoldalak, aktuális eredmények | $5/hó (2000 req) |
| SSEARCH | Brave Search API + site:reddit.com filter | Reddit-diskurzus — practitioner sentiment, valódi felhasználói vélemények | az $5/hóba belefér |
| Szintézis LLM | Claude API (claude-sonnet-4-6) | Gestalt-összefoglalás generálása a WSEARCH + SSEARCH eredményeiből | $5–15/hó |
| Strukturált prompt | Szöveges sablon (nincs technológiai függőség) | A kutatási logika és a Gestalt-szintézis instrukciók hordozója | ingyenes |
A WSEARCH és az SSEARCH ugyanazon az API kulcson fut — a különbség csupán a query-ben: az SSEARCH minden keresésnél hozzáfűzi a site:reddit.com szűrőt. Ez azt jelenti, hogy a két adatforrás együtt sem növeli az API-cost-ot, csak a lekérdezések számát.
5 lépéses setup folyamat
- Brave Search API kulcs megszerzése Menj a dev.search.brave.com oldalra, regisztrálj fejlesztői fiókot, és aktiváld a "Data for AI" csomagot. Az ingyenes tier 2000 lekérdezés/hóig elegendő az első hetekre. Az API kulcsot mentsd biztonságos helyre — environment variable-ként tárold, ne égjen bele a kódba.
- Claude API kulcs megszerzése A console.anthropic.com oldalon hozz létre fiókot, adj hozzá fizetési módot, és generálj API kulcsot. A claude-sonnet-4-6 modell ajánlott a szintézishez — megfelelő egyensúly pontosság és cost között. Kezdésként $10 kredit elegendő az első 50-100 szintézis-ciklushoz.
- Python environment beállítása Python 3.11+ szükséges. Hozz létre egy virtuális környezetet (python -m venv gfis-lite), aktiváld, majd telepítsd a két szükséges csomagot: a requests könyvtárat a Brave Search API-hívásokhoz és az anthropic csomagot a Claude API-hoz. Mindkettő pip-pel telepíthető egyetlen paranccsal. Más függőség nincs.
- A GFIS Lite script felépítése A script három logikai egységre tagolódik. A search() függvény veszi át a query stringet és az opcionális site-filtert, meghívja a Brave Search API-t, és visszaadja a JSON-válasz snippet-listáját. A synthesize() függvény megkapja a WSEARCH és SSEARCH eredményeket, összeállítja a négyszekciós szintézis-promptot, elküldi a Claude API-nak, és visszaadja a generált szöveget. A main() orchestrátor bekéri a kutatási kérdést, lefuttatja a search() hívásokat mindkét forráshoz, majd átadja az eredményeket a synthesize() függvénynek.
- Első kutatási ciklus futtatása és kimenet értelmezése Futtasd a scriptet egy konkrét kutatási kérdéssel. A várható kimenet: egy 500–1500 szavas szintézis-dokumentum, amelynek első bekezdése a fő következtetést tartalmazza, a középső rész a forrásokból kinyert tényleges adatokat, a záró rész pedig a divergens véleményeket és a fehér foltokat. Ha a kimenet csak összefoglal és nem következtet, a szintézis-instrukció pontosításra szorul.
A szintézis-prompt struktúrája
A szintézis-prompt a GFIS Lite "lelke" — ez határozza meg, hogy az LLM összefoglalót ír-e, vagy valódi mező-intelligenciát generál. A kettő között óriási a különbség.
A négyszekciós prompt felépítése:
- 1. Kontextus és célkérdés: Pontosan definiáld, mit akarsz megtudni és miért. Nem "mi a helyzet az AI piacon", hanem "milyen frusztrációkat tapasztalnak a kkv-k az AI bevezetésnél 2025-2026-ban, és milyen megoldásokat keresnek". A precíz kérdés precíz szintézist eredményez.
- 2. WSEARCH eredmények: A Brave Search API-tól kapott snippetek számozott listaként. Minden elem tartalmazza a forrás nevét, a publikálás dátumát és a releváns bekezdést. Ez a "hivatalos narratíva" szekció.
- 3. SSEARCH eredmények: A Reddit-diskurzus snippetjei ugyanígy — forrásURL-lel és subreddit-névvel. Ez a "valódi vélemények" szekció, ahol a PR-szűrő nem működik.
- 4. Szintézis-instrukció: Ez az a rész, ami a GFIS-t megkülönbözteti egy egyszerű összefoglalótól. Az instrukció nem azt kéri, hogy "foglald össze a forrásokat", hanem azt, hogy "mutasd meg, mi az, ami csak a két forrásból együtt látható" — a Gestalt-elv alkalmazása.
Minőség-ellenőrzési kérdések a generált szintézis értékeléséhez: Minden állítás visszavezethető egy konkrét forráshoz? Megjelennek-e a divergens vélemények, nem csak a konszenzus? Van-e jelölve, mi az, amit a forrásokból nem lehetett megállapítani (fehér folt)? Ha mindháromra igen, a szintézis minősége megbízható.
Mikor lépj tovább a Standard verzióra
A GFIS Lite hosszú távon is megállja a helyét — sok felhasználónak soha nem lesz szüksége a Standard verzióra. Az upgrade-et három konkrét trigger indokolja:
- Trigger 1 — CSEARCH szükségessége: Ha saját belső dokumentumokban (cégdokumentumok, korábbi kutatások, könyvcorpus) is keresni kell, a Lite nem tud segíteni. A Standard verzióhoz Qdrant Cloud (managed, nincs saját szerver) és Jina Embedding API elegendő — nincs GPU-igény, de Qdrant-tudás szükséges.
- Trigger 2 — Cost-optimalizálás nagy volumennel: Ha havi 100+ kutatási ciklust futtatsz, a Claude API cost gyorsan nő. Ezen a ponton érdemes helyi modellre váltani a szintézis-rétegben (pl. Qwen3-30B-A3B helyi futtatással) — de ez már infrastruktúra-befektetést igényel.
- Trigger 3 — VSEARCH szükségessége: Ha YouTube-tartalmak (konferencia-előadások, demo-videók, interjúk) is kellenek a szintézisbe, a Lite nem fedi le. A Tavily API site:youtube.com szűrővel pótolható — ez a Lite és Standard közötti könnyen hozzáadható réteg.
Az upgrade path: Qdrant Cloud (managed) + Jina Embedding API + saját corpus feltöltése → teljes GFIS Standard, GPU nélkül, felhő-alapon. A CSEARCH és VSEARCH réteg bekapcsolásával a teljes négy-forrású pipeline elérhető marad anélkül, hogy saját hardvert kellene üzemeltetni.