Műszaki PDF feldolgozás AI-jal: dokumentumfeldolgozási pipeline

Minden vállalat tudásának 70–80%-a strukturálatlan dokumentumokban él. Műszaki adatlap PDF-ben, árlista Excel-ben, kompatibilitási mátrix Wordben, alkalmazási mintaválasz szkennelt fax-ből — és mindez egymástól független mappákban, eltérő verziókban, hozzáférhetetlen rendszerekben. A 2. szakasz arról szól, hogyan szabadul ki ebből a tudás úgy, hogy közben nem veszít a pontosságából.

A dokumentum mint elveszett tudás

Egy közepes méretű ipari vállalatnál tipikusan 4 000–12 000 darab műszaki dokumentum él párhuzamosan. Ezek közül csak töredék — talán 5–10% — kereshető rendszerszerűen. A maradékot az olvasó tudja, hol van; a többiek nem. Ez nem dokumentumprobléma — ez tudásprobléma.

A dolgozók nem azért nem találnak meg egy fontos információt, mert hanyagok, hanem mert a rendszer struktúrája nem engedi nekik. Ahogy a felhasználó-központú designra építő szemlélet régóta tanítja: ha valaki rosszul használ egy rendszert, az nem az ő hibája — a rendszeré.

Az AZAR feldolgozási pipeline

1. fázis — Felmérés és tipizálás

Mielőtt egyetlen dokumentum is bekerülne a rendszerbe, az AZAR feltérképezi a kiindulási helyzetet: milyen formátumok élnek, hány verzió fut párhuzamosan, melyik kolléga melyiket tartja „kanonikusnak”, és hol vannak a vakfoltok. Ez a felmérés gyakran már önmagában feltárja a problémák felét.

2. fázis — Intelligens kibontás

Itt kerül sor a tartalmi feldolgozásra, és ennél a lépésnél a technológia-választás megfontolt. Az AZAR három fő eszközosztályból választ az adott projekt szerint:

Strukturált, modern PDF (CAD-export, generált adatlap): gyors szöveg-kinyerés Markdown-formátumba, megtartva a táblázatokat és a fejléc-struktúrát.
Komplex layout, beágyazott táblázatok és ábrák: szemantikus hierarchia-megőrző feldolgozás (IBM Docling vagy hasonló), amely a kibontott szöveget a helyén hagyja — egy táblázat soha nem keveredik a következő bekezdéssel.
Szkennelt vagy rosszul digitalizált anyagok: OCR-réteg (Unstructured.io vagy Tesseract magyar nyelvi modellel), kézzel ellenőrzött szótár-illesztéssel.

A megfelelő eszköz választása döntő. Egy rossz tooling 60–70%-os pontossággal hozza vissza a tartalmat — egy jól választott pipeline 92–97%-os pontossággal. A különbség a vállalat számára nem 30 százalékpont, hanem két különböző rendszer: az egyikben rá lehet építeni a chatbotot, a másikban nem.

3. fázis — Szemantikus szegmentálás

A nyers szöveg önmagában nem tudás. A tudássá váláshoz strukturáltan kell darabolni: minden szakasz, paraméter-blokk, alkalmazási feltétel, kompatibilitási megjegyzés külön, önállóan értelmezhető egységként kerül a rendszerbe. Egy ilyen egység tipikusan 200–500 token (kb. 150–350 magyar szó), és úgy van megírva, hogy önmagában is megáll a lábán.

Ez a szegmentálás a későbbi pontosság alapja. Amikor a chatbot egy konkrét kérdéshez „idéz” a vállalat tudásából, ezeket a szegmenseket találja meg, nem a teljes 40 oldalas adatlapot. A keresés gyorsabb, a válasz tisztább, a hibázás esélye töredékére csökken.

4. fázis — Metaadat-réteg

Minden szegmens kap egy gondosan felépített metaadat-csomagot: forrásdokumentum, oldalszám, fejezetcím, dátum, jogosultsági szint, kapcsolódó termékek, esetleges figyelmeztetések. A metaadat-réteg az, ami a későbbi auditálhatóságot megadja. Egy AZAR-ügyfél bármikor visszafejtheti: „melyik PDF melyik oldaláról jött ez a válasz?” — és a válasz másodpercek alatt megvan.

5. fázis — Vektoros indexelés

Az AZAR a feldolgozott szegmenseket egy szemantikus keresőindexbe tölti — vektoros adatbázisba (jellemzően Qdrant a self-hosted projekteknél, Pinecone a felhős változatban). Ez a keresés nem kulcsszó-egyezésre épül, hanem jelentés-egyezésre: ha az érdeklődő úgy kérdez, ahogy a dokumentum nem ír, a rendszer akkor is megtalálja a releváns szegmenst.

A „hibrid keresés” — miért nem elég csak a szemantika

Egy tisztán szemantikus keresés gyakran „túl okos” — egy konkrét cikkszámot („B-1850-235N”) elhomályosíthat egy szemantikailag közelinek tűnő, de tényleg eltérő tartalommal. Ezért az AZAR hibrid keresést használ: lexikális (pontos egyezés) + szemantikus (jelentés) + újrarangsorolás. A három réteg egymást javítja, és olyan pontosságot ad, amelyet egyik réteg önmagában nem tudna.

Verziókezelés és frissítés

A műszaki dokumentumok folyamatosan változnak. A 2026-os szabványmódosítások, az új termékverziók, a változó alkalmazási megjegyzések mind azt követelik, hogy a tudásbázis ne fagyjon be. Az AZAR-rendszer:

Automatikus szinkronizáció a forrásmappákból (megosztott meghajtó, SharePoint, DAM-rendszer),
Soft-delete a régi verziókra — a tudás nem vész el, csak a kereshetőség kerül vissza,
Audit-napló minden változásra: ki, mikor, mit módosított,
Értesítések a műszaki osztály felé, ha a rendszer ellentmondást észlel két dokumentum között.

Az utolsó pont gyakran a legértékesebb. A rendszer „észreveszi”, amit egy ember csak nehezen venne észre: hogy a 2024-es adatlap és a 2026-os termékkatalógus ellentmond egymásnak. Ez egy passzív minőség-ellenőrzési réteg, amely az AI-bevezetés mellékterméke — és néha többet hoz, mint maga a chatbot.

Mit ad ez üzletileg?

A meglévő tudásból több hasznosul: az AZAR-ügyfelek tipikus eredménye, hogy a feldolgozás után a meglévő dokumentumkincs 75–90%-a vált kereshetővé és felhasználhatóvá — onnan, hogy korábban 10–20%.
Az új munkatárs gyorsabban produktív: a betanulási idő 30–50%-kal csökken, mert a tudás nem a kollégák fejében, hanem a rendszerben elérhető.
Csökken a műszaki osztály ismétlődő terhelése: a műszaki kollégák hetente több órát szabadulnak fel az „ezt már tegnap is megválaszoltam”-típusú kérdésektől.
Compliance- és auditálhatóság: minden válasz visszavezethető eredeti dokumentumig — ami egy esetleges minőségi vagy felelősségi vita esetén kulcsfontosságú lehet.

Mi a határa?

A dokumentumfeldolgozás nem mindenható. Az AZAR-rendszer nem helyettesít:

az egyedi helyszínjárást igénylő műszaki értékelést,
a jogszabályváltozás-követő szakmai elemzést (azt segíti, de nem helyettesíti),
a megrendelő és a szakember közötti bizalmi kapcsolatot.

Az AZAR pontosan ott állít meg, ahol meg kell állni. A rendszer válaszol, amíg az válaszolható; jelez, ha emberre van szükség; és nyomon követhető, hogy hol ért véget az automatizáció és hol kezdődött a szakember mérlegelése.

Gyakori kérdések

Mennyi időbe telik egy 5 000 dokumentumból álló kincsesbánya feldolgozása?

Tipikusan 6–12 hét — az időt elsősorban a felmérés (1. fázis) és a kanonikus források azonosítása viszi el, nem maga a feldolgozás. Az automatikus pipeline 5 000 közepes méretű PDF-et 1–3 nap alatt feldolgoz; a tisztogatás, kontrollolvasás és metaadat-finomítás teszi ki a teljes idő nagy részét.

Mi van, ha a dokumentumok angol nyelvűek, a vállalat ügyfelei magyarul kérdeznek?

Ez gyakori helyzet — gyártói angol nyelvű adatlapok, magyar piac. Az AZAR-rendszer két irányba dolgozik: a forrást angolul tárolja (megőrizve a precíz műszaki terminológiát), és a válasz pillanatában magyarra fordítja a kontextushoz illesztve. Ha a műszaki szakkifejezésnek nincs bevett magyar megfelelője, a rendszer mindkét nyelven megjeleníti, hogy a kolléga át tudja venni.

Mi van a régi, már nem értékesített termékek adataival?

A rendszerben maradnak — sőt, kiemelten értékesek. Az utólagos szolgáltatás, garanciális kérdések és cserealkatrész-azonosítás területén egy 10 éves termék pontos paraméterei gyakran életmentő tudás. Az AZAR-rendszer „életciklus” metaadattal jelöli ezeket, hogy a chatbot is tudja: ez már nem kapható, de mit lehet helyette ajánlani.

Mi a teendő titkos vagy bizalmas dokumentumokkal?

A 6. szakasz (jogosultságkezelés) pontosan ezt szabályozza: minden szegmens kap egy hozzáférési címkét, és az AI-rendszer csak az olyan kérdezőnek mutat tartalmat, akinek joga van rá. Egy területi képviselő mást lát, mint egy ügyfél; egy belső mérnök mást, mint egy területi képviselő. Részletes cikk →

Hogyan győzzünk meg, hogy ez tényleg pontos?

Az AZAR minden projekt elején verifikációs tesztkészletet állít fel: 50–100 ground-truth kérdés-válasz pár, amelyet a műszaki osztály állít össze. A rendszer minőségét e teszten mérjük, és minden nagyobb tartalmi frissítés után újrafuttatjuk. A vezetőség nem hitében, hanem számokban kap visszaigazolást.

A következő szakasz

A feldolgozott tudás csak akkor ér valamit, ha eljut azokhoz, akik nap mint nap használják: a területi képviselőkhöz. A 3. szakasz arról szól, hogyan válik a tudás használható eszközzé az út szélén, az ügyfél tárgyalótermében, az ipari telephelyen.

Folytatás: 3. szakasz — Belső tudásbázis területi képviselőknek.

Vissza a sorozat indítójához: Nyolc lépés egy intelligensebb vállalat felé.

Kérdése van az AZAR-architektúráról?

Egy 30 perces beszélgetés gyakran többet ér, mint egy 30 oldalas árajánlat.

Lépjen kapcsolatba →

Műszaki adatlapok és PDF-ek feldolgozása AI-jal — a dokumentum mint elveszett tudás