Kezdőoldal
A rendszerezetlen információ kiaknázatlan kincs
A rendszerezetlen információ kiaknázatlan kincs

A gazdasági és üzleti döntéshozók túlnyomó többsége számára bizonyára meglepő, ám felmérések által igazolt tény, hogy a vállalatuk, intézményük birtokában lévő információk közel 80%-a szöveges, azaz strukturálatlan formában áll rendelkezésükre. Ezeket az egyébként egyre jellemzőbben elektronikus formában kapott, vagy előállított információkat a cégek tárolják, ám azok tartalmát nem dolgozzák és használják fel.

A szöveges információ „mellőzöttségének" okaként a cégek arra hivatkoznak, hogy ezt az ügyfeleik, partnereik, potenciális fogyasztóik és egyéb véleményformálók által generált hatalmas információtömeget feldolgozni az emberi erőforrásigény miatt szinte lehetetlen, ám sokan bele sem gondolnak abba, hogy kárba veszni hagyni viszont hatalmas tévedés. E feladat megoldásához jelentenek segítséget a szövegbányászati megoldások, amelyeknek köszönhetően a strukturált adatokhoz hasonlóan a szöveges információk is felhasználhatók piackutatáshoz, prediktív elemzésekhez, és ezen keresztül integrálhatók a döntési folyamatokba.

A gazdasági szereplők komoly összegeket költenek és erőforrásokat allokálnak arra, hogy a legkülönbözőbb kérdések köré csoportosított piackutatási projektek keretében térképezzék fel az egyes célcsoportok vagy érdekcsoportok véleményét, attitűdjeit és viselkedését saját megítélésükkel, termékeikkel, szolgáltatásaikkal és egyéb döntéseikkel kapcsolatban. Így olyan rendszerezett adatok birtokába jutnak, amelyeket elemzési, statisztikai, adatbányászati eljárások segítségével felhasználhatnak döntési folyamataikban.

Nem mehetünk el azonban szó nélkül amellett, hogy az infokommunikáció, azon belül is, a Világháló használatának robbanásszerű fejlődésével az elektronikus felületek és megoldások mára Magyarországon is a spontán és támogatott véleménynyilvánítás kiemelkedő fontosságú és rendkívül sokszereplős színterévé váltak. Az ügyfélkontaktusok jelentős része e-mailben zajlik, az ügyfelek beszélgetéseit call centerek rögzítik, a legapróbb kérdésekről és eseményekről pedig internetes fórumokon cserélnek eszmét jelenlegi és potenciális fogyasztók vagy partnerek százai, nem ritkán ezrei. Joggal merül tehát fel a kérdés: hogyan lehet költséghatékonyan és eredményesen kiaknázni ezeket az információban mérhetetlenül gazdag lelőhelyeket?

A percenként akár 1 Gigabájtnyi adatot is feldolgozni képes szövegbányászati alkalmazások és megoldások lehetőséget kínálnak arra, hogy bármilyen elektronikus formában lévő szöveges információt - legyen az akár e-mailben, internetes honlapon, vagy fórumon szereplő, illetve tetszőleges számítógépes alkalmazásban létrehozott - strukturált adatbázisokba rendezzenek és ezáltal adatbányászati vagy egyéb megoldások számára értelmezhetővé és feldolgozhatóvá tegyenek. A szövegbányászati (TextMining) alkalmazás az adott vállalat, intézmény vagy feladat által kitűzött céloknak megfelelően előre megszerkesztett, majd egyszerűen karbantartható és aktualizálható téma specifikus alapszótárak, véleményszótárak segítségével képes a szöveges véleményeket szövegkontextusban, szókapcsolatokban értékelve a megfelelő kategóriákba sorolni (pl. pozitív, negatív vélemények, a vélemény adott cégekhez, tárgykörökhöz rendelése, stb.), a rejtett kapcsolatokat feltárni, majd adatbányászati és prediktív elemző alkalmazásokkal együttműködve modelleket létrehozni és elemzéseket készíteni.

A saját, több nyelven elérhető szövegbányászati megoldásához magyar szótárt is kifejlesztő SPSS Magyarország például egy hazai internetes oldal (Totalcar népítélet.hu) közel 40.000 szöveges hozzászólásából szövegbányászati elemzéssel 1500 magyarországi autószervizre vonatkoztatva állapított meg preferencia sorrendet a hozzátartozó indokokkal és okokkal. A szövegbányászat által felhasználói értékeléseken túl a szervizekkel kapcsolatosan leírt tapasztalatok, vélemények értelmezése is megvalósult.

textm2.jpg

textm3.jpg

Nem nehéz elképzelni tehát, hogy egy vállalat milyen széles körben hasznosíthatja az internetről vagy más elektronikus forrásból származó információkat. Figyelemmel kísérhető egy adott piaci szereplőre és versenytársaira vonatkozó pozitív és negatív hozzászólások arányának alakulása, az összes hozzászólásszámmal és az eltelt idővel súlyozva egy akár „bizalmi indexnek" is nevezhető mutató képezhető. Hasonló indexek segítségével a vállalat általános fogyasztói megítélésének, a kampányok hatásának vizsgálatára, valamint elektronikus médiafigyelésére is lehetőség kínálkozik, ahol is nem elhanyagolható, hogy a fogyasztók vagy éppen újságírók által önkéntesen nyilvánított vélemény sokszor őszintébb és nyíltabb, mint a vállalati piackutatásra adott válaszok. A Világhálón megjelenő szöveges vélemények elemzései felhasználhatók termékek, szolgáltatások koncepciók teszteléséhez, sikeres fejlesztési irányok meghatározásához, vállalati egységek, folyamatok minősítéséhez (ügyfélszolgálat, szerződési feltételek, tájékoztatás, stb.), a hozzászólások arányának megállapításához, gyanús viselkedések feltárására, vagy akár a fórumok „bértollnokainak" kiszűréséhez.

textm4.jpg

Content Monitor: Internetes fórumok feldolgozása, vélemények értelmezése

A vállalati ügyfélszolgálathoz vagy a honlapra elektronikus formában érkező fogyasztói levelek, észrevételek, a call center feljegyzések és az online piackutatásokra érkező szöveges válaszok szövegbányászati elemzései pedig felhasználhatók a vállalat vagy bármely vállalati megnyilvánulás fogyasztói megítélésének vizsgálatához, ezen keresztül pedig proaktív ügyfélkezeléssel csökkenthető a lemorzsolódás és növelhető az ügyfél elégedettség.

A fenti alkalmazási területek hagyományos piackutatási, elemzési, statisztikai, adatbányászati módszereken túlmutató és kiemelkedő fontossággal bíró közös jellemzője, hogy a „Mi, mit" kérdéseken felül a megnyilvánulók véleményének, attitűdjeinek és viselkedésének értelmezése és feldolgozása révén a prediktív gondolkodás mozgatórugóját és eredményességét jelképező „Miért?" kérdésekre is gyors és költséghatékony válaszokat adnak.

textm5.jpg

Feldolgozás folyamata

Az üzleti életben komoly versenyelőny generálására alkalmas szövegbányászati megoldásokat más területeken dolgozó szakemberek is sikerrel használhatják fel munkájuk során. A gyógyszeriparban, vegyiparban, orvostudományok területén dolgozó tudósok, kutatók például vizsgálati dokumentumok, zárójelentések, receptfelírási szokások elemzését, kémiai és orvosbiológiai adatbázisok közötti kapcsolatok feltárását, a hatalmas mennyiségű, elektronikus formában rendelkezésre álló szakirodalom szövegeiben fellelhető összefüggések feltárását végezhetik el a TextMining alkalmazások segítségével. A biztonság és bűnüldözés területén a szakembereknek esetenként több ezer oldalnyi szöveges dokumentumból kell összefüggéseket feltárniuk ügyek, személyek, szervezetek vagy embercsoportok között, amely feladat szintén gyorsabb és költséghatékonyabb lehet a szövegbányászat segítségével. Az ilyen alkalmazások számos területen hatékonyan használható intelligens elektronikus nyilvántartási, könyvtári rendszerek létrehozását és alkalmazását is lehetővé teszik.

A közigazgatásban, termelésben, kereskedelemben és egyéb területeken működő cégek közül egyre többen üzemeltetnek az ügyfélszolgálati feladatokat korszerűen ellátó call centereket. Ezek a rendszerek lehetőséget adnak arra, hogy a beszélgetésekről rövid, szöveges feljegyzések készüljenek, amelyek információtartalma szövegbányászattal rendszerezhető és feldolgozható. A most még dokumentumtárakban „heverő" rögzített hangfelvételek pedig máris egy újabb technológia, a szövegbányászat alapjait alkalmazó „hangbányászat" (Voice Mining) már zajló tökéletesítésére várnak. Az emberi beszéd sajátosságaiból adódóan ennek az eljárásnak a szövegbányászathoz hasonlóan megbízható működése még bizonyára várat valamelyest magára, ám hamarosan új dimenziókat nyithat az strukturálatlan hanginformáció felhasználásában és feldolgozásában. A két technológia összekapcsolásával lehetőség nyílt az ügyfelekkel folytatott ügyfélszolgálati beszélgetések értelmezésére, problémás beszélgetések felderítésére. Szövegbányászat segítségével megállapítható az egyes hívások témája, mely nagymértékben hozzájárulhat az ügyfelek lemorzsolódásának előrejelzéséhez, az ilyen esetek kezeléséhez.

Az elektronikus kommunikáció és információáramlás világában, és az ilyen megoldások felé mutató hangsúlyeltolódás felgyorsulását tapasztalva a gazdasági élet, a közigazgatás, az egészségügy piacán dolgozókhoz hasonlóan minden, a fogyasztók, ügyfelek kegyeiért, és hatékonyabb, gyorsabb kiszolgálásáért és megtartásáért küzdő vállalatnak és szervezetnek érdemes lenne tehát elgondolkoznia. Az egyre hatalmasabb mennyiségű, elektronikus formában elérhető szöveges információ strukturált, gyors, és költséghatékony feldolgozásának lehetőségét kínáló szövegbányászati megoldások informatikai struktúrába való integrálása rövid, és hosszútávon egyaránt valós versenyelőnyt, költségmegtakarítást és az ügyfélkezelési rendszer tökéletesítését jelenti.