Kezdőoldal Cégünkről Referenciák Szövegbányszat az ArtHour Kft.-nél
Szövegbányszat az ArtHour Kft.-nél
Szövegbányszat az ArtHour Kft.-nél

Az ARTNET Képzőművészeti Portál és Folyóirat bemutatása

1. ábra: Az ARTNET Képzőművészeti Portál és Folyóirat adatbázisai

Napjainkban, amikor az Internet mind nagyobb szerepet tölt be a kommunikációban és a kultúrában egyaránt, akkor egyértelműen szükség van a magyar képzőművészeti értékek bemutatására a világhálón keresztül is, hiszen a felgyorsult és elfoglalt életmód sokaknak nem teszi lehetővé a magas színvonalú kultúra befogadását (nyitvatartási idő, helyhez kötöttség).

Az ArtHour Net Független Tanácsadó Kft. az internet adta lehetőségeket kihasználva közvetlen kapcsolódási pontot kívánt létrehozni a képzőművészet és az iránta érdeklődők között. Az elmúlt hat év során ilyen ponttá vált az ARTNET Magyarország legteljesebb képzőművészeti portálja és virtuális folyóirata. Az ide látogatók egy helyen megtalálnak minden információt (kiállítások, árverések, múzeumi anyagok, jogi háttér, szakszótár, restaurátorok, árverezőházak listája, stb.) a képzőművészetről és néhány társművészeti ágról: fotóművészetről, dizájnról, építészetről, ipar- és népművészetről.

Az ARTNET archívumában jelenleg közel 12.000 hír található hat évre visszamenőleg. Kéthetente háromezer olvasójuk figyelmét hívják fel a honlapon megjelent legfontosabb kiállításokra, eseményekre, pályázatokra rendszeresen megjelenő hírlevél formájában.

2003. decemberétől 2007. februárjáig a portál a Nemzeti Kulturális Örökség Minisztériuma - ma Oktatási és Kulturális Minisztérium - kulturális portáljának (www.kultura.hu) képzőművészeti tartalomszolgáltatója volt.

2005. januártól a folyóirat angol verzióval bővült. Ebben az évben a Magyar Tartalomipari Szolgáltatók Szövetsége eFestival Hungary 2005 pályázatán a ARTNET elnyerte a "A magyar kulturális örökség digitális megőrzése” nevezési kategória első helyezését.

2007. januártól kulturális rovattal bővült a portál, amelyben az olvasók zenével, kortárs- és klasszikus táncművészettel, színházzal, irodalommal kapcsolatos híreket, interjúkat, riportokat, ajánlókat, kritikákat olvashatnak.

Az ARTNET oldalait rendszeresen szemlézi az Observer Médiafigyelő.

Az ARTNET cikk-adatbázisa

Napilap formátumban működő, naponta legalább hat új, a kultúrához kapcsolódó hírrel, fotóillusztrációval frissített újság (NKÖM engedélyszám: 2.2.4/887/2001.) magyarul és angolul. A nyitóoldalon egyszerre tizenkét hír címe és rövid összefoglalója látható, az egyes hírek végén található fehér háromszögre történő “klikkeléssel” az adott hír teljes szövege is megjelenik egy új ablakban. A nyitóoldal mögött még két híroldal (az oldalak alján nagy nyíl jelzi a továbblépési lehetőséget) található szintén 12-12 cikket tartalmazva. Az összesen 36 cikk 10 napig olvasható, utána az archívumba kerül, amelyben keresőszó megadásával lehet kutatni.

Elemzések PASW Modeler (SPSS Clementine) szövegbányász szoftverrel

Az ARTNET cikk-adatbázisán végzett elemzésekkel azt szeretném bemutatni, hogy programozói ismeret nélkül, csupán informatikai jártassággal is lehet szöveges adatbázison elemzéseket végezni a szerkesztőségi munkát támogatva.

Az elemzésekhez egyszerű Word dokumentumokat használtam, tehát nem volt szükség különleges adatbázisok előállítására. A file-könyvtárban lévő szöveges dokumentumok beolvasása és a modell felépítése (2. ábra) után a program az adatbázist szavakra és kifejezésekre bontotta, amelyet táblázatos formában jelenített meg (3. ábra). Az alkalmazás a szövegkörnyezetből kiindulva olyan szókapcsolatokat határozott meg, amelyeket értelmüknél fogva összetartozónak vélt. A kapott eredményt megvizsgálva elmondható, hogy a választás csaknem minden esetben tökéletes, hiszen az "az utóbbi tíz évben”, vagy a "Kerekes Gábor” kifejezések szavai valóban együtt hordozzák a kívánt információt.

2. ábra: Az elemzés kezdeti modellje

3. ábra: A modell kimeneti képernyője

A következő elemzésnél arra voltam kíváncsi, hogy az ARTNET cikkeiben szereplő szavak milyen gyakorisággal fordulnak elő a teljes adatbázisban. Az újabb modell megalkotásánál felhasználtam az első stream-et, ezt fejlesztettem tovább.

4. ábra: Az elemzés második modellje

A kimeneti képernyőn jól látszik, hogy a program szavanként megvizsgálta az adatbázist, s hogy megpróbálta bekategorizálni őket. Mivel a szoftver magyar nyelvre való átalakítása még folyamatban van, "Budapest”-en kívül nem ismert fel egy helyszínt, nevet, szervezetet, terméket (dátum nem szerepel az adatbázisban, ezért erre a kategóriára nem is adhatott volna helyes találatot).

5. ábra: Második kimeneti képernyő

Az egyes cikkek kategorizálásából elkészültek a cikkek egyedi profiljai. A szerkesztési alapelveink szerint 10 napon belül nem jelentetünk meg ismertetőt ugyanarról a galériáról, kiállítóhelyről - még ha időközben új kiállítása nyílt is. S törekszünk arra, hogy hasonló típusú híradás se jelenjen meg 10 napon belül. Éppen ezért a kulcsszavas kereséssel önmagában nem tudjuk kiszűrni az azonosságokat, de a Clementine által generált profilok segítségével már megoldjuk a problémát.

Budapest, 2007. április 28.

Makay Erika
ArtHour Net Független Tanácsadó Kft