Közös konferenciát szervezett a Magyar Információbrókerek Egyesülete (MIBE) és az Online Fejlesztők és Felhasználók Meetup (MeetOFF), ahol elsősorban az adatbázisok témakörét járták körbe. Vendége volt a délelőtti konferencián többek közt adatbányász, CRM tanácsadó, blogger. Az előadásokról, a kerekasztal-beszélgetésről és a jogi adatbázisok keresési problémáiról szóló workshopról percről-percre tudósítottunk. 10:15 Mikulás Gábor a Magyar Információbrókerek Egyesületének nyitotta meg a konferenciát. A mai témát egy cikk ihlette, mely arról szólt, hogy állami adatbázisokból hogyan lehet strukturáltan kinyerni fontos információkat bizonyos csoportok számára.
10:23 Miskolczy Csaba: Mi újság a Szilícium Völgyben?
Az információbrókerek szempontjából is fontos lehet, hogy mi történik Amerikában és milyen új vállalkozások alakulnak, melyek később Európába is betörhetnek. Mi a közös a Greplin, Milk, Talkbin, Google, GroupOn, Twitter vállalkozásaimban? A „garázs” – summázta Mikulás Gábor, amit az előadó részben megerősített, és hozzátette, hogy mindannyian startupok. Mindegyik esetében látszik az innováció. Bár a startup fogalmat nem nagyon szokták definiálni, most már az sem igaz, hogy feltétlenül az internethez kötődik.
A startup szó korábban is létezett, csak mást jelentett. Régebben kezdetben a cégek a seed / magvető kategóriához tartoztak, és általában egyáltalán nem kaptak támogatást. Aztán angyalok elkezdték támogatni a jobb ötleteket, és létrejött az EU által alapított Jeremie program. Sikernek az számított, ha egy befektető felvásárolta őket. Tőzsdére féltek menni, mert nem voltak beárazva ezek a jellegű cégek.
2011-ben átalakult ez a rendszer. A garázscéges irányon belül megjelentek a „mezítlábas srácok”, akik bemennek a befektetőhöz, és azt mondják, hogy megváltják a világot. Ezután jön csak a seed fázis. A Szilícium Völgyben már ki is szoktak írni pályázatokat, hogy megtalálják a kreatív fiatalokat. Komoly inkubációs szisztéma jött létre. Mostanában a mobilapplikációk a hajtóerő, még az iparág is most fejlődik ki. A Microsoft is még csak most indult ezen a területen a Mango-val. Egyre inkább a social media-ról beszélnek – amit inkább néven szoktak nevezni, pl. Twitter, Facebook (és ezekből a nevekből nincs túl sok, a másod-harmad vonalról elfelejtkeznek). Elindult a Second Market jelenség, pl. itt tudtak az oroszok bekerülni a Facebook-ba, amit ráadásul egy magyar képvisel, de nem akartak a menedzsmentbe beszállni.
10:30 A LinkedIn kibocsátása óta beszélünk IPO-ról is (= tőzsdére bevezetés). Ők sem tudták, mi ennek a jelentősége, most jelennek meg a Valley-ből induló sikeres cégek a tőzsdén.
Ha egy jó inkubátorba bekerülünk (3-6 hó), akkor gyorsan juthatunk pénzhez. Azt mindenki elfogadja, ha tervként bemutatunk egy jó webes alkalmazást, ekkor bejuthatunk az angyal vagy seed fázisba (1-2 év). Utána következik a Series „A” (1-3. év, 500 k-2m usd), majd a Series „B” és series „C”. Így vezet az út a tőzsdéig.
10:38 Taxonómia, folkszonómia, címkézés, tudásmenedzsment, szemantikus web. Ezek voltak a kulcsszavak nagyjából 2008-ban. Ma pedig leginkább a Social Media-ról beszélünk. Nagy hangsúlyt fektetnek az „engagement”re, vagyis a felhasználó minél nagyobb szintű bevonására. Újra megjelentek a kliens alapú programok, lásd Dropbox. Trendi még az Augmented Reality, de nem tudni meddig tart, néhányan óvatosan kezelik. Kicsit retro pl. a Quora, ami nagyon népszerű most a Valley-ben.
20:42 Felsorolta, hogy kik lehetnek a magyar információbrókerek számára fontos cégek: Radian 6 (2006), Dropbox (2007), Greplin (2010), Memolane (2010), Beluga (2010). Magyarországon is úgy lehet bekerülni a köztudatba, hogy részt veszünk startup versenyeken.
20:49 Nagy sláger még a Milk, melyet Kevin Rose alapított többek közt. Azt is megtudtuk, hogy Ashton Kutcher szinte minden startup-ban benne van, és mindenki ezen „poénkodik”. Már Lady Gaga is elkezdett beszállni startup-okba. Javasolta még a Greplin és TalkBin megtekintését. De hozzáfűzte, hogy szinte minden héten tudna mondani valami érdekes, megjelenő startupot. Jó gyűjtemény http://wiki.kenburbary.com
10:52 Felsorolta a magyar közösségi rendezvényeket is, pl. SUU, EPC, Jeremie 40 mrd, Startup Weekend. Megindultak itthon az inkubációs cégek. Az új információkat ezen a blogon publikálják http://insider.ruul.hu
10:54 Mikulás Gábor: 2.0 az adatbázis szolgáltatótól: fejlesszen alkalmazásokat a használó!
Megjelenik a Pr és fejlesztés kiszervezése. Még a „hagyományos világból” a Procter & Gamble a K + F több mint 50%-t tartja a cégen kívül. Az Apple Store-t sokan ismerhetik, ahol különböző alkalmazásokat találhatunk.
10:57 A használóknak egy platformot biztosítanak, ahol az értéket maguk a használók adják. Pl. az Elsevier adatbázis a tudományos tartalmakat egy platformon kínálja (Hub: Science Direct, Scopus, SciTopics, Web/3d Party Content). Felhívják a figyelmet alkalmazások készítésére, bár azért mind nem kerül ki onnan. A SciVerse Application Beta helyen találhatók az applikációk, ahol tesztelhetjük őket.
11:00 Többféle alkalmazás található a kínálatban: együttműködést támogató (kutató a kutatóval), elemzés (nyers adatokból felfedezéseket tenni), keresés és menedzselés (megfelelő formátumra alakítás).
11:05 A fejlesztő csapatok támogatására a Software Development Kit-et hozták létre. Lehetőség még a cobarnding, piacismeret, tesztelői tábor és bevételi lehetőség.
11:10 Gáspár-Papanek Csaba: Adat- és szövegbányászati megoldások webes adatok felett
Először a DMLab Adatbányászati Műhelyet mutatta be, mely a BME – TMIT csoport köré szerveződött szakmai közösség. Szerveznek versenyeket, tartanak tanfolyamokat stb. és hozzájuk kötődik a http://adatbanyaszat.blog.hu oldal is.
11:12 Maga az adatbányászat szó használata folyamatosan csökken. Fontos betartani az Üzleti Intelligencia 8 lépcsőjét (standard riport, Ad-hoc riport, OLAP, riasztások, statisztikai elemzés, forecasting, adatbányászat = prediktív modellezés, optimalizálás). Itt fel is hívta a figyelmet, hogy bár nálunk az intelligencia okosságot jelent, de ebben az értelemben inkább „hírszerzés”, adatokból információ kinyerése. Az adatbányász személyes tudása annyira fontos, hogy hiába veszünk el tőle minden elemzést, de csak akkor tudunk elvenni tőle minden információt, ha lenyilazzuk, ahogy régen Attilával tették.
11:18 Megemlítette a sentiment analysis-t (véleményelemzés), ami azért is nagyon nehéz, mert a magyar nyelv nagyon változatosan tud szidni. Első nagy hulláma a fórumok világában volt, második virágkorát éljük a social media-ban.
11:22 A dokumentumok osztályozásáról beszélt ezek után, a dokumentum klaszterezés automatikus csoportosítással történik. Szavak között különböző asszociációkat lehet találni. Megtalálhatjuk azokat a kommentelőket, akik a leginkább felkapott szavakat generálják. Pl. legutóbb a twitter és tőzsde kapcsolatával is foglalkoztak, mert vannak olyanok, akik már egy nappal előtte érzik a trendeket. Adatbányászati módszerrel kapcsolati hálókat is jól lehet építeni. Pl. ha valaki lopja a gázt, akkor érdemes a Facebook-os ismerőseiket megnézni, mert minden bizonnyal ők is lopják.
11:26 A munkákat segíteni tudják pl. ezek az alkalmazások:
- Analytics for Twitter (Excel kiterjesztés, mely témába vágó twitteket elemez ingyenesen, összeállíthatjuk a listát melyik szó mennyire pozitív vagy negatív, forrás: biprojekt.hu),
- másik véglete az R programozási nyelv (sok gépi tanulási lehetőséget tartalmaz, viszont tipikusan parancssoros módból lehet használni),
- RapidMiner (adat és szövegbányászati módszerek, üzleti célra is ingyenesen)
- RapidAnalytics (kliens szerver környezeti)
- Radoop (memóriakorlátot feloldja, Big data – Hadoop klaszter)
- RapidMiner Marketplace (RCOMM 2011) – jelenleg még csak ingyenes megoldások tölthetőek le.
11:34 Rátért a fizetős adatbányászati megoldásokra, melyekről azért nem beszélt sokat, mert irreálisan drágának tartja őket. Fizetős szoftverek: IBM SPSS Modeler, SAS Enterprise stb. Végül a „lelkesedésünk szerette volna letörni” azzal, hogy ez nem varázsdoboz, többet nem lehet kihozni belőle mint amennyi. Ajánlotta a CRISP-DM http://crisp-dm.org oldalt (innen tölthető le az ajánlott szabvány is) és hogy használjuk a szakmai fórumokat.
11:40 Kérdésre elmondta, hogy fizetős megoldásokban kis mélységű algoritmusok vannak, de ki vannak élezve „hülye-biztosra”. Tehát kapunk egy eredményt, nem tudjuk honnan, de nagyjából jók ezek. Vannak olyan esetek, mikor csak új algortimussal tudunk megoldani valamit, ehhez ajánlja az open source lehetőségeket. Ugyanakkor a futásidővel szoktak problémák lenni, viccesen megjegyezte, hogy nem kellene publikálni azokat az algoritmusokat, amire 2-t kapott valaki az egyetemen. Viszont a RapidMiner mögött például ellenőrzött dolgok állnak.
11:45 Kávészünet
12:17 Apró Antal: Káosz a struktúra mögött
Felhasználóként sokat foglalkozik adatbázisokkal, melyek sokszor önmagukban nem strukturáltak. Pl. mikor egy cégnél dokumentumkezelő rendszert kezdenek használni, akkor nagyon sokat foglalkoznak annak kialakításával, hogy jól elrendezzék a dokumentumokat, de ez nem mindenhol van így. Általában egy adott témáról keres információt, amik nincsenek összegyűjtve.
12:23 Fontos az információ kivonatolás szövegekből, tartalmi keresés az adatbázisokban, kategorizálás, automatikus címkézés, nyelvkezelés, egyidejű keresés különböző adatbázisokban. Ezeket nevezte „hidaknak” a két világ között. Egy információkereső-rendszernek több mindenre rá kell látni a szervezeten belül.
12:24 Bemutatott egy példát, amit a Közbeszerzési döntőbizottságnak végeztek. A háttérben történt, hogy az adatbázis oldalon tudták, hogy a dokumentum a „jogi osztálynál van” és „tavalyi” és ezt kombinálták a szövegbányászattal. A felhasználó újfajta kategorizálási struktúrát látott, pedig az adatbázisban nem történt változás, csak bevezettek egy új szempontrendszert. Azon dolgoznak, hogy más adatforrások is bevonhatóak legyenek.
12:30 Visky Máté: Social CRM – nagyvállalati megoldások
Mikulás Gábor felkonferálásában felvetett egy alkalmazást, mely az arcunkat beszkennelve, az internet segítségével tudja a múltunkat és valószínűleg a jövőnket is megjósolja majd, mert a kutatások abba az irányba mutatnak (ajánlott Barabási Albert László: Villanások c. könyve – szerk.).
12:35 Az előadó tipikus sales-es stílusban reagált Gáspár-Papanek Csaba előadására, aki az open source alkalmazásokat ajánlotta mondjuk az Oracle helyett, ahol az előadó dolgozik.
12:38 Röviden vázolta a CRM történetét 1990-től kezdve (Értékesítés támogatás Sales Force Automation), majd több lépés után eljutottak a nagyvállalatok a Social CRM-ig. Itt emlegette a híres „Csörögjetek ránk!” Vodafonos történetet. Majd ajánlotta a TED-es videókat is.
12:44 Otthoni gépén és a munkahelyin is rákeresett a „social CRM” szóra, és más sorrendet kapott a találatokban.
12:45 Ezután szemléltette, hogy hiába vásárol valaki többet az Oracle-nél, nekik fontosabb az, aki talán kevesebbet vásárol, viszont sok emberre van hatással („influencer”). Például kitwittel valamit az Oracle-ről, ami sok emberhez jut el, és tudja őket befolyásolni. Megemlítette Barack Obama-t social választási kampánya miatt.
12:48 Az adatok felhőben tárolásától még sokan megrettennek, mert a munkájukat féltik, de biztosan egyre jobban terjedni fog. Tudják figyelni, hogy ki mond róluk pozitívumot, és ez alapján jutalmazni tudják valahogy.
12:50 A real time decision a kampányolás mai gyakorlata. Régebben voltak ügyfelek, termékajánlatok és szegmentációk, ami alapján a kampány működött. A mostaniak közül példaként említette a Verizon, bwin, amazon.com cégeket, ahol azonnali döntéshozó rendszert használnak.
12:56 Merre fejlődik a CRM? Van, ahol jelentkezésként LinkedIn profilt kértek, mert az nagyon hiteles tud lenni, ha régóta töltjük információkkal. A nagyvállalatok egyre többet tudnak rólunk, hogy egyre több olyan dolgot vegyünk, amit ők forgalmaznak. Az „Ügyfél kezelt kapcsolatokra” ajánlotta a http://glassdoor.com -ot. „Ami digitális, az nem személyes többet” – hangzott el a Social Network c. filmben, és ez szerinte így is van.
13:00 Másképpen kell megszólítani a különböző generációkat. A real time decision jól működik az x és y generációnál, viszont a Boomer generációnál nem. A dellcares 6882 üzenetet fogadott összesen twitteren. Ez nem azt jelenti, hogy rosszul működik a nagyvállalatoknál a social media, csak jól kell tudni használni.
13:04 Mikulás Gábor figyelmeztette az előadókat, hogy az Observer digitalizálja szövegesen az elhangzott előadásokat, amit utána lehet elemezni adatbányászati módszerekkel. Dóka Attila bemutatta pár szóban magukat.
13:07 Mázsás Istvánelmondta a közönségnek, hogy milyen lesz a délutáni workshop és kik lesznek az esti MeetOFF előadói.
13:09 Ebéd
14:15 Hidvégi Péter: One stop shop koncepció aggregált üzleti hír- és adatforrások
Egy cég adott helyen többféle dolgot szolgáltat – kezdte az előadó rövid definíciókkal. Pl. ha egy bankba megyünk, akkor többféle dolgot tudjunk intézni. Abba a hibába is lehet esni, hogy túl sok mindent szolgáltatunk egyszerre. Gyakorlatilag mindenhol ez a koncepció vesz körbe minket, pl. pláza, hipermarket, benzinkút, posta, reptér, házasságtelefonok, okostelefonok és tabletek. Ő az adatszolgáltatók-aggregátorok szempontjából vizsgálta a koncepciót.
14:20 A legismertebb hazaiak: iMédia, Observer, Híradás, Opten, Complex, ISI Emerging Markets. Lehetnek saját és külföldi források, jogtisztaság betartásáról gondoskodók, jogdíjakkal és adatszolgáltatói díjakkal foglalkozók.
14:23 Megnézhettük egy screenshottal, hogyan lehet keresni a http://www.securities.com/ oldalon. Lehet szűrni időintervallum, publikáció típusa szerint, listázza a céges profilokat. Van, amit nem tud felismerni, pl. napolajat betette az olaj kategóriába.
14:26 A személyek igényét bekódoljuk a szoftverbe, hogy milyen találatokat szeretne kapni. A személyre szabhatóság itt is működik. Beállíthatjuk miről szeretnénk figyelmeztetéseket (alert) kapni.
14:28 Időrendi áttekintést kaphattunk 1980-tól, mikor még zárt és centralizált adatbázisok voltak költséges hozzáféréssel. Az 1990-s években több szereplő is megjelent, sokan csak tartalmat adtak és a nagy szolgáltató „hátvízén” úsztak be az ügyfélhez. Az internet megjelent alternatív csatornaként, majd 2000-es években teljesen elterjedt. Megjelentek specializált szolgáltatások. 2010-ben változtak a felhasználói igények, kevesebb ideje lett mindenkinek, ezért testre szabott megoldások kellenek. Telített piacon vagyunk, ezért az ügyfelek megtartására nagy hangsúlyt kell fektetni. További testreszabások és hozzáadott értékek kellenek.
14:34 Mikulás Gábor kérdése, hogy ha ennyi adatuk van, akkor nem tudják-e megjósolni a jövőt. Hidvégi Péter elmondta, hogy van egy olyan alkalmazásuk egy üzletágban, ami megjósolja mekkora a valószínűsége annak, hogy egyik cég a másikat megvásárolja.
14:36 Sidló Csaba: Entity Resolution – azonosságfeloldás
A definíció szerint „rejtett, való világbeli entitásokhoz köthető megfigyelések csoportosítása az entitások köré” – de nem mindig könnyű ezeknek az adatoknak a csoportosítása. Példaként beírta a Google Places-be, hogy „MTA SZTAKI” de különböző eredményeket kapott annak ellenére, hogy itt csak egy dologról van szó.
14:40 Néhány gyakori hibáról hallhattunk, mert lehetnek heterogén adatforrások és elgépelések is. Sok jelzőt kell egy ügyfélhez párosítani azért, hogy azonosítani tudjuk, ami lehet természetes vagy generált. Ezek az adatok jöhetnek heterogén forrásból, pl. örökölt rendszerekből, összeolvadások miatt. Így előfordulhat, hogy egyszer már kerestünk ajánlattal egy céget, mert annak mondjuk korábbi neve szerepel az adatbázisunkban és az új nem.
14:46 Nem olyan egyszerű összevonni a duplikált ügyfeleket. Pl. kik tartoznak egy háztartásba? Lehet, hogy már elköltözött a gyerek vagy felbomlott a házasság. Lehetnek nem egyértelmű egyezőségek is, pl. nevek hasonlósága pontos egyezés helyett. Lakcímekben is ritka az egyezés a különböző leírásmódok miatt. Mindez a publikációs adatbázisokból fejlődött ki: mikor vonatkozik ugyanarra az emberre a név? (pl. Kovács Péter esetében) Ebben az esetben kapcsolatok mentén tudunk csoportosítani.
14:50 Különböző elnevezések vannak az azonosságfeloldásra, ami abból is ered, hogy több területen merült fel ennek az igénye. Kapcsolódik a klaszeterezés, adattárházak, adatintegráció, adattisztítás stb.
14:53 Már az elején különböző modellekben gondolkodhatunk: rekordok halmazaként, XML-ként vagy gráfként. Megpróbálhatjuk összevonni őket vagy csoportosítani. 6 óra alatt már fel lehet dolgozni 200 millió rekordot. Bonyolult logikákban kell gondolkodni, lehetnek hasonlóságok és átfedések is.
14:58 Többnyire egyedi megoldásokban gondolkodnak a cégek, saját heurisztikákat dolgoznak kis és egyedi algoritmusokat. Open source megoldásokon többnyire egyetemeken dolgoznak. Vannak olyan szoftverek, amik dobozos szolgáltatásként kínálják maguk mindenre megoldást kínálva, de az előadó hangján érződött a kételkedés.
Kerekasztal-beszélgetés
15:04 Két perc rendezkedés után elkezdődött a kerekasztal-beszélgetés Vadász Pál moderálásával és az előadók részvételével. Megállapították, hogy „több a vadász mint a fóka”, vagyis az itt ülők inkább adatok szolgáltatásával foglalkoznak, mint megvételével. A könyvtárosok megjegyezték, hogy vennének ilyeneket, ha lenne pénzük.
15:07 A moderátor először Sidló Csabához fordult, megjegyezve, hogy sokat hallott már deduplikációról, de még sehol nem látta alkalmazni. A SZTAKI munkatársának válasza, hogy még nincsenek „dobozos megoldások”, de egyedi fejlesztéseket végeznek. Gáspár-Papanek Csaba egy konkrét megbízásról számolt be, ahol egy megrendelő azt kérte, nyomozzák ki, hogy ki küld hivatalos céges levelet magán e-mail címre. Mire megtalálták a megoldást, addigra eltűnt az ügyfelük.
15:15 A SZTAKI plágiumkeresőjéről érdeklődött Vadász Pál, de Sidló Csaba elmondta, hogy ezt nem az ő csoportjuk fejleszti, de úgy tudja éppen bővül. http://kopi.sztaki.hu/
15:17 Ezután Vadász Pál a fogalmak tisztázására kérte meg a kerekasztal résztvevőit. Hidvégi Péter szerint az Üzleti Intelligencia elég hibás fordítás, mert hírszerzésnek kellene mondanunk. A moderátor hozzátette, hogy egy azonos alakú szóról van szó, csak magyarul mást jelent ez az értelme. A hírszerzést inkább máshoz kötjük (mondjuk kémkedéshez), és ajánlotta Mikulás Gábornak, hogy készítsenek egy szótárat. Mint kiderült a oldalon van szótár, bár nem olyan világszenzáció. Tisztázta, hogy a hírszerzés legális műfaj.
15:22 Megszólalt Ződi Zsolt is, aki elmondta, hogy külföldön rengeteg információhoz lehet hozzáférni legálisan fizetős adatbázisokból. Kicsit túlhajtottnak tartja az országban az adatvédelmi vonalat.
15:25 Németh Márton alapvető kulturális különbségeket lát Észak- és Közép-Európa között, ami szerinte történelmi dolgokra vezethető vissza. Voltak itt olyan hatalmak, akik visszaéltek az információval. Északon inkább úgy érzik, hogy az védi meg őket, ha minél több adatot nyilvánosságra hoznak, mert azzal dokumentálnak, később hivatkozhatnak rá.
15:27 Hozzátette Hidvégi Péter, hogy ő is látja ezt a különbséget: itt pl. ha valaki nyer a lottón, akkor nem mondja el senkinek. Külföldön pedig a tévében büszkén vállalják. De jónak tartja a HVG kezdeményezését, hogy a 100 leggazdagabb embert megismerhetjük. Többen nevetve hozzátették, hogy azt a 100 leggazdagabbat ismerhetjük meg, aki ezt vállalta.
15:30 Újabb fogalom-tisztázást javasolt a moderátor az adatbányászat és szövegbányászat között, mert szerinte ma is többen keverték. Gáspár-Papanek Csaba még azt is megjegyezte, hogy őt adathalásznak is szokták mondani, ami megint teljesen mást jelent.
15:33 Szóba került az open source kérdés, amihez szintén G.P. Csaba szólt hozzá, hogy az Oracle sales-ese előtt megvédje magát. Nem csak ezeket a megoldásokat tartja jónak, és nem véletlen maradtak fizetős adatbázisok is.
15:36 Átterelődött a szó az adatvédelemre és jogdíjakra. Nehéz megállapítani, hogy mi számít szellemi értéknek. Hidvégi Péter cégénél abban állapodtak meg, hogy harmadik félnek nem szabad átadni az adatokat, amiket szolgáltatnak az ügyfélnek, csak átdolgozott formában.
15:40 A céginformációs cégeket szerette volna megvédeni egy hozzászóló Mikulás Gábor egy történetére reflektálva, melyben megírták neki, hogy nem adhatja tovább az adatokat 3. félnek, miközben pont emiatt kérte. A visszaélések miatt van ez a védelem, de egyedi esetekben tesznek kivételeket, amiről érdemes szerződést kötni.
15:44 Gáspár-Papanek Csaba megerősítette, hogy vannak olyan oldalak, ahová gátlástalanul mindent feltesznek, ellenőrizetlenül és hibásan. Szoktak hozzájuk fordulni ügyfelek azzal, hogy le kellene szedetni valamit valahonnan.
15:46 Vadász Pál hivatkozott „Elektronikus röntgenszemekkel az opálos üvegzsebeken át” c. előadására, és megkérdezte a véleményünk az információ nyilvánosságáról. Ződi Zsolt szerint el kell különíteni mikor valaki ingyenesen vagy pénzért szeretne valamit szolgáltatni, botrány céljából vagy jó szándékkal.
15:55 Végül a prediktív elemzés került szóba. Állítólag van már ilyen céginformációs alkalmazás, ami hatásosan előre jelezte a változásokat.
16:00 A MIBE tagok közgyűlése következett, közben a nem-MIBE tagoknak szünet.
16:55 Ződi Zsolt elkezdte a workshopot, mely a jogi keresések kapcsán felmerülő problémákról szólt. Gyakorlati példákat hozott, melyek már felmerültek az életében. Az első példában sógornője GYES-en lévő kismama volt, akit nem szeretett volna munkahelye tovább foglalkoztatni. Ebben az esetben 4 adatbázis merül fel, melynek találatait hierarchia szerint rendezzük. A szakrendszerekben nincs találat a „GYES, kismama, felmondás” szavakra. Ennek oka, hogy van benne egy rövidítés; a kismama szót nem ismeri a jogrend és a felmondás sem értelmezhető. Valójában Gyermekgondozás céljából kivett fizetés nélküli szabadságról beszélünk. Szinonima szótár nem jó erre a célra, a buszbérlet is valójában egy személyfuvarozási szerződés fennállását bizonyítja.
17:10 Ha pontosan keresünk, akkor a Jogtár, a Magyarorszag.hu is nagyon jó találatokat ad, sőt a Jogi Adatbank relevanciaszűrést is biztosít és első találat a Munka Törvénykönyve. A Google-nél meg sem kell nyitni az oldalakat, mert már látjuk a választ. De ez hatályos?
17:11 A jog viszont tipikusan nem ilyen problémákból áll, hanem ennél sokkal bonyolultabbakból. A második példában bérelt valaki egy boltot 2008-ban, ahol metróépítkezés folyt. A főváros weboldalán az állt, hogy a metró 2010-re kész lesz, de nem lett még mostanra sem, sőt 2013-ra sem biztosan ígérnek. Kérhetünk-e kártérítést? A kulcsszó lehetne építkezés, kártérítés stb. A legtöbb találat a jogi adatbázisokban van és relevánsak. A Google-ön fórumok szerepelnek 1-3 oldalon keresztül közel sincsenek releváns találatok.
17:17 Mindenhol szükség van nyelvi átfordításokra jogi ismeretekkel: probléma, elhelyezés a jogágak között, jogszabály-helyek azonosítása, alacsonyabb szintű és másodlagos források fellelése. Feltételezik, hogy mi ismerjük ezeket a szakszavakat. A kommentárok a jogszabályok sorrendjét követik, így meg kell találnunk azt a szakaszt. A laikusok teljesen másként gondolkodnak.
17:20 Lehet egyszeri igényünk: konkrét életbeli probléma megoldása vagy egy kutatás, ahol dokumentumot hozunk létre. Vannak „tudott tételek”, ami az első példához is köthető. De van amikor nem egyértelmű, ekkor „gyűjtögetnünk” kell és mindent keresni kell, ami közelebb vihet a megoldáshoz. A legtöbb eset nem is ilyen „paradigmatikus”, hanem több dologhoz is tartozhat. Az a baj, hogy soha nem találjuk meg egy helyen a választ. A legegyszerűbb kérdésre is 2-3 hely adja a választ.
17:25 A Google korlátja, ha valaki (ügyvéd, munkaügyi szakértő) elvégezte a nyelvi fordítást. Elárulta, hogy a bolt nem kapott kártérítést, elsősorban azért, mert anyagi kártérítést szeretett volna és ehhez bizonyítani kell valahogy, hogy mekkora lett volna a forgalma és a nyeresége. Emellett vita közben fel kell készülnünk a másik álláspontjából, gond a verziókövetés is. De elismerte, hogy az interneten nagyon sok információ van, csak jól kell tudni keresni.
17:30 „Bár reménytelennek tűnik, de nem az” – mondta Szatmári Elemér kérdésére az előadó. Általában az intelligens emberek tudnak néhány jogi szót, vagy megkérdezhetjük jogász ismerősünket, hogy honnan induljunk el. Sokszor nem is az elbíráláson vitatkoznak az ügyvédek, hanem azon, hogy „ez mi”.
17:33 Néhány szó eset a precedensekről. A bíró meg tudja indokolni, hogy miért más ez az eset, mint a korábbi, de Magyarországon mondhatja azt hogy „csak”. „Érdemesebb akkor inkább szövegbányászt felfogadnunk?” – kérdezte Szatmári Elemér. És a válasz: a textretrieval valójában a jogi világban indult el. Vannak olyan cégek, melyek a mai napig csak „research”-t csinálnak.
17:43 Ződi Zsolt szerint érdelmes a szövegelemzéssel foglalkozni, mert jövedelmező szakma lesz.
17:46 Ajánlotta többek közt a http://www.birosag.hu/ oldalt ingyenes forrásként.
Habók Lilla