Uutiset:

Outomaa on outo maa.

Mobiili päämenu

Hakukoneet - uusia tuulia

Aloittaja Aakku, 13.11.08 - klo:08:38

« edellinen - seuraava »

0 Jäsenet ja 1 Vieras katselee tätä aihetta.

Aakku

Ammattilaisen sana painaa
Hakukone, jossa asiantuntija voittaa linkin


Reference Extractin ideana on antaa ammattilaisten painottaa hakutuloksissa löytyvien sivujen arvo.

http://www.digitoday.fi/tiede-ja-teknologia/2008/11/13/hakukone-jossa-asiantuntija-voittaa-linkin/200829415/66

Googlen mielestä parhaat sivut ovat niitä, joille linkataan eniten. Reference Extract uskoo, että parempi tulos saavutettaisiin, jos asiantuntijat saisivat arvioida linkattavien sivujen laadun.

Ei ole vielä toiminnassa - kokeilin muutamia harvinaisempia hakusanoja, jotka esim. Google ohjaa lähinnä "hömppätotuussivustoille" -->

Alkuvaiheissaan olevan hakukoneen käyttämät asiantuntijat ovat kirjastojen informaatikkoja, koska heillä on sopiva koulutus ja ihmiset luottavat heihin tiedonlähteinä. Tarkoituksena ei ole olla maailman nopein tai kattavin hakukone, vaan toimia luotettavana tiedonlähteenä.

Käpyinstituutin kirjaston hakupalveluita ei kotoa pääse käyttämään tietoturvan vuoksi - kansainvälisten tietokantojen käyttöoikeus maksaa kuulemma sellaiset liki parisataatuhatta euroa vuodessa, mutta niissä ei sitten ole mitään huuhaata mukana. Tällä systeemillä, että vain FUNET:ssa olevat yhteisöt ja niiden jäsenet pääsevät työkoneiltaan näitä käyttämään, karsitaan pois nk. vapaamatkustajat ja samalla pidetään koko FUNET nopeana kun siellä ei hengaile asiaankuulumatonta väkeä.

Semanttiset hakukoneet ovat tulossa ja syrjäyttänevät vähitellen Googlen tapaiset "tyhmät" hakukoneet - esim. Googlessa hakukone ei ymmärrä useamman sanan yhdistelmän sanojen keskinäisiä yhteyksiä, vaan antaa usein aivan irrationaalisia tuloksia ... ei sinnepäinkään, mitä etsii.

"Semantiikan kerrokset

Semanttinen web koostuu olioista, joiden väliset suhteet on määritelty. Olio voi olla esimerkiksi dokumentissa esiintyvä käsite tai kuva. Oliot yksilöidään merkitsemällä ne uri-tunnisteilla (uniform resource identifier). Koska kuvaukset perustuvat sanojen sijasta käsitteisiin, saadaan eroteltua esimerkiksi samalla tavalla kirjoitettavat, mutta erimerkityksiset sanat.

Dokumentin osien merkitsemiseen käytetään xml-metakieltä, joka on oikeastaan joustava kielioppi rakenteisten dokumenttien määrittämiseen. Xml-dokumenttien rakenne ja käytettävät elementit määritetään xml-skeemoilla.

Olioiden väliset suhteet kuvataan xml-kieleen perustuvalla W3C:n standardoimalla rdf-tietomallilla (resource description framework). Rdf tarjoaa vain yleiset säännöt suhteiden kuvaamiseen, suhteiden tarkemmat tyypit kuvataan rdf-skeemoilla. Rdf-skeemoilla luodaan sanastoja, jolla voidaan ilmaista resurssien välisiä suhteita hieman vastaavaan tapaan kuin olio-ohjelmoinnissa.

Yleisen rdf-mallin lisäksi tarvitaan menetelmä jolla esittää tarkempia aihekohtaisia sanastoja. Sanastojen määrittelyyn kehitetty standardoitu owl-kieli (web ontology language) käyttää sekä uri-tunnisteita että rdf:n teknisiä puitteita, mutta tarjoaa lisää tapoja ominaisuuksien ja luokkien kuvailemiseen. Rdf:n ja owl:n ansioista eri alueiden ontologioita ja metatietoja voidaan yhdistellä semanttisella tasolla.

Sparql on standardoitu rdf-muotoisten tietojen kyselykieli. Sen avulla voidaan kehittää sovelluksia, jotka hakevat tietoa verkosta käyttäen yhteistä protokollaa.

Olioiden hyödyntämistä koskeva tietämys ei ole ontologista, vaan toimintaa ja loogista päättelyä olioiden välisistä suhteista ja prosesseista. W3C:n piirissä valmistellaan parhaillaan loogisen tason standardeja, jotka sijoittuvat käsitteellisesti ontologiatason yläpuolelle (kuten päättelysääntöjen merkkauskieli ruleml, rule markup language).
"


Esimerkki Googlen hakualgoritmien alkeellisuudesta on juuri vähänkään erikoisemman sanan "korvaaminen" yleisemmin käytetyllä - esimerkkinä uudesta nisäkäsnimistöstä muuan myyrälaji ... isokultiainen --> mitä tekee Google : kysyy "Tarkoititko isokullinen"  :D

Sinällään Googlen ehdotukset ovat usein aivan älyttömiä - kai käyttäjä itse parhaiten tietää, mitä on hakemassa ... tai no, ehkä eivät sittenkään kaikki ...

ville

Googlen ehdotukset ovat paikallaan, jos hakee ulkomaan kielellä jotain asiaa, eikä ole varma miten sana tai nimi kirjoitetaan. Varsinkaan englannissa ei paljon logiikkaa ole oikeinkirjoituksen suhteen.

Aakku

Lainaus käyttäjältä: ville - 13.11.08 - klo:21:14
Googlen ehdotukset ovat paikallaan, jos hakee ulkomaan kielellä jotain asiaa, eikä ole varma miten sana tai nimi kirjoitetaan. Varsinkaan englannissa ei paljon logiikkaa ole oikeinkirjoituksen suhteen.

Tuossa tapauksessa se ehdotus "Tarkoititko ..." ehkä on paikallaan - tässäkin tulee se semanttisten kerrosten puute. Hakukoneeseen syötetty ohjelma ei "ymmärrä" sanojen asiayhteyksiä. Esimerkiksi hakusanayhdistelmä "diffraction in point source holograms" ei tuota sivuja, joilla tästä nimenomaisesta asiasta kerrottaisiin [ei niin, ettenkö tietäisi hakemattakin, mistä on kyse :)], vaan sivuja, joilla sana tai pari noista esiintyy ...

Yhtä sanaa - esimerkiksi "hologram" - tarjotessa hyvällä tuurilla saattaa jopa löytää jotain ... tässä kokeilussa tuli mm. tämä sivu :

http://en.wikipedia.org/wiki/Holography

joka on aivan kohtalaisen tyydyttävä selvitys asiasta.

Nuo useamman sanan haut alkavat varmaan toimimaan paremmin, kunhan se semanttinen hakukone saadaan valmiiksi ja / tai se ammattilaisten informaatikkojen tekemä luokittelu johonkin hakukoneeseen - Google ei ole ainoa hakukone, joka kärsii samasta ongelmasta. Ask, Altavista ja AllTheWeb toimivat samanlaisella "logiikalla" ...

Toivottavasti tuo avauksessa mainitsemani Reference Extract tulee pian käyttöön :)

Ai niin : Joskus ex-naapurini kanssa oli puhetta piilukirveestä ja päättelimme, että piilu on ilmeisesti veistetty hirsi, kuten onkin - sana "piilu" syötettynä Googleen antoi : "Tarkoititko : pillu" ... nyt, kokeilin, se ei enää tee tätä kysymystä.

ville

Aakku, oletko kokeillut lainausmerkkejä noitten useampisanaisten hakujen ympärillä? Pitäisi toimia paremmin.

Aakku

Lainaus käyttäjältä: ville - 14.11.08 - klo:10:45
Aakku, oletko kokeillut lainausmerkkejä noitten useampisanaisten hakujen ympärillä? Pitäisi toimia paremmin.

:) Olen, muttei se paremmin toimi - dokumentissa pitää silloin esiintyä ne sanat juuri siinä kirjoitetussa muodossa --> parhaiten tyo toimii nimien yhteydessä ... esimerkiksi "erwin schrödinger" tuottaa ko. maineikkaan tutkijan henkilöhistorian, Wikipedian artikkeli ensimmäisenä ...

Esimerkkihaku ja Googlen vastaus : "Ei tuloksia hakusanoilla "diffraction in point source holograms".

Tulokset haulle diffraction in point source holograms (ilman lainausmerkkejä):
"

Tuo ilman lainausmerkkejä tuottaa sivuja, joista ei tule hullua hurskaammaksi  >:( ... tunnen kyllä asian, mutta juuri siksi tuota kokeilinkin  :P

Työpaikalla, kirjaston palvelimen kautta, löytyy jo sitten nk. jämerämpää oppiakin. Nyt vielä kotona ja suunnittelen työpaikallelähdön valmistelun esivaiheita ... pitäisi tavata muutamia kollegoita nykyisten häröjen "uudistusten" merkeissä - näitä on mm. "opetuksen fokusointi ja virtaviivaistaminen" ... hienoja sanoja, mutta sisällöttömiä ja tuskin niiden kirjoittajakaan tajuaa, mitä tarkoittaa  ;D

Itse olen ajatellut, että akkumuloin resursseja kontekstuaaliseen ja integroituun oppimiseen käyttäen interaktiivisuutta ilman opiskelijoiden sanktioiden pelkoa. Tai jotain muuta bullshittia ...


ville

Kokeile laittaa "point-source hologram" lainausmerkkeihin ja diffraction niitten ulkopuolelle. Näissä pitää useinkin kokeilla eri vaihtoehtoja. Jos hakukoneen logiikka ei riitä, on käytettävä luomua.

ville

Google cheat sheet: http://www.googleguide.com/cheatsheet.html

Siellä esimerkiksi hakusanat books "Alice in Wonderland" antavat tuonnimisiin kirjoihin liittyvää infoa. Aakun aiheeseen taas diffraction "point-source holograms" antaapi tämmöisiä linkkejä:
http://www.google.co.uk/search?q=diffraction+"point-source+holograms"

Toimii minusta hyvin. Tieteellinen erikoishakukone on tietty tuo Scirus, mutta Google ajaa minusta nykyisin melkein saman asian.
Käpyihin liittyviä hakuja voinee kokeilla tästä: http://www.pro-physik.de/Phy/findmenu.do?mid=0

THL tiedottaa

Google on ihan p-ska! (Täydennä ite!)

Helvetti, kun jotain hakee, tulee päällimmäiseksi niiden yritysten mainokset, jotka on eniten maksaneet tälle p-keleen Googlelle!

Ja siinä se kolmikko sitten nököttää aina vain ensimmäisinä, vaikka katsoisi toista, kolmatta tai ihan mitä tahansa haussa tullutta sivua.







Ei noista muiden puheista kannata välittää.

Aakku

Lainaus käyttäjältä: ville - 14.11.08 - klo:13:12
Google cheat sheet: http://www.googleguide.com/cheatsheet.html

Siellä esimerkiksi hakusanat books "Alice in Wonderland" antavat tuonnimisiin kirjoihin liittyvää infoa. Aakun aiheeseen taas diffraction "point-source holograms" antaapi tämmöisiä linkkejä:
http://www.google.co.uk/search?q=diffraction+"point-source+holograms"

Toimii minusta hyvin. Tieteellinen erikoishakukone on tietty tuo Scirus, mutta Google ajaa minusta nykyisin melkein saman asian.
Käpyihin liittyviä hakuja voinee kokeilla tästä: http://www.pro-physik.de/Phy/findmenu.do?mid=0

:) Kokeilin ja antaa tuo tsydeemi parempia tuloksia --> tosin lähinnä julkaisujen abstrakteja ja sitten jos haluaa itse julkaisun on maksettava ... useissa oli hinta $15  >:( - no, ilmaisia eivät ole Käpyinstituutin kirjastonkaan palvelimella tehdyt haut. Paitsi käyttäjälle - K-inst. maksaa muistaakseni liki parisataatuhatta euroa vuosittain oikeudesta päästää työläisensä lukemaan [helvetin] kalliiden julkaisusarjojen sivustoja ...

Lainaus käyttäjältä: se - 14.11.08 - klo:14:56
Google on ihan p-ska! (Täydennä ite!)

Helvetti, kun jotain hakee, tulee päällimmäiseksi niiden yritysten mainokset, jotka on eniten maksaneet tälle p-keleen Googlelle!

Ja siinä se kolmikko sitten nököttää aina vain ensimmäisinä, vaikka katsoisi toista, kolmatta tai ihan mitä tahansa haussa tullutta sivua.

Niih, kun firma maksaa Googlelle, saa oman sivustona asian hakujen kärkisijoille - samaa on uutisten mukaan tulossa myös Youtubelle. Sinne tulee leffoja ja maksamalla Y:lle saa firma leffansa sielläkin hakusissa paremmin näkyville. Raha sielläkin puhuu, jatkossa.

Pikavastaus

Varoitus: tähän aiheeseen ei ole vastattu yli 356 päivään.
Jollet ole varma, että haluat vastata juuri tähän, harkitse uuden aiheen aloittamista.

Huomioi: tämä viesti näytetään vasta, kun valvoja on sen hyväksynyt.

Nimi:
Sähköposti:
Varmistus:
Ole hyvä ja jätä tämä laatikko tyhjäksi:

Oikotiet: paina ALT+S lähettääksesi viestin tai ALT+P esikatsellaksesi sitä