Preambul: Flubelii
Ma gandeam zilele trecute cat de misto sunt flubelii. Sunt pufosi, de diferite culori, sunt simpatici si te poti atasa foarte usor de ei. Tot ceea ce iti trebuie este un loc in apartament, ca sa tii unul. - Ce sunt aia flubeli?
Stati putin, cum adica “ce sunt aia flubeli?”. Nu ati auzit de flubeli? Pff…
Sa zicem ca flubelii sunt o specie exotica de pisici. Aaaa, acum mai vin de acasa? Ati facut legatura? Ati facut mostenirea de atribute de la pisici la flubeli? Deja atribuirea de “pufosi” la flubeli e normala, doar toate pisicile au blana, si implicit pot fi, sa zicem… pufoase. Mostenirea de atribute o facem automat, copiem toate atributele de la pisica la flubel, tinand minte si sa acceptam orice modificare de atribut. E posibil flubelii sa fie mai mari, sau sa aiba blana mereu inchisa la culoare. E ok, sunt un derivat din pisica, mostenesc o parte din atribute. De asemenea, pana vedem un flubel, le asociem imagini si secvente de filmulete cu pisici, din memorie. Facem asta automat, este sistemul uman de corelare si inter-relationare. Sigur, cand o sa vedem un flubel in realitate, sau intr-un filmulet, o sa schimbam imaginile si secventele atasate. Dar pana atunci, mostenim tot ce putem de la elementul de baza, pisica.
Partea 1: web-ul semantic
In prezent, Internetul este o mare bila de documente. Avem servere care servesc documente. Punct. (puteti citi aici si aici vreo 2 articole pe tema modului in care vad eu situatia actuala din Internet, insa orientate pe partea de IT). Evident ca serverele nu stiu nimic din ce se scrie in acele documente. Sunt fisiere, sunt octeti ce trebuie serviti catre client. Si cam atat.
De aceea au inceput sa apara tot felul de tendinte de a oferi un minim de semantica legaturilor dintre documente si documentelor in sine. Ideile sunt urmatoarele:
- putem oferi servicii de mai mare calitate utilizatorilor daca, in loc sa ii punem sa nascoceasca cel mai bun filtru de cautare pe Google/Yahoo/MSN pentru a scormoni in mormanul de documente numit Internet, sa scrie doar un topic si sa ii aratam intreaga lista de resurse legate de acel topic.
- putem construi, cu ajutorul acestui Internet 2.0 semantic motoare de cautare mai inteligente, care sa inteleaga semantica atasata fiecarei legaturi dintre pagini si fiecarui document publicat pe net, astfel incat sa stocheze nu numai atributele fizice ale legaturii sau ale docmentului, dar si sa categoriseasca documentul, sa il adauge in anumite categorii, sa il relationeze cu alte documente (poate cu cele din categoria Aviatie, sau poate cu cele profund rasiste, sau poate cu cele legate de o persoana decedata, etc)
- revenind la servicii oferite, putem crea o gama mai larga de optiuni pentru utilizatori. Daca ai 5 prieteni, si Internetul poate oferi aceasta informatie, de ce sa nu fac pentru tine special o campanie, in care ai convorbiri gratuite cu cei 5 prieteni? Daca insa te pasioneaza sa vizitezi tarile asiatice, de ce sa nu iti fac oferte de zbor reduse spre tarile asiatice? (sigur, exista si partea intunecata a situatiei, gen probleme de privacy, spamming si altele; dar sa le lasam deocamdata la o parte)
Cateva exemple de astfel de miscari? Sigur:
- XFN (XHTML Friends Network): un format si o conventie de adnotare a link-urilor dintre documentele HTML pentru a adauga semantica acelei legaturi. Poti spune ca intre tine si cea/cel care detine blogul la care faci referinta exista o relatie de “prietenie”, de “l-am cunoscut”, de “sotie/sot”, etc. (despre XFN am mai discutat pe cultivat aici, insa in afara contextului actual)
- FOAF (Friend of a Friend): crearea unor structuri pentru descrierea relatiilor dintre persoane
- Retelele sociale (exemplele sunt numeroase, Facebook, Hi5, Zorpia, MySpace, etc)
- Semantic web, articol Wikipedia
- RDF (Resource Description Format) este un format conceput pentru viitorul semantic web, si are rolul de a descrie diferitele obiecte, persoane si orice fel de alte entitati care se intalnesc in lumea reala, si care pot fi apoi modelate si intre care se pot crea relatii.
- OWL (Web Ontology Language) daca RDF descrie entitatile, OWL descrie relatiile dintre ele, modul in care sunt conectate si in general ce raporturi se stabilesc intre aceste entitati.
O prezentare interesanta (de aproximativ 51 minute) (ce prezinta cateva tehnici ce se dezvolta pentru agregarea, organizarea si procesarea informatiei pe care Internetul o ofera) puteti urmari in cadrul uneia dintre sesiunile de Google TechTalks.
Aceste miscari de imbogatire informationala a Internetului si de creare de noi tipuri de servicii vin ca un raspuns natural la necesitatile din ce in ce mai mari ale utilizatorilor. O simpla comparatie intre scopul pentru care ARPANET a fost creat in jurul lui 1960 si scopul actual pe care Internetul incearca sa il indeplineasca este edificatoare pentru faptul ca ceva trebuie sa se schimbe.
Link-uri utile:
- XFN: http://gmpg.org/xfn/
- cultivat – Tot despre relete, dar sociale: http://cultivatinro.wordpress.com/2009/09/15/tot-despre-retele-dar-sociale/
- Friend of a Friend: http://www.foaf-project.org/
- Semantic Web: http://semanticweb.org
- Semantic Web pe Wikipedia: http://en.wikipedia.org/wiki/Semantic_Web
- RDF: http://en.wikipedia.org/wiki/Resource_Description_Framework
- OWL: http://en.wikipedia.org/wiki/Web_Ontology_Language
- Intelligence in Wikipedia: http://www.youtube.com/watch?v=cqOHbihYbhE
- ARPANET pe Wikipedia: http://en.wikipedia.org/wiki/ARPANET
Da, ar fi frumos sa avem un tool puternic la dispozitie, dar internetul e un loc mare… f. mare.
Imi aduc aminte de o postare pe coding horror care mi-a placut: http://www.codinghorror.com/blog/archives/001303.html
Prezinta un proiect mult mai vechi decat internetul si cu scop aproximativ similar. Problemele erau de nivel tehnic in secolul trecut. Acum, sunt de nivel financiar.
Da, putem face un internet mai bun, dar oamenii nu vor adopta peste noapte un lucru doar pentru ca e mai bun pentru servere. Trebuie sa vada rezultate imediate. Iar pentru rezultate, trebuie sa fie useri, care sa aduca bani.
The old chicken and egg problem…
Nu stiu daca e chiar chicken and egg problem. Xanadu, asa cum e prezentat de Jeff Atwood e un conceput dragut, departat de ce avem in prezent sub numele de Internet, dar si cu probleme mari de fezabilitate.
Starea curenta a Internetului este, zic eu, cea mai buna stare pe care o puteam avea, pana in acest moment. Sigur ca ar fi fost misto acum 50 de ani sa construim direct starea curenta, si apoi 50 de ani sa evolueze in ceva cu atat mai mult mai sofisticat. Dar chestiile astea nu se intampla.
Ce putem face in acest moment este sa incercam sa construim peste nivelul curent un al doilea nivel, capabil sa proceseze semantica resurselor si a legaturilor dintre ele, si sa ofere rezultate mai bune si mai relevante.
De exemplu tu. Fara sa stii nimic despre un anumit subiect (flubelii, sa zicem
), poti sa inveti totul despre acel subiect folosind Internet-ul, nu? Si atunci de ce nu ar putea o masina sa faca asta?
Ok, acum cred ca inteleg ce vrei sa spui. Masinile ar trebui sa invete bazandu-se pe ideea unei corectitudini a majoritatii colective :
10 oameni scriu ceva de flubeli, baga tag-uri, categorii, etc. 9 pun informatii corecte, 1 e un troll, inteligenta artificiala a unui sistem va concluziona ca un flubel este ceea ce zice majoritatea: un animal roz si pufos, desi nu are vreun senzor prin care sa poata atesta lucrul asta.
De acord; sunt chestii deja folosite.
Dar privacy-ul este un lucru care trebuie luat in calcul de la bun inceput: http://fugitivus.wordpress.com/2010/02/11/fuck-you-google/
P.S. cred ca sunt alergic la flubeli.
…ma faci sa caut pe google(in asteptarea unui motor de cautare mai inteligent) ce sunt flubelii…