Evaluarea unui motor de cautare

Sumarizarea rezultatelor

Dupa efectuarea unei cautari folosind un SE obtinem (speram) un anumit numar de rezultate. De obicei acest numar este foarte mare si nu vom avea nici timpul nici rabdarea sa accesam toate rezultatele pentru a vedea daca este sau nu ce ne trebuie. Si atunci, ce anume ne determina sa ne uitam sau nu la un anumit rezultat? Cu acest scop au aparut asa-numitele "sumare" ale paginilor intoarse ca rezultat. Fiecare rezultat afiseaza in afara de titlu si o mica fraza, pe care noi o citim si decidem daca pagina respectiva are potential sa ne ofere ceea ce cautam.
Dar cum se obtin aceste sumare?
In primul rand trebuie mentionat ca sumarele sunt de doua feluri: statice sau dinamice (numite si snippet). In timp ce un sumar static va fi mereu acelasi indiferent de cautarea care a intors documentul, sumarul dinamic este dependent de query (cuvintele dupa care se face cautarea) si incearca sa explice de ce a fost ales acel document.
In general, un sumar static este o mica parte din document. Cea mai simpla metoda de a extrage un sumar este folosirea primelor x cuvinte din document. O metoda mai complexa este de a extrage cateva dintre propozitiile cheie.
Sumarul dinamic se bazeaza pe query, dupa cum am mai spus, astfel ca daca gaseste o fraza care sa corespunda query-ului, va extrage cateva sau toate aparitiile acestei fraze in document, in caz contrar fragmente de text care contin cat mai multe din cuvintele cautate.

Evaluarea SE (search engine)

Am vorbit despre cum ne prezinta un SE rezultatele pe care le gaseste. Si totusi, cum putem aprecia cat de bine si-a facut acesta datoria? Simplu...folosind anumite "unitati de masura", care pot fi obiective sau subiective.

Evaluarea obiectiva se bazeaza pe criterii cum ar fi:

  • viteza de indexare (numar de documente/ora)
  • viteza de cautare
  • complexitatea limbajului de cautare (cat de complexe pot fi query-urile folosite)
Evaluarea subiectiva, care din pacate este deseori interpretata gresit, se refera la cat de multumit este UTILIZATORUL. Cum putem masura multumirea acestuia? Depinde... Daca este vorba despre un motor web, conteaza cat de multi utilizatori revin sa-l foloseasca. Daca este vorba despre un site eCommerce tindem sa spunem ce este important cati dintre vizitatori devin si cumparatori. Gresit! Iar ne gandim doar cum sa obtinem cat mai multi bani. In acest caz ne intereseaza cat de repede gaseste cumparatorul ce doreste. Cat timp ii ia sa cumpere?

Nu in ultimul rand, evaluarea unui SE se face si pe baza relevantei rezultatelor. Ne intereseaza cate rezultate din cele obtinute sunt relevante si cate nu ne sunt de folos.
Pentru a masura relevanta ne folosim de doua proprietati: precizie si recall.
Precizia
determina procentul de rezultate relevante din totalul celor gasite.

precizie = relevant gasit / (relevant gasit + irelevant gasit)

Recall-ul determina procentul de rezultate relevante existente.

recall = relevant gasit /(relevant gasit + relevant negasit)

0 comentarii:

Postare mai nouă Postare mai veche Pagina de pornire