Jaka naprawdę jest sieć WWW?

w dziale Opera
albatros13 napisał(a):

Originally posted by "IDG.pl":

Opera Software zakończyła pierwszy etap prac nad swoją, unikalną w skali światowej, wyszukiwarką internetową. Gdy zostanie ona udostępniona publicznie, co ma nastąpić za kilka miesięcy, będzie nieocenioną pomocą dla producentów przeglądarek internetowych i webmasterów na całym świecie.

Po co komu jeszcze jedna wyszukiwarka, skoro w internecie funkcjonują ich setki? To prawda, ale wszystkie indeksują to samo: treść stron WWW. Opera Software proponuje coś zupełnie innego: wyszukiwarkę MAMA (Metadata Analysis and Mining Application), która indeksuje strukturę dokumentów HTML, tzn. używane tagi, odnośniki, style, skrypty, technologie.

Jak dotąd MAMA zindeksowała ok. 3,5 mln witryn internetowych i jest w stanie odpowiedzieć na pytania w rodzaju: jak wygląda struktura przeciętnej strony? na ilu stronach jest więcej niż sto linków? z ilu znaków składa się przeciętna strona? jak często używany jest styl font-size (lub dowolny inny)? jak popularny jest flash? na ilu stronach wykorzystywane są style CSS? jaki procent stron przechodzi walidację? ile stron zmusza przeglądarkę do przejścia w tryb Quirks? Dla producentów przeglądarek, webmasterów, programistów, a także dla organizacji wyznaczających standardy webowe (np. W3C) takie informacje są niekiedy na wagę złota.

MAMA pozwala uzyskać odpowiedzi na znacznie bardziej wyrafinowane pytania, np.: w którym kraju najczęściej używa się obiektu XMLHttpRequest, kluczowego dla technologii AJAX? Albo: gdzie na świecie istnieje tendencja spadkowa/wzrostowa jeśli chodzi o wykorzystanie flasha?

Na witrynie Opera Developer Community można się zapoznać z pierwszymi rezultatami działania wyszukiwarki MAMA. Mimo że powstały one w oparciu o analizę bardzo drobnego ułamka sieci WWW, w której na indeksację czekają miliardy stron, to już teraz na ich podstawie można wysnuć ciekawe wnioski. A będą one nieporównanie ciekawsze, gdy dzieło inżynierów z Opera Software zacznie działać na dobre i z miesiąca na miesiąc będzie obejmować swym zasięgiem coraz większe obszary internetu.