Wymiary jakości
Różnorodne podejścia do definiowania informacji przez badaczy prowadzą również do niespójności w definiowaniu pojęcia jej jakości.
Jakość informacji
Różnorodne podejścia do definiowania informacji przez badaczy prowadzą również do niespójności w definiowaniu pojęcia jej jakości. Według najpopularniejszej definicji, jakość informacji można określić jako przydatność do użycia.
Aby zdefiniować wymiary jakości w Wikipedii, należy wziąć pod uwagę podobieństwo tej witryny do tradycyjnych encyklopedii oraz serwisów web 2.0. Z jednej strony treści w Wikipedii tworzone są jako punkt odniesienia, w stylu encyklopedycznym. Według różnych badań ma ona porównywalną dokładność z innymi tradycyjnymi encyklopediami. Jakość artykułu w tradycyjnej encyklopedii można zdefiniować za pomocą 7 wymiarów: autorytet, kompletność, format, objektywność, styl, aktualność, unikatowość. Z drugiej strony Wikipedia jest zbudowana tak, aby umożliwiać współpracę między użytkownikami. Opiera się zatem na technologiach web 2.0, które posiadają następujące wymiary jakości: dostępność, kompletność, wiarygodność, zaangażowanie, objektywność, czytelność, relewancja, reputacja, styl, aktualność, unikatowość, użyteczność.
Biorąc pod uwagę kryteria jakości przyjęte przez społeczność Wikipedii oraz wcześniej opisane cechy tradycyjnej encyklopedii i dokumentów web 2.0, możemy wybrać następujące wymiary jakości artykułów Wikipedii: kompletność, wiarygodność, objektywność, czytelność, relewancja, styl, aktualność.
Wymiary
Kompletność
Mierzy, jak wyczerpujący jest opis tematu. Objętość treści, długość artykułu w bajtach, znakach i słowach.
Wiarygodność
Pokazuje, czy informacje mogą być zweryfikowane za pomocą rzetelnych źródeł. Liczba przypisów, liczba linków zewnętrznych.
Objektywność
Pokazuje, czy treść spełnia kryterium neutralnego punktu widzenia. Liczba unikatowych autorów, liczba zdjęć.
Rzetelność
Ocenia rzetelność wykorzystanych źródeł. Publikacje akademickie, materiały recenzowane, wykrywanie zdeprecjonowanych źródeł.
Czytelność
Mierzy, jak zrozumiały jest tekst. Wykorzystuje formuły takie jak Flesch, Gunning Fog, Coleman-Liau oraz cechy lingwistyczne.
Relewancja
Pokazuje, jak popularny lub ważny jest artykuł dla czytelników. Odwiedziny stron, obserwatorzy, linki przychodzące, PageRank.
Styl
Pokazuje, jak zorganizowana jest treść. Liczba sekcji, tabel, szablonów, zgodność z wytycznymi stylistycznymi.
Aktualność
Sprawdza, czy artykuł opisuje aktualny stan rzeczywistości. Ostatnie edycje, unikatowi redaktorzy, aktualność i zmienność.
Miary jakości Wikipedii
Część badań koncentruje się na identyfikacji miar jakości (wskaźników lub cech), które mogą opisywać charakterystyki artykułów Wikipedii w sposób ustrukturyzowany i mierzalny. Te wskaźniki jakości mogą obejmować cechy związane z długością artykułu, strukturą, liczbą i rzetelnością przypisów, historią edycji, czytelnością oraz spójnością semantyczną. Przekształcając te aspekty w zmienne ilościowe, staje się możliwe systematyczne analizowanie artykułów i porównywanie ich między tematami i językami. Takie reprezentacje oparte na cechach stanowią podstawę do budowania modeli automatycznej oceny jakości, w których algorytmy uczenia maszynowego służą do wykrywania wzorców związanych z treściami o wysokiej i niskiej jakości.