Jakość informacji

Różnorodne podejścia do definiowania informacji przez badaczy prowadzą również do niespójności w definiowaniu pojęcia jej jakości. Według najpopularniejszej definicji, jakość informacji można określić jako przydatność do użycia.

Aby zdefiniować wymiary jakości w Wikipedii, należy wziąć pod uwagę podobieństwo tej witryny do tradycyjnych encyklopedii oraz serwisów web 2.0. Z jednej strony treści w Wikipedii tworzone są jako punkt odniesienia, w stylu encyklopedycznym. Według różnych badań ma ona porównywalną dokładność z innymi tradycyjnymi encyklopediami. Jakość artykułu w tradycyjnej encyklopedii można zdefiniować za pomocą 7 wymiarów: autorytet, kompletność, format, objektywność, styl, aktualność, unikatowość. Z drugiej strony Wikipedia jest zbudowana tak, aby umożliwiać współpracę między użytkownikami. Opiera się zatem na technologiach web 2.0, które posiadają następujące wymiary jakości: dostępność, kompletność, wiarygodność, zaangażowanie, objektywność, czytelność, relewancja, reputacja, styl, aktualność, unikatowość, użyteczność.

Biorąc pod uwagę kryteria jakości przyjęte przez społeczność Wikipedii oraz wcześniej opisane cechy tradycyjnej encyklopedii i dokumentów web 2.0, możemy wybrać następujące wymiary jakości artykułów Wikipedii: kompletność, wiarygodność, objektywność, czytelność, relewancja, styl, aktualność.

Miary jakości Wikipedii

Część badań koncentruje się na identyfikacji miar jakości (wskaźników lub cech), które mogą opisywać charakterystyki artykułów Wikipedii w sposób ustrukturyzowany i mierzalny. Te wskaźniki jakości mogą obejmować cechy związane z długością artykułu, strukturą, liczbą i rzetelnością przypisów, historią edycji, czytelnością oraz spójnością semantyczną. Przekształcając te aspekty w zmienne ilościowe, staje się możliwe systematyczne analizowanie artykułów i porównywanie ich między tematami i językami. Takie reprezentacje oparte na cechach stanowią podstawę do budowania modeli automatycznej oceny jakości, w których algorytmy uczenia maszynowego służą do wykrywania wzorców związanych z treściami o wysokiej i niskiej jakości.

Zobacz również

Bibliografia