Jakość Wikipedii

Pomimo tego, że Wikipedia jest często krytykowana za niską jakość, nadal pozostaje jedną z najpopularniejszych baz wiedzy na świecie. Obecnie Wikipedia zawiera ponad 65 milionów artykułów na różne tematy. Jednocześnie każda wersja językowa jest edytowana niezależnie, więc jakość informacji może się różnić w zależności od języka.

Według Ethnologue, ludzie na świecie posługują się ponad 7 tysiącami języków, z których prawie 3 tysiące są zagrożone wyginięciem. Dla porównania, artykuły Wikipedii dostępne są w ponad 350 językach.

Każdego dnia liczba artykułów w Wikipedii rośnie. Mogą je tworzyć i edytować nawet anonimowi użytkownicy. Autorzy nie muszą formalnie wykazywać swoich umiejętności, wykształcenia i doświadczenia w określonych dziedzinach. Wikipedia nie posiada centralnej redakcji ani grupy recenzentów, którzy mogliby kompleksowo sprawdzić wszystkie nowe i istniejące teksty. Z tych i innych powodów ludzie często krytykują koncepcję Wikipedii, wskazując w szczególności na niską jakość informacji.

Wyzwania

Wikipedia może być edytowana w każdym języku niezależnie, co prowadzi do takich problemów jak:

  • ten sam obiekt (miasto, osoba, wydarzenie itp.) może być opisany na różne sposoby,
  • użytkownik zazwyczaj musi znać te języki, aby sprawdzić/porównać informacje.

Dodatkowo, sama ocena jakości informacji jest subjektywna i zależy od wersji językowej Wikipedii:

  • każda wersja językowa definiuje własne zasady i standardy,
  • standardy mogą zmieniać się w czasie.

W Wikipedii można więc czasem znaleźć wartościowe informacje — w zależności od wersji językowej i tematu. Praktycznie w każdej wersji językowej istnieje system wyróżnień dla najlepszych artykułów. Jednak liczba tych artykułów jest stosunkowo niewielka (poniżej jednego procenta). W niektórych wersjach językowych istnieją również inne klasy jakości. Jednak zdecydowana większość artykułów pozostaje nieoceniona (w niektórych językach ponad 99%).

Systemy oceny jakości

Każda wersja językowa Wikipedii może definiować własny system oceny jakości artykułów. Często w każdej wersji językowej istnieje specjalne wyróżnienie dla artykułów uważanych za najlepsze — „Artykuły na medal". Istnieje również wyróżnienie dla artykułów dobrej jakości, które nie spełniają kryteriów artykułu na medal — są to tak zwane „Dobre artykuły".

Niektóre wersje językowe Wikipedii posiadają również inne klasy jakości, które mogą odzwierciedlać „dojrzałość" artykułu. W angielskojęzycznej Wikipedii, oprócz najwyższych oznaczeń „FA" i „GA", istnieją również „A-class", „B-class", „C-class", „Start" i „Stub". W rosyjskojęzycznej Wikipedii, oprócz dwóch najwyższych oznaczeń, istnieje również „Solidny artykuł", „Poziom I", „Poziom II", „Poziom III" i „Poziom IV". Polskojęzyczna Wikipedia ma trzy dodatkowe klasy: „Czwórka", „Start" i „Zalążek".

Pomimo tych samych nazw, równoważne klasy między wersjami językowymi mogą różnić się sposobem oceny standardów. Dlatego każda wersja językowa może mieć własny model jakości, nawet jeśli języki te mają taką samą liczbę klas.

Automatyczna ocena jakości

W Wikipedii wiele artykułów nie posiada klas jakości, więc każdy czytelnik musi samodzielnie analizować ich treść. Temat automatycznej oceny jakości artykułów Wikipedii jest znany w świecie naukowym. Zasadniczo prace naukowe opisują najbardziej rozwiniętą wersję językową Wikipedii — angielską, która zawiera już ponad 7 milionów artykułów.

Od momentu powstania, wraz z rosnącą popularnością Wikipedii, publikowanych jest coraz więcej prac naukowych na ten temat. Jedno z pierwszych badań wykazało, że pomiar objętości treści może pomóc określić stopień „dojrzałości" artykułu Wikipedii. Prace w tym kierunku pokazują, że generalnie artykuły wyższej jakości są długie, wykorzystują wiele przypisów, są edytowane przez setki autorów i posiadają tysiące edycji.

Zadanie automatycznej oceny jakości może być rozwiązane przez algorytmy uczenia maszynowego, szczególnie przy użyciu modeli klasyfikacyjnych opartych na porównaniu artykułów Wikipedii o różnych klasach jakości, ocenionych przez użytkowników Wikipedii. W takich modelach można wykorzystać ponad 200 miar jakości związanych z kompletnością, wiarygodnością, objektywnością, rzetelnością, czytelnością, relewancją, stylem i aktualnością. Część z nich jest zależna od języka i może być uzyskana za pomocą technik NLP. Dodatkowo takie modele mogą wykorzystywać metryki związane z SEO: indeks widoczności, PageRank, CheiRank, rangę 2D, sygnały społecznościowe i inne.

Więcej informacji można znaleźć w publikacjach naukowych. Część wyników została wdrożona w różnych narzędziach.