Komputery, oprogramowanie, internet i okolice
Kategorie: Wszystkie | Aplikacje | Blog | Dev | Hacks | Linux | Subversion | Varia | gry | khoomei | książki | mjuzik
RSS
piątek, 24 lipca 2009

Wyszukiwanie informacji jest podstawową i najbardziej kluczową umiejętnością jaką musi posiąść człowiek w dzisiejszych czasach. Od jakiegoś czasu mam wrażenie, że wyszukiwanie staje się coraz trudniejsze. Czyżby historia zataczała koło?<.p>

Dawno, dawno temu...

Gdy zaczynałem swoją przygodę z internetem wyszukiwanie informacji było prawdziwą sztuką. Po pierwsze, trzeba się było śpieszyć - każdy trzyminutowy impuls kosztował i powodował wzrost rachunku za telefon. Po drugie, ilość treści w internecie nie była jeszcze zbyt duża. Może się to teraz komuś wydać nieprawdopodobne ale kiedyś nie wszystko było w internecie. Po trzecie, trzeba było jakoś do istniejących treści dotrzeć. Czy ktoś jeszcze pamięta wyszukiwarki Lycos, AltaVista, Infoseek, WebCrawler, HotBot? Albo którąś z polskich NEToskop, Sieciowid, NetSprint, czy polski Infoseek? To wszystko są działające ówcześnie wyszukiwarki i katalogi. Każda miała zindeksowany jakiś zbiór stron i trzeba było próbować różnych wyszukiwarek aż któraś zwróciła zadowalające wyniki. W dodatku każda miała inną składnię zapytań (AND, OR, XOR, NOT lub +, -, nawiasy).

Swoją drogą strony WWW były tylko jednym z elementów. O wiele więcej działo się na IRCu i Usenecie. Często głównym źródeł informacji w języku polskim były FAQ tematycznych grup dyskusyjnych (sam swego czasu tworzyłem FAQ grupy pl.rec.muzyka.gitara, to były czasy...)

Era Google

Na przełomie wieku pojawił się Google. I bardzo szybko zmonopolizował rynek wyszukiwarek. Niesamowita czytelność i lekkość interfejsu (przeglądając internet na modemie 56 kb/s to ma znaczenie) - wyświetlanie tylko wyników, bez zbędnych reklam, czy innych treści (które zaczęły się pojawiać na portalowych wyszukiwarkach) to było to. W dodatku baza zindeksowanych stron cały czas rosła i Google zwracał coraz lepsze wyniki. Również dla dynamicznie rozwijającego się polskiego internetu. Jeśli do tego dodać prostotę składni zapytań (domyślne AND) i dużą skuteczność chyba nikt nie będzie miał wątpliwości dlaczego Google okazał się sukcesem i prawie całkowicie zmonopolizował rynek wyszukiwarek.

Coraz trudniej

Niestety wraz z wejściem w erę Web 2.0 i powszechności internetu coś zaczęło się psuć. Zaczyna to być szczególnie odczuwalne od jakiegoś roku. Mam cały czas wrażenie, że coraz trudniej w Google wyszukać sensowne informacje.

Główne przyczyny to według mnie:

  • pomijanie podobnych wyników - niestety o pominięciu niektórych stron informowani jesteśmy dopiero po dotarciu do ostatniej strony wyników
  • pomijanie słów kluczowych - Google zawsze ignorował "a", "an", "the", jednak ostatnio Google coraz częściej uznaje istotne słowa za nieistotne (niedawno wspominano o tym na Google Blogoscoped)
  • podpowiedzi "Czy chodziło ci o ...." - czasem rzeczywiście zrobię literówkę i dzięki temu mogę poprawić wyszukiwaną frazę. Jednak ostatnio dość często Google próbuje być mądrzejszy ode mnie i podpowiada jakąś frazę zupełnie wypaczającą sens zapytania. Jedyne co mogę zrobić to krzyknąć w duchu "NIE, nie o to mi chodzi" i spróbować się przekopać przez strony wyników zaśmiecone wynikami związanymi z sugerowanym przez Google zapytaniem
  • różne formy tego samego słowa - szczególnie utrudniające wyszukiwanie w języku polskim (końcówki, odmiana). Z czasem Google coraz lepiej sobie z tym radził i rzeczywiście bardzo to pomagało. Obecnie często zupełnie pomija wpisaną formę np zwracając wyniki ze słowem w mianowniku, mimo że celowo użyłem innego przypadku. No i częste ignorowanie polskich liter (lub zwracanie w wynikach słowa z pliterkami gdy wpisywałem bez) - to jest istotne dla mnie czy dostanę wyniki opisujące "łaskę" czy "laskę"
  • trzeba się bardzo nagimnastykować by móc użyć innej wersji Google niż polskiej. Ja na prawdę chciałbym opcję "Szukaj na stronach z poza kategorii: język polski". Dawniej wystarczyło wejść na Google.com zamiast Google.pl i już, obecnie już nie ma tak łatwo
  • zaśmiecenie wyników spamerskimi SEO blogami, czy ogólnie stronami kradnącymi treść z innych stron, służącymi tylko do pozycjonowania innej strony lub do emisji reklam i czekania na frajerów
  • zaśmiecenie wyników normalnymi blogami - owszem często na blogach jest dużo ciekawego contentu, często tylko tam znajdę odpowiedź na poszukiwane pytanie. Zgoda. Ale dość często w przypadku popularnych tematów trafiam na masę blogów pobieżnie wspominających o danym temacie, oczywiście bez linka do źródła - w efekcie prawdziwe źródło informacji spada gdzieś na n-tą stronę wyników
  • zaśmiecenie wyników mikroblogami - informacja w 140/160 znakach najczęściej jest zbyt zdawkowa, w dodatku często miała sens tylko w kontekście i utraciła aktualność w kilka godzin po opublikowaniu
  • zaśmiecenie wyników wyszukiwania różnych produktów przez porównywarki cen, jakieś dziwne strony z opiniami (sprawiające wrażenie zaplecza SEO)
  • zaśmiecenie wyników wyszukiwania forami (już nie wspominając o tym, że wyszukiwarka grup dyskusyjnych też uwzględnia fora powodując, że ciężko przeszukać archiwa Usenetu) - czasem trafi się w ten sposób na odpowiedź, częściej jednak trafiam na kogoś kto np dwa lata temu zadał to samo pytanie i nie dostał odpowiedzi

Krótko mówiąc: Google indeksuje obecnie zbyt dużo szumu, który potrafi skutecznie zepchnąć treść, w dodatku próbuje być mądrzejszy od użytkownika i wydaje się mu, że lepiej wie czego szukamy...

Oczywiście można stosować różne sztuczki poprawiające wyniki wyszukiwania, czasem pomaga zwykłe zamknięcie frazy w średniki, czy wyeliminowanie jakiegoś słowa kluczowego. Jednak mam wrażenie, że coraz częściej muszę stosować różne sztuczki by uzyskać satysfakcjonujące wyniki. Ba! Coraz częściej mimo zastosowania sztuczek nie dostaję właściwych wyników i zmuszony jestem szukać gdzie indziej.

Co dalej?

Na razie trzeba się ratować innymi sposobami:

  • nie samym Googlem człowiek żyje - można spróbować użyć Microsoftowego Bing, czy wyszukiwarki Yahoo (niedawno chyba wykupionej przez Microsoft) - niestety obie słabo radzące sobie z językiem polskim
  • użycie WolframAlpha czy Wikipedii jeśli szukamy czegoś encyklopedycznego
  • potraktowanie np Delicious jako wielkiego katalogu
  • przeszukać wiodące fora tematyczne i jeśli nie znajdziemy odpowiedzi zadać tam pytanie
  • po prostu zapytać na Twitterze czy Blipie - najczęściej dostaniemy dość szybko odpowiedź nawet w przypadku dość niszowych tematów

A co przyniesie nam przyszłość? Może rodzące się w bólach Web 3.0 i zapowiadana sieć semantyczna coś poprawi. Sam chciałbym wiedzieć...

piątek, 03 lipca 2009
Cóż... Ostatnio za wiele na blogu się nie działo. Myli się jednak ten, kto myślał, że odechciało mi się pisać. Jednym z głównych były intensywne prace nad moim nowym projektem, który przedwczoraj wystartował.




Comment Tracker służy do śledzenia komentarzy na blogach. Chyba każdy intensywnie czytający blogosferę zauważył, że bardzo często dyskusja prowadzona w komentarzach pod blogową notką jest równie ciekawa, a czasem nawet bardziej wartościowa, niż sam wpis. Dzięki Comment Trackerowi nie trzeba już się męczyć z dodawaniem kanałów RSS z komentarzami (które w dodatku nie zawsze są udostępniane lub nie zawierają wszystkich komentarzy), czy pilnować rosnącej ilości zakładek do interesujących nas postów. Koniec z martwieniem się, że coś nas ominie. W Comment Trackerze wszystko mamy w jednym miejscu - w wygodny sposób możemy przeglądać listę obserwowanych postów jak i przeglądać komentarze, a każdy obserwowany wpis jest automatycznie sprawdzany. Nic nam już nie umknie.



Serwis dopiero wystartował i obecnie jest w fazie prywatnej bety. Oznacza to, że pełen dostęp do serwisu mają na razie jedynie beta testerzy. To właśnie od ich uwag i opinii zależy jak ostatecznie Comment Tracker będzie wyglądał i jakie nowe funkcje zostaną dodane.
Jeśli jesteś zainteresowany serwisem i chciałbyś mieć wpływ na jego rozwój wejdź na stronę Comment Trackera, kliknij w "Ask for an invitation" i wypełnij formularz zgłoszeniowy. Potem pozostaje już tylko czekać na potwierdzenie przyjęcia zgłoszenia.

W najbliższym czasie pewnie pojawi się jeszcze kilka wpisów o postępach prac nad projektem, czy też bardziej techniczne notki dotyczące Google App Engine, na którym Comment Tracker działa.
08:52, kosciak1 , Dev
Link Komentarze (2) »
Spis Treści
Kanały RSS
Add to Google
Add to Netvibes