RSS

Czemu służą długie adresy URI?

Liczba odsłon: 99

Od dłuż­sze­go cza­su spo­ra część (je­że­li nie więk­szość) ser­wi­sów inter­ne­to­wych sto­su­je bez­po­śred­nie, sta­łe adre­sy wia­do­moś­ci, bu­do­wa­ne nie na ba­zie uni­ka­to­wych iden­ty­fi­ka­to­rów wpi­sów w ba­zie da­nych, lecz ty­tu­łów tych wpi­sów. Na przy­kład, in­for­mac­ja o tym, że Britney Spears zjad­ła na ko­la­cję ho­ma­ra, za­miast pod adre­sem koń­czą­cym się na przy­kład /news/?id=12345 bę­dzie do­stęp­na pod adre­sem po­dob­nym do /news/Britney-Spears-zjadla-ho­ma­ra-na-kolacje.

Za każ­dym ra­zem, gdy wi­dzę ta­ką for­mę adre­su URI, za­sta­na­wiam się na no­wo: cze­mu to ni­by słu­ży? Rozbudo­wa­ne adre­sy URI nie są naj­częś­ciej prze­zna­czo­ne dla lu­dzi: prze­glą­dar­ka WWW ko­rzys­ta z nich, by do­stać się do od­po­wied­nie­go za­so­bu i prze­ka­zać mu nie­zbęd­ne pa­ra­met­ry. Oczywiś­cie, użyt­kow­nik mu­si dys­po­no­wać moż­li­woś­cią wpi­sa­nia zna­ne­go adre­su URI i wejś­cia na wy­bra­ną stro­nę bez ko­niecz­noś­ci ko­rzys­ta­nia z ser­wi­sów wy­szu­ku­ją­cych — jed­nak w tym mo­men­cie pa­sek adre­su mógł­by w za­sa­dzie na­wet zni­kać z ok­na prze­glą­dar­ki, ja­ko nie­przy­dat­ny użyt­kow­ni­ko­wi szcze­gół tech­nicz­ny i re­likt cza­sów pros­tej, sta­tycz­nej sie­ci WWW.

Wyszuki­wa­nie in­for­mac­ji w spo­sób tek­sto­wy zaw­sze jest wol­niej­sze, niż in­dek­so­wa­nie licz­ba­mi. Łatwo za­tem wy­ciąg­nąć wnio­sek, że ta­ka for­ma za­pi­su adre­sów URI tyl­ko spo­wal­nia dzia­ła­nie ser­we­rów inter­ne­to­wych. Byłoby to uza­sad­nio­ne, gdy­by zy­ski­wał na tym czy­tel­nik ser­wi­su. Tak jed­nak nie jest: ty­tuł wpi­su jest po­ka­zy­wa­ny prze­cież w na­głów­ku ok­na prze­glą­dar­ki, a naj­częś­ciej rów­nież na sa­mej stro­nie i nikt przy zdro­wych my­ślach nie bę­dzie pró­bo­wał od­czy­tać go z pa­ska adre­su. Przy otwie­ra­niu od­noś­ni­ków lub ko­pio­wa­niu ich adre­sów rów­nież trud­no do­szu­kać się ja­kie­go­kol­wiek zy­sku z ich czy­tel­niej­szej dla czło­wie­ka for­my. Natomiast w mo­men­cie, gdy nie moż­na sko­rzys­tać ze schow­ka i trze­ba prze­pi­sać od­noś­nik ręcz­nie, ta­ka wy­dłu­żo­na for­ma mo­że do­pro­wa­dzić do furii. Jakiś czas te­mu ko­rzy­sta­łem in­ten­sy­wnie ze zdal­ne­go pul­pi­tu VNC, nie ofe­ru­ją­ce­go syn­chro­ni­za­cji schow­ka i za każ­dym ra­zem, gdy tra­fia­łem na ja­kiś od­noś­nik, mu­sia­łem prze­pi­sać go znak po zna­ku z pul­pi­tu zdal­ne­go do pa­ska adre­su uru­cho­mio­nej lo­kal­nie prze­glą­dar­ki. W przy­pad­ku zwyk­łych, pros­tych adre­sów, skła­da­ją­cych się z kil­ku­nas­tu lub kil­ku­dzie­się­ciu zna­ków, nie by­ło żad­ne­go prob­le­mu. Gdy jed­nak tra­fia­łem na ta­kie wy­dłu­żo­ne mon­strum, prze­pi­sa­nie adre­su zaj­mo­wa­ło od­po­wied­nio wię­cej cza­su, a ry­zy­ko po­peł­nie­nia błę­du ro­sło nie­po­mier­nie.

Długie adre­sy URI prze­szka­dza­ją też pod­czas pi­sa­niu ar­ty­ku­łów. Zazwyczaj sta­ram się, by ża­den z wier­szy tek­stu źród­ło­we­go XHTML nie był dłuż­szy niż 80 zna­ków, a okno edy­to­ra tek­stu mam roz­ciąg­nię­te aku­rat tak, by mie­ścił się w nim ideal­nie właś­nie tak sfor­ma­to­wa­ny tekst. Adresów URI nie wol­no jed­nak ła­mać i wy­star­czy, by tra­fił się je­den o dłu­goś­ci prze­kra­cza­ją­cej 60-70 zna­ków, a wy­god­ne ogar­nię­cie wzro­kiem ca­łe­go aka­pi­tu tek­stu sta­je się nie­moż­li­we.

Osobiście uwa­żam, że za ta­ką for­mą adre­sów URI nie stoi ża­den ar­gu­ment tech­nicz­ny. Powód jest chy­ba tyl­ko je­den: po pros­tu da się. Obecnie me­cha­niz­my ty­pu URI rewrite są stan­dar­do­wym wy­po­sa­że­niem każ­de­go ser­we­ra HTTP, a ko­rzys­ta­nie z nich jest „mod­ne”. Owszem, cza­sem do­brze za­sto­so­wa­na wir­tu­al­na adre­sa­cja za­so­bów ser­wi­su po­pra­wia je­go ja­kość i ukry­wa nie­po­trzeb­ne szcze­gó­ły im­ple­men­ta­cyj­ne — oba­wiam się jed­nak, że znacz­nie częś­ciej, niż z do­bry­mi za­sto­so­wa­nia­mi ma­my do czy­nie­nia po pros­tu z nad­gor­li­wo­ścią.


Z tego co wiem, "przynazne URLe" mają znaczenie przy pozycjonowaniu. Przynajmniej tak twierdzą specjaliści od SEO i SEM.
Długie i opisowe adresy URL (czasem zamiast będące powtórzeniem tytułu oparte na zestawie tagów) mają jeden cel: polepszyć indeksowanie i wysokość w wynikach wyszukiwania. Trudno mi się spierać, na ile jest to faktycznie skuteczne (zdania są podzielone), ale coś na pewno daje. Sam zauważyłem, u siebie na blogu wejścia na frazy, których część znajdowała się _tylko_ w adresie.
Osobiście staram się skracać nazbyt długie adresy (platformy blogowe jak My Opera czy Wordpress pozwalają na zmianę, niektóre na sztywno generują adres z tytułu (lub tagów, jak pewien CMS, którego używam) i kropka).

Tym niemniej przepisywanie URLi zdecydowanie odeszło do lamusa a z wejściem do adresów pełnego zestawu znaków unicode jest wręcz często niemożliwe. Kiedy może istnieć konieczność przepisania ręcznego, stosuje się serwisy skracające (niektóre platformy same mają wbudowaną taką usługę). Dobrze jest to rozwiązane na gazeta.pl — tam tytuł można wyrzucić z adresu, wystarczający jest unikatowy identyfikator liczbowy artykułu, korzystam z tej możliwości, gdy wklejam gdzieś „goły” URL, żeby uniknąć np. brzydkich efektów wizualnych.
Nie można powiedzieć, że przepisywanie URLi zdecydowanie odeszło do lamusa. Czasem jest to po prostu konieczność i wtedy takie długie adresy zdecydowanie utrudniają życie.
Co do pozycjonowania — jestem zdecydowanym przeciwnikiem jakkolwiek sztucznego wpływania na wyniki wyszukiwania. Stron nie należy pozycjonować — same mają zasłużyć sobie na wysokie miejsca w wynikach.
Tak samo jestem przeciwko stosowaniu unikodu w adresach URI. To jest jedno z miejsc, w których można się bez tego obejść, dzięki temu nie dostając całej masy dodatkowych problemów.
1 – czytelność kodu HTML jest ważna tylko w czasie edycji, większość serwisów usuwa znaki nowego wiersza etc.(większość dobrych edytorów potrafi sformatować taki kod do postaci czytelnej)

2 – URI jest identyfikatorem zasobu z nazwy. Zasoby można widocznie identyfikować również słownie.(łatwiej taki URI znaleźć w wyszukiwarce niż go przepisać ;) )

3 – element "title" może zawierać tylko tekst (Świat Owoców: Blog: Czemu słu­żą dłu­gie adre­sy <acronym lang="en" title="Uniform Resource Identifier">URI</acronym>?).
Przypadek użycia z VNC aż prosi się o skorzystanie usługi skracającej linki. Przepisanie http://42.pl/u/2qQN (nawet na telefonie) już nie jest problemem.
Dla wybitnie leniwych: są rozszerzenia do przeglądarek które robią to za nas.

Z innej beczki: czytelny URL ma nie tylko znaczenie w SEO, ale i codziennej komunikacji międzyludzkiej.
Przykład: wklejony na komunikatorze niesie informację o tytule/treści artykułu (np. z gazeta.pl) i odbiorca może zdecydować: otworzyć go w pracy, zapisać na później czy też otworzyć w trybie incognito.
Anonim:
1: Piszę właśnie o edycji kodu, w której tak długie adresy mocno przeszkadzają. Specyfika mojej pracy nad serwisem polega na tym, że przez większość czasu właśnie edytuję kod XHTML artykułów i chcę, by był jak najbardziej czytelny na ekranie ;)
2: Wolę bezpośrednio otwierać zasób niż tracić czas na jego wyszukiwanie. Zresztą i w tej metodzie muszę przepisać większość tytułu informacji...
3: Drobny błąd w skrypcie. Już usunięty. Dziękuję za jego wskazanie :)

Lidel:
Ale w tym przypadku nie miałem możliwości skorzystania z jakiejkolwiek usługi. Po prostu miałem odnośnik wyświetlany w okienku, bez możliwości skorzystania z WWW na zdalnym pulpicie.
Wklejając odnośnik równie dobrze można napisać co on reprezentuje i dlaczego odbiorca powinien go otworzyć. Nie zrzucajmy tej pracy na komputer. Zresztą, nie powinno się nigdy otwierać w komunikatorze odnośników do których nie ma sensownego opisu wpisanego ludzką ręką, bo może być to zakamuflowany wirus.