Ciasteczko

Z ToProste
Wersja z dnia 12:46, 4 lip 2015 autorstwa Victor (dyskusja | edycje) (Zobacz też)

(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Skocz do: nawigacji, wyszukiwania

Ciasteczko (ang. cookies) to niewielkie informacje tekstowe, wysyłane przez serwer WWW i zapisywane po stronie użytkownika (zazwyczaj na twardym dysku). Domyślne parametry ciasteczek pozwalają na odczytanie informacji w nich zawartych jedynie serwerowi, który je utworzył. Ciasteczka są stosowane najczęściej w przypadku liczników, sond, sklepów internetowych, stron wymagających logowania, reklam i do monitorowania aktywności odwiedzających.

Mechanizm ciasteczek został wymyślony przez byłego pracownika Netscape Communications – Lou Montulliego.

Zastosowanie

Ciasteczka mogą zawierać rozmaite rodzaje informacji o użytkowniku danej strony WWW i "historii" jego łączności z daną stroną (a właściwie serwerem). Zazwyczaj wykorzystywane są do automatycznego rozpoznawania danego użytkownika przez serwer, dzięki czemu może on wygenerować przeznaczoną dla niego stronę. Umożliwia to tworzenie spersonalizowanych serwisów WWW, obsługi logowania, "koszyków zakupowych" w internetowych sklepach itp.

Zastosowanie ciasteczek do sond i liczników internetowych wygląda następująco – serwer może łatwo sprawdzić, czy z danego komputera oddano już głos lub też czy odwiedzono daną stronę, na tej podstawie wykonać odpowiednie operacje i wygenerować dla użytkownika zindywidualizowaną treść strony. Schematyczny sposób wykorzystywania ciasteczek przy obsłudze licznika internetowego, wykluczającego przeładowania (zwiększanie liczby odwiedzin przy odświeżeniu strony) przedstawiony jest poniżej:

Schemat działania licznika internetowego wykluczającego przeładowania

Część serwisów korzysta z ciasteczek jako sposobu przenoszenia między stronami loginu i zaszyfrowanego hasła (rozwiązanie mniej bezpieczne), lub też spreparowanej informacji o zalogowaniu (rozwiązanie bezpieczne), dzięki czemu nie jest konieczne logowanie na każdej podstronie. Wyłączenie obsługi ciasteczek uniemożliwia często zalogowanie się, co może być rozwiązane poprzez przechowywanie danych o zalogowaniu po stronie serwera, zawsze jednak użytkownik musi zostać w jakiś sposób zidentyfikowany (np. poprzez identyfikator sesji zawarty w adresie URL).

Specyfika działania

Mechanizm ciasteczek został wprowadzony po to, by w bezstanowym protokole HTTP umożliwić odróżnienie osób odwiedzających dany serwis. Ciasteczka są informacjami zapisywanymi trwale lub tymczasowo na żądanie serwera na dysku użytkownika. Najczęściej przechowywane są w jednym pliku tekstowym lub binarnym.

Dane zapisane w ciasteczkach mają postać naprzemiennych ciągów nazwy i wartości odpowiadającej jej zmiennej. Serwer WWW chcąc wysłać żądanie utworzenia ciasteczka na dysku użytkownika dołącza do nagłówka HTTP polecenie "Set-Cookie", po którym następuje ciąg przekazywanych danych. Zapamiętane ciasteczko może najczęściej odczytać jedynie serwer, który je wysłał. W danych po poleceniu Set-Cookie określone są:

  • nazwa i przypisaną jej wartość,
  • domena i ścieżka dostępu, które są związane z przekazywanym ciasteczkiem,
  • czas ważności danego ciasteczka (po jego upłynięciu przeglądarka usunie je).

Do zapisania ciasteczka wymagana jest jedynie jego nazwa. Jeśli nie zostanie podana domena, do wartości zapisanych w ciasteczku dostęp będzie miał jedynie serwer, z którego wysłano żądanie zapisu. Niepodanie czasu ważności spowoduje usunięcie ciasteczka po zamknięciu przeglądarki. Ciasteczka, które wygasają po zakończonej sesji, zwane są ciasteczkami sesyjnymi. Mają one ustalony okres ważności, którego mechanizm wymusza serwer (zwykle nie można polegać bowiem na prawidłowości ustawienia zegara na komputerze z przeglądarką).

Działanie mechanizmu ciasteczek po stronie użytkownika zależy od konfiguracji jego przeglądarki. Niektóre z nich umożliwiają odmowę zapisu, inne pozwalają na ustawienie daty wygaśnięcia innej od tej deklarowanej w nagłówku HTTP. Zaawansowaną kontrolę nad zachowaniem ciasteczek posiadają m.in. Firefox, Opera i inne nowoczesne przeglądarki.

Składnia nagłówka HTTP

Nagłówek wysłany przez serwer ma następującą postać:

Set-Cookie: nazwa=wartość; expires=DATA; path=ŚCIEŻKA; domain=DOMENA; secure
nazwa=wartość
Wartość ta jest jedynym wymaganym atrybutem przy wysyłaniu ciasteczka. Składa się z dowolnych znaków z wyjątkiem średników, przecinków, białych spacji i slashów (/). Jeśli zajdzie potrzeba ich użycia, najczęściej koduje się je w formacie odpowiednim dla URL (%XX), gdzie XX to kod ASCII znaku (np. %2F to zakodowana postać slasha, a %20 – spacji).
expires=data
Atrybut expires informuje przeglądarkę o dacie wygaśnięcia danego ciasteczka. Zostanie ono usunięte z dysku, gdy jego data ważności zostanie przekroczona. Jeśli nie podano daty wygaśnięcia, to ciasteczko zostanie usunięte po zakończeniu sesji.
Data musi być podana w następującym formacie (przykład): "Tuesday, 05-Nov-2004 08:30:09 GMT"
Format ten oparty jest na RFC 822, RFC 850, RFC 1036, i RFC 1123 z drobną zmianą odnośnie separatora daty – tu występuje kreska, podana jest również strefa czasowa GMT<ref name="ns_cookies_spec">Specyfikacja ciasteczek w Nestscape</ref>.
domain=domena
Ten parametr określa widoczność ciasteczka. W trakcie sprawdzania pliku na komputerze klienta zawierającego ciasteczka, przeglądarka porównuje zapisaną domenę z domeną serwera, do którego wysyła nagłówki. Przeglądarka wysyła wszystkie nie przeterminowane ciasteczka, których domena jest zawarta w domenie serwera (dodatkowo może być sprawdzana ścieżka wywoływanego pliku i typ połączenia).
W specyfikacji Netscape'a<ref name="ns_cookies_spec"/> wprowadzone jest w tym zakresie dodatkowe ograniczenie. To znaczy domena zostanie dopasowana, jeśli zawiera minimum dwie kropki, albo minimum trzy – jeśli domena główna serwera nie jest jedną z domen specjalnych, czyli: "COM", "EDU", "NET", "ORG", "GOV", "MIL", "INT". Ma to zapobiegać ustawianiu domen typu ".com", ".edu", czy "va.us". Może to jednak powodować nieoczekiwane rezultaty, ponieważ ustawienie dla ciasteczka domeny w formacie "domena.org" spowoduje, że ciasteczka będę widoczne tylko dla danej domeny, ale nie będą wysyłane do poddomen, czyli np. "forum.domena.org". Problem ten omija się ustawiając domenę ".domena.org"<ref>phpBB FAQ – patrz pytanie 23: "I (or my users) cannot stay logged in to the forum!"</ref>.
Domyślnie domain przyjmuje wartość domeny strony, z której wysłano żądanie zapisu ciasteczka.
path=ścieżka
Atrybut path jest podawany w celu ograniczenia widoczności ciasteczka do danej ścieżki dostępu do katalogu (liczy się ścieżka widoczna w URL-u pliku, a nie rzeczywiste położenie na dysku serwera). Wszystkie strony umieszczone w tym katalogu i jego podkatalogach będą mogły je wykorzystać. Należy zauważyć, że podanie parametru path w postaci "/wiki" pozwoli na odczytanie danych z ciasteczek plikom w katalogach "/wikipedia", "/wiki/Cookie" itp.
Widoczność ciasteczka będzie niezależna od położenia pliku, jeśli podana została ścieżka "/". Natomiast domyślnie path przyjmuje wartość ścieżki do strony, z której wysłano żądanie zapisu ciasteczka.
secure
Ten parametr nie posiada wartości. Jeśli zostanie podany, to ciasteczko będzie widoczne (wysłane) tylko wtedy gdy połączenie będzie szyfrowane (obecnie możliwe przy użyciu protokołu HTTPS).

Przy pobieraniu zawartości strony z serwera, przeglądarka sprawdzi (jak podano powyżej) zapamiętane ciasteczka, w których parametry domeny i ścieżki zgadzają się z adresem URL strony. Jeśli je znajdzie, dołącza je do nagłówka HTTP w postaci:

Cookie: nazwa_ciasteczka_1=wartosc_ciasteczka_1; nazwa_ciasteczka_2=wartosc_ciasteczka_2; ...

Właściwości

  • Ciasteczka o tej samej nazwie ale o innych ścieżkach będą nadpisywane.
  • W celu skasowania należy wysłać ciasteczko o takiej samej nazwie i czasie wygaśnięcia z minioną datą.
  • Możliwe jest wysyłanie kilku ciasteczek w jednym nagłówku (poprzez kilka atrybutów Set-Cookie).
  • Istnieją limity przy zapisywaniu ciasteczek na dysku (po ich przekroczeniu przeglądarka usuwa starsze ciasteczka).
    • maksymalna liczba ciasteczek: 300.
    • maksymalna wielkość ciasteczka: 4 kilobajty.
    • maksymalna liczba ciasteczek z jednego serwera lub z jednej ścieżki: 20.
  • Gdy jest zainstalowany serwer Proxy nagłówki Set-Cookie nie powinny być przechowywane w pamięci proxy.
  • Jeżeli serwer Proxy dostanie odpowiedź z nagłówkiem zawierającym Set-Cookie powinien go przekazać do klienta bez względu na rodzaj odpowiedzi np. 304 (nagłówek niezmieniony) czy 200 (nagłówek inny niż zapisany w cache'u).

Argumenty przeciw

Niektórzy są wrogami mechanizmu ciasteczek. Niechęć ta wynika z następujących przesłanek:

  • Mechanizm ten jest bardzo niedoskonały. Jeśli nie skonfiguruje się poprawnie kont użytkowników w systemie, to tak naprawdę nie rozpoznaje on użytkownika, tylko jego przeglądarkę internetową. Powoduje to, że z jednej strony osoba korzystająca z kilku takich komputerów lub kilku przeglądarek na jednym komputerze nie jest rozpoznawana poprawnie; z drugiej strony jeśli kilka osób korzysta z tego samego komputera i przeglądarki, mechanizm nie może ich rozróżnić.
  • Do dzisiaj krążą plotki, jakoby ciasteczka były źródłem rozprzestrzeniania się wirusów. W rzeczywistości jest to niemożliwe – nie można zainfekować komputera wirusem jedynie z powodu włączonej obsługi ciasteczek.
  • Niechęć do ciasteczek bierze się również z niedostatecznych metod zarządzania nimi. Nowoczesne przeglądarki posiadają zaawansowane narzędzia, które w intuicyjny sposób pozwalają zarządzać informacjami zawartymi w ciasteczkach, lecz znaczna część użytkowników korzysta z Internet Explorera, w którym nie ma takich opcji (aczkolwiek istnieją programy firm trzecich, które to umożliwiają)
  • Mechanizm ciasteczek działa bez świadomości i wiedzy użytkownika, naruszając jego prywatność. Często stosowany jest w monitorowaniu zachowań i aktywności użytkowników, np. portale i sklepy internetowe mogą gromadzić w ten sposób informacje o zainteresowaniach użytkowników i wyświetlać reklamy o treści nawiązującej do odwiedzanych stron. Co prawda większość przeglądarek ma możliwość całkowitego blokowania ciasteczek lub włączenia opcji ostrzegającej każdorazowo o ich przesyłaniu, lecz ogromna większość użytkowników albo w ogóle nie wie, co to jest ciasteczko, albo po krótkim czasie odblokowuje ten mechanizm, gdyż bez niego nie można skorzystać z wielu serwisów.

Alternatywa dla ciasteczek – dane w adresie URL

Gdy użytkownik ma wyłączoną obsługę ciasteczek, wówczas dane należy przesłać w inny sposób. W ramach protokołu HTTP jest to możliwe przy użyciu metody GET bądź POST. W praktyce jednak używa się jedynie metody GET — ze względu na łatwość jej użycia oraz na to, że metoda POST jest związana głównie z formularzami.

Zastosowanie metody GET wiąże się jednak z koniecznością podania danych w adresie URL. Jest to jednak zadaniem kłopotliwym i niebezpiecznym, ponieważ sprowadza się do konieczności dodawania odpowiednich parametrów do wszystkich wewnętrznych linków zawartych na stronach serwisu<ref>Sesje PHP — Przekazywanie identyfikatora sesji</ref>. Jest to kłopotliwe ze względu na potencjalną ilość takich danych, a niebezpieczne ze względu na to, że użytkownik może np. chcieć zachować taką stronę i nie będąc świadomy zawartych w niej poufnych danych, wysłać komuś mailem.

Blokowanie ciasteczek

Wszystkie nowoczesne przeglądarki pozwalają na włączenie bądź wyłączenie mechanizmu ciasteczek (domyślnie zazwyczaj jest on włączony).

Źródło Wikipedia

Zobacz też

<htmlet>zobacz-tez</htmlet>