WGET(1) GNU Wget WGET(1) NUME wget - instrumentul de descarcare din reea neinteractiv SINOPSIS wget [opiune]... [URL]... DESCRIERE GNU wget este un instrument gratuit pentru descarcarea non-interactiva de fiiere din Internet. Accepta protocoalele HTTP, HTTPS i FTP, precum i preluarea prin proxy-uri HTTP. wget este non-interactiv, ceea ce inseamna ca poate funciona in fundal, in timp ce utilizatorul nu este conectat. Acest lucru va permite sa incepei o recuperare i sa va deconectai de la sistem, lasandu-l pe wget sa termine munca. In schimb, majoritatea navigatoarelor web necesita prezena constanta a utilizatorului, ceea ce poate fi un mare impediment atunci cand se transfera o mulime de date. wget poate urmari legaturile din paginile HTML, XHTML i CSS, pentru a crea versiuni locale ale siturilor web de la distana, recreand complet structura de directoare a sitului original. Acest lucru este denumit uneori ,,descarcare recursiva". In timp ce face acest lucru, wget respecta Standardul de excludere a roboilor (/robots.txt). wget poate fi instruit sa converteasca legaturile din fiierele descarcate pentru a indica fiierele locale, pentru vizualizare in modul deconectat. wget a fost conceput pentru a fi robust in cazul conexiunilor de reea lente sau instabile; daca o descarcare eueaza din cauza unei probleme de reea, va continua sa incerce pana cand fiierul va fi recuperat in intregime. In cazul in care serverul accepta reluarea, acesta va instrui serverul sa continue descarcarea din punctul in care a fost intrerupta. OPIUNI Sintaxa opiunilor Deoarece wget folosete GNU getopt pentru a procesa argumentele din linia de comanda, fiecare opiune are o forma lunga alaturi de cea scurta. Opiunile lungi sunt mai uor de reinut, dar necesita timp pentru a fi tastate. Putei amesteca in mod liber diferite stiluri de opiuni sau putei specifica opiuni dupa argumentele liniei de comanda. Astfel, putei scrie: wget -r --tries=10 http://fly.srk.fer.hr/ -o jurnal Spaiul dintre opiunea care accepta un argument i argument poate fi omis. In loc de -o jurnal se poate scrie -ojurnal. Putei pune impreuna mai multe opiuni care nu necesita argumente, cum ar fi: wget -drc Acest lucru este complet echivalent cu: wget -d -r -c Deoarece opiunile pot fi specificate dupa argumente, putei sa le terminai cu --. Astfel, urmatoarea comanda va incerca sa descarce URL-ul -x, raportand eecul in jurnal: wget -o jurnal -- -x Toate opiunile care accepta liste separate prin virgule respecta convenia conform careia specificarea unei liste goale terge valoarea acesteia. Acest lucru poate fi util pentru a terge parametrii .wgetrc. De exemplu, daca .wgetrc definete parametrul "exclude_directories" la /cgi-bin, exemplul urmator il va reiniializa mai intai i apoi il va defini pentru a exclude /~nobody i /~somebody. De asemenea, putei curaa listele din .wgetrc. wget -X "" -X /~nobody,/~somebody Majoritatea opiunilor care nu accepta argumente sunt opiuni booleane, denumite astfel deoarece starea lor poate fi captata cu o variabila de tip da-sau-nu (,,boolean"). De exemplu, --follow-ftp ii indica lui wget sa urmareasca legaturile FTP din fiierele HTML i, pe de alta parte, --no-glob ii indica sa nu efectueze cautarea de fiiere la adresele URL FTP folosind modele cu caractere joker. O opiune booleana este fie afirmativa, fie negativa (incepand cu --no). Toate aceste opiuni au in comun cateva proprietai. Cu excepia cazului in care se specifica altfel, se presupune ca comportamentul implicit este opusul celui pe care il realizeaza opiunea. De exemplu, existena documentata a opiunii --follow-ftp presupune ca opiunea implicita este de a nu urmari legaturile FTP din paginile HTML. Opiunile afirmative pot fi negate prin adaugarea prefixului --no- la numele opiunii; opiunile negative pot fi negate prin omiterea prefixului --no-. Acest lucru ar putea parea superfluu - daca valoarea implicita a unei opiuni afirmative este de a nu face ceva, atunci de ce sa oferim o modalitate de a o dezactiva in mod explicit? Dar fiierul de configurare poate, de fapt, sa schimbe valoarea implicita. De exemplu, utilizarea ,,follow_ftp = on" in .wgetrc face ca wget sa urmeze in mod implicit legaturile FTP, iar utilizarea --no-follow-ftp este singura modalitate de a restabili valoarea implicita din fabrica din linia de comanda. Opiuni de baza pentru pornire -V --version Afieaza versiunea lui wget i iese. -h --help Afieaza un mesaj de ajutor care descrie toate opiunile din linia de comanda a lui wget. -b --background Trece in fundal imediat dupa pornire. Daca nu este specificat niciun fiier de ieire prin -o, ieirea este redirecionata catre wget-log. -e comanda --execute comanda Executa comanda ca i cum ar fi o parte din .wgetrc. O comanda astfel invocata va fi executata dupa comenzile din .wgetrc, avand astfel prioritate faa de acestea. Daca trebuie sa specificai mai multe comenzi wgetrc, utilizai mai multe instane de -e. Opiuni de jurnalizare i de fiier de intrare -o fiier-jurnal --output-file=fiier-jurnal Inregistreaza toate mesajele in fiier-jurnal. In mod normal, mesajele sunt raportate la ieirea de eroare standard. -a fiier-jurnal --append-output=fiier-jurnal Adauga la fiier--jurnal. Este la fel ca -o, numai ca se adauga la fiier-jurnal in loc sa suprascrie vechiul fiier jurnal. Daca fiier-jurnal nu exista, se creeaza un fiier nou. -d --debug Activeaza ieirea de depanare, ceea ce inseamna diverse informaii importante pentru dezvoltatorii lui wget in cazul in care acesta nu funcioneaza corect. Este posibil ca administratorul de sistem sa fi ales sa compileze wget fara suport pentru depanare, caz in care -d nu va funciona. Reinei ca compilarea cu suport de depanare este intotdeauna sigura --- wget compilat cu suport de depanare nu va imprima nicio informaie de depanare, cu excepia cazului in care este solicitata cu -d. -q --quiet Dezactiveaza ieirea lui wget. -v --verbose Activeaza ieirea de informaii detaliate, cu toate datele disponibile. Ieirea implicita este descriptiva. -nv --no-verbose Dezactiveaza ieirea descriptiva fara a fi complet silenioasa (utilizai -q pentru aceasta), ceea ce inseamna ca mesajele de eroare i informaiile de baza sunt totui afiate. --report-speed=tip Laimea de banda de ieire ca tip. Singura valoare acceptata este bits. -i fiier --input-file=fiier Citete adresele URL dintr-un fiier local sau extern. Daca - este specificat ca fiier, adresele URL sunt citite de la intrarea standard. Folosii ./- pentru a citi dintr-un fiier numit literalmente -. Daca se utilizeaza aceasta funcie, nu este necesar sa fie prezente adrese URL in linia de comanda. In cazul in care exista adrese URL atat in linia de comanda, cat i intr-un fiier de intrare, cele din linia de comanda vor fi primele care vor fi recuperate. Daca --force-html nu este specificat, atunci fiier trebuie sa fie format dintr-o serie de adrese URL, una pe linie. Cu toate acestea, daca specificai --force-html, documentul va fi considerat ca fiind html. In acest caz, este posibil sa avei probleme cu legaturile relative, pe care le putei rezolva fie adaugand ,," in documente, fie specificand ,,--base=url" in linia de comanda. Daca fiier este un fiier extern, documentul va fi tratat automat ca html daca Content-Type se potrivete cu text/html. In plus, locaia fiierului va fi utilizata implicit ca baza href daca nu a fost specificata niciuna. --input-metalink=fiier Descarca fiierele cuprinse in fiierul Metalink local. Sunt acceptate versiunile 3 i 4 ale Metalink. --keep-badhash Pastreaza fiierele Metalink descarcate cu o suma de control greita. Adauga .badhash la numele fiierelor Metalink care au o suma de control necorespunzatoare, dar fara a suprascrie fiierele existente. --metalink-over-http Emite o cerere HTTP HEAD in loc de GET i extrage metadatele Metalink din anteturile de raspuns. Apoi trece la descarcarea Metalink. In cazul in care nu se gasesc metadate Metalink valide, se revine la descarcarea HTTP obinuita. Activeaza descarcarea/procesarea fiierelor Content-Type: application/metalink4+xml. --metalink-index=numar Stabilete NUMARUL ordinal al meta-url-ului application/metalink4+xml al Metalink. De la 1 la numarul total de ,,application/metalink4+xml" disponibile. Specificai 0 sau inf pentru a alege primul bun. Meta-url-urile, cum ar fi cele de la un --metalink-over-http, pot fi sortate dupa valoarea cheii de prioritate; inei cont de aceasta pentru a alege NUMARUL corect. --preferred-location Stabilete locaia preferata pentru resursele Metalink. Acest lucru are efect daca sunt disponibile mai multe resurse cu aceeai prioritate. --xattr Activeaza utilizarea atributelor extinse ale sistemului de fiiere pentru a salva adresa URL originala i valoarea antetului HTTP Referer, daca este utilizata. Reinei ca adresa URL poate conine informaii private, cum ar fi jetoane de acces sau acreditari. -F --force-html Atunci cand datele de intrare sunt citite dintr-un fiier, foreaza ca acesta sa fie tratat ca un fiier HTML. Acest lucru va permite sa preluai legaturi relative din fiiere HTML existente pe discul local, adaugand ,," la HTML sau utilizand opiunea de linie de comanda ,,--base". -B URL --base=URL Rezolva legaturile relative folosind URL ca punct de referina, atunci cand citete legaturile dintr-un fiier HTML specificat prin opiunea -i/--input-file (impreuna cu --force-html sau atunci cand fiierul de intrare a fost preluat de la distana de pe un server care il descrie ca fiind HTML). Acest lucru este echivalent cu prezena unei etichete ,,BASE" in fiierul de intrare HTML, cu adresa URL ca valoare pentru atributul ,,href". De exemplu, daca specificai http://foo/bar/a.html pentru adresa URL, iar wget citete ../baz/b.html din fiierul de intrare, acesta va fi rezolvat ca http://foo/baz/b.html. --config=FIIER Specifica locaia unui fiier de pornire pe care dorii sa il utilizai in locul celor implicite. Utilizai opiunea ,,--no-config" pentru a dezactiva citirea fiierelor de configurare. Daca sunt indicate atat ,,--config", cat i ,,--no-config", ,,--no-config" este ignorata. --rejected-log=fiier-jurnal Inregistreaza toate respingerile adreselor URL in fiier-jurnal ca valori separate prin virgule. Valorile includ motivul respingerii, adresa URL i adresa URL parinte in care a fost gasita. Opiuni de descarcare --bind-address=ADRESA Cand se fac conexiuni TCP/IP client, se face legatura cu ADRESA de pe calculatorul local. ADRESA poate fi specificata ca nume de gazda sau adresa IP. Aceasta opiune poate fi utila in cazul in care maina dumneavoastra este asociata cu mai multe IP-uri. --bind-dns-address=ADRESA [numai cu libcares] Aceasta adresa inlocuiete ruta pentru cererile DNS. Daca avei vreodata nevoie sa ocolii configurarile standard din ,,/etc/resolv.conf", aceasta opiune, impreuna cu --dns-servers, va este prietena. ADRESA trebuie sa fie specificata fie ca adresa IPv4, fie ca adresa IPv6. wget trebuie sa fie construit cu libcares pentru ca aceasta opiune sa fie disponibila. --dns-servers=ADRESE [numai cu libcares] Adresele date inlocuiesc adresele standard ale serverului de nume, de exemplu, aa cum sunt configurate in ,,/etc/resolv.conf". ADRESELE pot fi specificate fie ca adrese IPv4, fie ca adrese IPv6, separate prin virgule. wget trebuie sa fie construit cu libcares pentru ca aceasta opiune sa fie disponibila. -t numar --tries=numar Stabilete numarul de incercari la numar. Specificai 0 sau inf pentru incercari infinite. Valoarea implicita este de 20 de incercari, cu excepia erorilor fatale, cum ar fi ,,connection refused" (conexiune refuzata) sau ,,not found -- (404)" (nu a fost gasit -- 404), care nu sunt incercate. -O fiier --output-document=fiier Documentele nu vor fi scrise in fiierele corespunzatoare, ci toate vor fi concatenate impreuna i scrise in fiier. Daca - este utilizat ca fiier, documentele vor fi afiate la ieirea standard, dezactivand conversia legaturilor. Folosii ./- pentru a scrie intr-un fiier numit literalmente -. Utilizarea lui -O nu inseamna pur i simplu ,,utilizeaza numele fiier in locul celui din URL"; mai degraba, este analoga cu redirecionarea shell-ului: <ier http://foo>> este menit sa funcioneze ca < fiier>>; fiier va fi trunchiat imediat, iar tot coninutul descarcat va fi scris acolo. Din acest motiv, -N (pentru verificarea marcii temporale) nu este acceptata in combinaie cu -O: deoarece fiier este intotdeauna nou creat, acesta va avea intotdeauna o marca temporala foarte noua. In cazul in care se utilizeaza aceasta combinaie, se va emite un avertisment. In mod similar, este posibil ca utilizarea -r sau -p cu -O sa nu funcioneze aa cum va ateptai: wget nu va descarca doar primul fiier in fiier i apoi va descarca restul in numele lor normal: tot coninutul descarcat va fi plasat in fiier. Acest lucru a fost dezactivat in versiunea 1.11, dar a fost reintrodus (cu un avertisment) in versiunea 1.11.2, deoarece exista unele cazuri in care acest comportament poate avea intr-adevar o anumita utilitate. O combinaie cu -nc este acceptata numai in cazul in care fiierul de ieire dat nu exista. Reinei ca o combinaie cu -k este permisa numai atunci cand se descarca un singur document, deoarece in acest caz se vor converti toate adresele URI relative in externe; -k nu are sens pentru mai multe adrese URI atunci cand toate sunt descarcate intr-un singur fiier; -k poate fi utilizata numai atunci cand rezultatul este un fiier obinuit. -nc --no-clobber Daca un fiier este descarcat de mai multe ori in acelai director, comportamentul lui wget depinde de cateva opiuni, inclusiv -nc. In anumite cazuri, fiierul local va fi facut niel, sau suprascris, in cazul descarcarilor repetate. In alte cazuri, acesta va fi pastrat. Atunci cand se executa wget fara -N, -nc, -r sau -p, descarcarea aceluiai fiier in acelai director va avea ca rezultat pastrarea copiei originale a fiierului i numirea celei de-a doua copii ca fiier.1. Daca fiierul respectiv este descarcat din nou, a treia copie se va numi fiier.2, i aa mai departe. Acesta este, de asemenea, comportamentul cu -nd, chiar daca -r sau -p sunt in vigoare. Atunci cand se specifica -nc, acest comportament este suprimat, iar wget va refuza sa descarce copii mai noi ale fiierului. Prin urmare, ,,no-clobber" este de fapt o denumire greita in acest mod - aceasta nu impiedica suprascrierea (deoarece sufixele numerice impiedicau deja suprascrierea), ci mai degraba salvarea mai multor versiuni este operaia ce este impiedicata. Atunci cand se executa wget cu -r sau -p, dar fara -N, -nd sau -nc, re-descarcarea unui fiier va avea ca rezultat faptul ca noua copie o va suprascrie pur i simplu pe cea veche. Adaugarea lui -nc va impiedica acest comportament, facand in schimb ca versiunea originala sa fie pastrata, iar orice copie mai noua de pe server sa fie ignorata. Atunci cand se executa wget cu -N, cu sau fara -r sau -p, decizia de a descarca sau nu o copie mai noua a unui fiier depinde de data i ora locala i de cea de la distana i de dimensiunea fiierului. -nc nu poate fi specificata in acelai timp cu -N. O combinaie cu -O/--output-document este acceptata numai in cazul in care fiierul de ieire dat nu exista. Reinei ca atunci cand se specifica -nc, fiierele cu sufixele .html sau .htm vor fi incarcate de pe discul local i analizate ca i cum ar fi fost preluate de pe Web. --backups=copii-de-rezerva Inainte de a (supra)scrie un fiier, face o copie de rezerva a unui fiier existent prin adaugarea unui sufix .1 (_1 pe VMS) la numele fiierului. Astfel de fiiere de rezerva sunt rotite in .2, .3 i aa mai departe, pana la copii-de-rezerva (i se pierd dincolo de acesta). --no-netrc Nu incearca sa obina acreditarile din fiierul .netrc. In mod implicit, fiierul .netrc este cautat pentru acreditari in cazul in care nu a fost transmis niciunul in linia de comanda i este necesara autentificarea. -c --continue Continua sa recupereze un fiier descarcat parial. Aceasta opiune este utila cand vrei sa finalizai o descarcare a unei instane anterioare a wget, sau a unui alt program. De exemplu: wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z Daca exista un fiier numit ls-lR.Z in directorul curent, wget va presupune ca acesta este prima poriune a fiierului de la distana i va cere serverului sa continue recuperarea de la o poziie egala cu lungimea fiierului local. Reinei ca nu este necesar sa specificai aceasta opiune daca dorii doar ca apelarea curenta a wget sa reincerce descarcarea unui fiier in cazul in care conexiunea se pierde la jumatatea drumului. Acesta este comportamentul implicit. Opiunea -c afecteaza doar reluarea descarcarilor incepute inainte de aceasta invocare a wget i ale caror fiiere locale sunt inca in ateptare. Fara opiunea -c, exemplul anterior ar fi descarcat doar fiierul de la distana in ls-lR.Z.1, lasand in pace fiierul trunchiat ls-lR.Z. Daca utilizai opiunea -c pe un fiier care nu este gol, iar serverul nu accepta continuarea descarcarii, wget va reporni descarcarea de la zero i va suprascrie in intregime fiierul existent. Incepand cu wget 1.7, daca utilizai opiunea -c pe un fiier care are aceeai dimensiune ca i cel de pe server, wget va refuza sa descarce fiierul i va afia un mesaj explicativ. Acelai lucru se intampla i atunci cand fiierul este mai mic pe server decat cel local (probabil din cauza ca a fost modificat pe server de la ultima incercare de descarcare) --- deoarece ,,continuarea" nu are sens, nu are loc nicio descarcare. Pe de alta parte, in timp ce se utilizeaza opiunea -c, orice fiier care este mai mare pe server decat la nivel local va fi considerat o descarcare incompleta i doar ,,(lungimea(de la distana) - lungimea(locala))" octei vor fi descarcai i adaugai la sfaritul fiierului local. Acest comportament poate fi de dorit in anumite cazuri - de exemplu, putei utiliza wget -c pentru a descarca doar noua poriune care a fost adaugata la o colecie de date sau la un fiier jurnal. Cu toate acestea, daca fiierul este mai mare pe server pentru ca a fost modificat, spre deosebire de doar adaugat, vei obine un fiier deformat. wget nu are nicio modalitate de a verifica daca fiierul local este intr-adevar un prefix valid al fiierului de la distana. Trebuie sa fii deosebit de ateni la acest aspect atunci cand utilizai -c impreuna cu -r, deoarece fiecare fiier va fi considerat drept candidat la ,,descarcare incompleta". Un alt caz in care vei obine un fiier deformat daca incercai sa utilizai opiunea -c este daca avei un proxy HTTP deficitar care insereaza un ir ,,transfer intrerupt" in fiierul local. In viitor, ar putea fi adaugata o opiune ,,rollback" (revenire la starea precedenta) pentru a rezolva acest caz. Reinei ca opiunea -c funcioneaza numai cu servere FTP i cu servere HTTP care accepta antetul ,,Range". --start-pos=POZIIE Incepe descarcarea de la poziia POZIIE pornind de la zero. Poziia poate fi exprimata in octei, kilooctei cu sufixul ,,k" sau megaoctei cu sufixul ,,m" etc. Opiunea --start-pos are prioritate mai mare decat opiunea --continue. Atunci cand opiunile --start-pos i --continue sunt amandoua specificate, wget va emite un avertisment, apoi va continua ca i cum opiunea --continue ar fi absenta. Este necesar suportul serverului pentru continuarea descarcarii, altfel opiunea --start-pos nu poate fi de ajutor. A se vedea opiunea -c pentru detalii. --progress=tip Selecteaza tipul de indicator de progres pe care dorii sa il utilizai. Indicatorii legali sunt ,,dot" (punct) i ,,bar" (bara). Indicatorul ,,bar" este utilizat in mod implicit. Acesta deseneaza o bara de progres ASCII (cunoscuta i ca afiare ,,termometru") care indica starea de recuperare. In cazul in care ieirea nu este un terminal TTY, se va utiliza in mod implicit bara ,,dot". Utilizai --progres=dot pentru a trece la afiarea ,,dot". Acesta urmarete recuperarea prin imprimarea de puncte pe ecran, fiecare punct reprezentand o cantitate fixa de date descarcate. Tipul de progres poate primi, de asemenea, unul sau mai muli parametri. Parametrii variaza in funcie de tipul selectat. Parametrii pentru tip sunt trecui prin adaugarea lor la tipul sperat prin doua puncte (:), astfel: --progress=tip:parametru1:parametru2. Atunci cand se utilizeaza recuperarea cu puncte, putei configura stilul (style) prin specificarea tipului ca dot:style. Stiluri diferite atribuie semnificaii diferite unui punct. Cu stilul ,,default", fiecare punct reprezinta 1K, exista zece puncte intr-un grup i 50 de puncte intr-o linie. Stilul ,,binary" are o orientare mai apropiata de cea a unui ,,calculator" - 8K pe punct, grupuri de 16 puncte i 48 de puncte pe linie (ceea ce face 384K pe linie). Stilul ,,mega" este potrivit pentru descarcarea de fiiere mari --- fiecare punct reprezinta 64K recuperai, exista opt puncte intr-un grup i 48 de puncte pe fiecare linie (astfel incat fiecare linie conine 3M). In cazul in care ,,mega" nu este suficient, putei utiliza stilul ,,giga" --- fiecare punct reprezinta 1M recuperat, exista opt puncte intr-un grup i 32 de puncte pe fiecare linie (deci fiecare linie conine 32M). Cu --progres=bar, exista in prezent doi parametri posibili, force i noscroll. Cand ieirea nu este un terminal TTY, bara de progres revine intotdeauna la stilul ,,dot", chiar daca opiunea --progress=bar a fost transmisa catre wget in timpul invocarii. Acest comportament poate fi anulat, iar ieirea ,,bar" poate fi forata prin utilizarea parametrului ,,force" ca --progress=bar:force. In mod implicit, bara de progres in stil bara deruleaza numele fiierului de la stanga la dreapta pentru fiierul in curs de descarcare daca numele fiierului depaete lungimea maxima alocata pentru afiarea acestuia. In anumite cazuri, cum ar fi cu --progress=bar:force, este posibil sa nu se doreasca defilarea numelui fiierului in bara de progres. Prin trecerea parametrului ,,noscroll", wget poate fi forat sa afieze cat mai mult din numele fiierului fara a derula prin el. Reinei ca putei configura stilul implicit utilizand comanda <> din .wgetrc. Aceasta configurare poate fi anulata din linia de comanda. De exemplu, pentru a fora ieirea barei fara defilare, utilizai --progress=bar:force:noscroll. --show-progress Foreaza wget sa afieze bara de progres in orice nivel de detaliere. In mod implicit, wget afieaza bara de progres doar in modul de ieire descriptiva. Cu toate acestea, se poate dori ca wget sa afieze bara de progres pe ecran impreuna cu orice alt mod de nivel de detaliere, cum ar fi --no-verbose sau --quiet. Aceasta este adesea o proprietate dorita atunci cand se invoca wget pentru a descarca mai multe fiiere mici/mari. Intr-un astfel de caz, wget ar putea fi invocat pur i simplu cu acest parametru pentru a obine o ieire mult mai curata pe ecran. Aceasta opiune va fora, de asemenea, ca bara de progres sa fie afiata la ieirea de eroare standard atunci cand este utilizata impreuna cu opiunea --output-file. -N --timestamping Activeaza marcarea temporala. --no-if-modified-since Nu trimite antetul If-Modified-Since in modul -N. In schimb, trimite o cerere HEAD preliminara. Acest lucru are efect numai in modul -N. --no-use-server-timestamps Nu stabilete datarea fiierului local dupa cel de pe server. In mod implicit, atunci cand un fiier este descarcat, marcajele de timp ale acestuia sunt definite pentru a se potrivi cu cele din fiierul de la distana. Acest lucru permite utilizarea lui --timestamping la invocarile ulterioare ale wget. Cu toate acestea, uneori este util sa se bazeze data i ora fiierului local pe data la care acesta a fost descarcat efectiv; in acest scop, a fost furnizata opiunea --no-use-server-timestamps. -S --server-response Afieaza antetele trimise de serverele HTTP i raspunsurile trimise de serverele FTP. --spider Atunci cand este invocat cu aceasta opiune, wget se va comporta ca un spider Web (paianjen Web, robot de indexare), ceea ce inseamna ca nu va descarca paginile, ci doar va verifica daca acestea sunt acolo. De exemplu, putei utiliza wget pentru a va verifica marcajele (de pagini favorite): wget --spider --force-html -i marcaje.html Aceasta caracteristica necesita mult mai multa munca pentru ca wget sa se apropie de funcionalitatea roboilor de indexare Web reali. -T secunde --timeout=secunde Stabilete timpul de ateptare al reelei la secunde secunde. Acest lucru este echivalent cu specificarea --dns-timeout, --connect-timeout i --read-timeout, toate in acelai timp. Cand interacioneaza cu reeaua, wget poate sa verifice daca exista un timp de ateptare i sa intrerupa operaiunea daca dureaza prea mult. Acest lucru previne anomalii precum citirile suspendate i conexiunile infinite. Singurul timp de ateptare activat in mod implicit este un timp de ateptare pentru citire de 900 de secunde. Stabilirea unui timp de ateptare la 0 il dezactiveaza complet. Daca nu tii ce facei, cel mai bine este sa nu modificai configurarile implicite de temporizare. Toate opiunile legate de temporizare accepta valori zecimale, precum i valori de zecimi de secunde. De exemplu, 0,1 secunde este o alegere legala (dei nechibzuita) pentru timpul de ateptare. Timpii de ateptare de sub o secunda sunt utili pentru verificarea timpilor de raspuns ai serverului sau pentru testarea latenei reelei. --dns-timeout=secunde Stabilete timpul de ateptare pentru cautarea DNS la secunde secunde. Cautarile DNS care nu se finalizeaza in timpul specificat vor eua. In mod implicit, nu exista niciun termen de ateptare pentru cautarile DNS, altul decat cel implementat de bibliotecile sistemului. --connect-timeout=secunde Stabilete timpul de ateptare pentru conectare la secunde secunde. Conexiunile TCP a caror stabilire dureaza mai mult timp vor fi intrerupte. In mod implicit, nu exista un termen de conectare, altul decat cel implementat de bibliotecile sistemului. --read-timeout=secunde Stabilete timpul de ateptare pentru citire (i scriere) la secunde secunde. ,,Timpul" acestui interval de timp se refera la timpul de inactivitate: daca, in orice moment al descarcarii, nu se primete niciun fel de date pentru mai mult de numarul de secunde specificat, citirea eueaza i descarcarea este repornita. Aceasta opiune nu afecteaza in mod direct durata intregii descarcari. Desigur, serverul de la distana poate alege sa incheie conexiunea mai devreme decat cere aceasta opiune. Timpul de citire implicit este de 900 de secunde. --limit-rate=cantitate Limiteaza viteza de descarcare la cantitate octei pe secunda. Cantitatea poate fi exprimata in octei, kilooctei cu sufixul k sau megaoctei cu sufixul m. De exemplu, --limit-rate=20k va limita viteza de preluare la 20Ko/s. Acest lucru este util atunci cand, indiferent de motiv, nu dorii ca wget sa consume intreaga laime de banda disponibila. Aceasta opiune permite utilizarea numerelor zecimale, de obicei in combinaie cu sufixe de putere; de exemplu, --limit-rate=2.5k este o valoare legala. Reinei ca wget implementeaza limitarea prin dormirea timpului indicat dupa o citire in reea care a durat mai puin timp decat cel specificat de rata. In cele din urma, aceasta strategie face ca transferul TCP sa incetineasca pana la aproximativ rata specificata. Cu toate acestea, este posibil sa dureze ceva timp pentru a se ajunge la acest echilibru, aa ca nu fii surprins daca limitarea ratei nu funcioneaza bine cu fiiere foarte mici. -w secunde --wait=secunde Ateapta numarul de secunde specificat intre recuperari. Se recomanda utilizarea acestei opiuni, deoarece uureaza sarcina serverului prin faptul ca solicitarile sunt mai puin frecvente. In loc de secunde, timpul poate fi specificat in minute, folosind sufixul ,,m", in ore, folosind sufixul ,,h", sau in zile, folosind sufixul ,,d". Specificarea unei valori mari pentru aceasta opiune este utila in cazul in care reeaua sau gazda de destinaie nu funcioneaza, astfel incat wget sa poata atepta suficient de mult timp pentru a se atepta in mod rezonabil ca eroarea de reea sa fie remediata inainte de o noua incercare. Intervalul de ateptare specificat de aceasta funcie este influenat de opiunea ,,--random-wait", care monitorizeaza. --waitretry=secunde Daca nu dorii ca wget sa atepte intre fiecare recuperare, ci doar intre incercarile de reincercare a descarcarilor euate, putei utiliza aceasta opiune. wget va utiliza retrocedarea liniara (backoff liniar), ateptand 1 secunda dupa primul eec la un anumit fiier, apoi ateptand 2 secunde dupa al doilea eec la acel fiier, pana la numarul maxim de secunde pe care il specificai. In mod implicit, wget va adopta o valoare de 10 secunde. --random-wait Unele situri web pot efectua o analiza a jurnalelor pentru a identifica programe de recuperare, cum ar fi wget, cautand similitudini semnificative din punct de vedere statistic in ceea ce privete timpul dintre solicitari. Aceasta opiune face ca timpul dintre solicitari sa varieze intre 0,5 i 1,5 * ateptare secunde, unde ateptarea a fost specificata cu ajutorul opiunii --wait, pentru a masca prezena lui wget de la o astfel de analizare. Un articol din 2001 dintr-o publicaie dedicata dezvoltarii pe o platforma populara intre pasionaii de software a furnizat codul pentru a efectua aceasta analiza din mers. Autorul sau a sugerat blocarea la nivelul adreselor de clasa C pentru a se asigura ca programele de recuperare automata erau blocate in ciuda schimbarii adreselor furnizate de DHCP. Opiunea --random-wait a fost inspirata de aceasta recomandare nepotrivita de a bloca muli utilizatori fara legatura cu un sit web din cauza aciunilor unui singur utilizator. --no-proxy Nu utilizeaza proxy-uri, chiar daca este definita variabila de mediu *_proxy corespunzatoare. -Q cota --quota=cota Specifica cota de descarcare pentru recuperarile automate. Valoarea poate fi specificata in octei (implicit), kilooctei (cu sufixul k) sau megaoctei (cu sufixul m). Reinei ca aceasta cota nu va afecta niciodata descarcarea unui singur fiier. Astfel, daca specificai wget -Q10k https://example.com/ls-lR.gz, toate fiierele ls-lR.gz vor fi descarcate. Acelai lucru este valabil chiar i atunci cand sunt specificate mai multe adrese URL in linia de comanda. Cota este verificata numai la sfaritul fiecarui fiier descarcat, astfel incat nu va rezulta niciodata un fiier descarcat parial. Astfel, putei tasta in sigurana wget -Q2m -i sites -- descarcarea va fi intrerupta dupa ce fiierul care epuizeaza cota este complet descarcat. Stabilirea cotei la 0 sau la inf elimina limitarea cotei de descarcare. --no-dns-cache Dezactiveaza stocarea in cache a cautarilor DNS. In mod normal, wget memoreaza adresele IP pe care le-a cautat din DNS, astfel incat sa nu fie nevoit sa contacteze in mod repetat serverul DNS pentru acelai set (de obicei mic) de gazde de la care recupereaza. Aceasta memorie cache exista doar in memorie; o noua rulare a wget va contacta din nou DNS. Cu toate acestea, s-a raportat ca, in anumite situaii, nu este de dorit sa se stocheze in memoria cache numele gazdelor, chiar i pe durata unei aplicaii cu durata scurta de funcionare, cum ar fi wget. Cu aceasta opiune, wget efectueaza o noua cautare DNS (mai precis, un nou apel la ,,gethostbyname" sau ,,getaddrinfo" de fiecare data cand face o noua conexiune. Va rugam sa reinei ca aceasta opiune nu va afecta memoria cache care ar putea fi efectuata de biblioteca de rezolvare sau de un strat extern de memorie cache, cum ar fi NSCD. Daca nu inelegei exact ce face aceasta opiune, probabil ca nu avei nevoie de ea. --restrict-file-names=moduri Modifica caracterele gasite in adresele URL de la distana care trebuie sa fie eludate in timpul generarii de nume de fiiere locale. Caracterele care sunt restricionate prin aceasta opiune sunt eludate, adica inlocuite cu %HH, unde HH este numarul hexazecimal care corespunde caracterului restricionat. Aceasta opiune poate fi, de asemenea, utilizata pentru a fora toate cazurile alfabetice sa fie scrise cu minuscule sau majuscule. In mod implicit, wget eludeaza caracterele care nu sunt valide sau sigure ca parte a numelor de fiiere in sistemul dumneavoastra de operare, precum i caracterele de control care sunt de obicei neimprimabile. Aceasta opiune este utila pentru a modifica aceste valori implicite, poate pentru ca descarcai pe o partiie non-nativa, pentru ca dorii sa dezactivai eludarea caracterelor de control sau pentru ca dorii sa restricionai in continuare caracterele doar la cele din intervalul de valori ASCII. modurile sunt un set de valori text separate prin virgula. Valorile acceptabile sunt unix, windows, nocontrol, ascii, lowercase i uppercase. Valorile unix i windows se exclud reciproc (una se suprapune celeilalte), la fel ca i lowercase i uppercase. Ultimele sunt cazuri speciale, deoarece nu modifica setul de caractere care ar trebui sa fie eludate, ci mai degraba foreaza rutele locale ale fiierelor sa fie convertite fie in minuscule, fie in majuscule. Cand se specifica ,,unix", wget eludeaza caracterul / i caracterele de control din intervalele 0--31 i 128--159. Aceasta este valoarea implicita pe sistemele de operare de tip Unix. Cand se specifica ,,windows", wget eludeaza caracterele \, |, /, :, ?, ", *, <, >, precum i caracterele de control din intervalele 0--31 i 128--159. In plus, wget in modul ,,windows" utilizeaza + in loc de : pentru a separa gazda i portul in numele de fiiere locale i utilizeaza @ in loc de ? pentru a separa poriunea de interogare a numelui de fiier de restul. Prin urmare, o adresa URL care ar fi salvata ca www.xemacs.org:4300/search.pl?input=blah in modul Unix va fi salvata ca www.xemacs.org+4300/search.pl@input=blah in modul ,,windows". Acest mod este cel implicit pe Windows. Daca specificai nocontrol, atunci se dezactiveaza i eludarea caracterelor de control. Aceasta opiune poate avea sens atunci cand descarcai adrese URL ale caror nume conin caractere UTF-8, pe un sistem care poate salva i afia nume de fiiere in UTF-8 (unele valori posibile ale octeilor utilizate in secvenele de octei UTF-8 se incadreaza in intervalul de valori desemnate de wget ca ,,controale"). Modul ascii este utilizat pentru a specifica faptul ca toi octeii ale caror valori se afla in afara intervalului de caractere ASCII (adica mai mari de 127) trebuie sa fie eludai. Acest lucru poate fi util atunci cand se salveaza nume de fiiere a caror codificare nu se potrivete cu cea utilizata local. -4 --inet4-only -6 --inet6-only Foreaza conectarea la adrese IPv4 sau IPv6. Cu --inet4-only sau -4, wget se va conecta numai la gazde IPv4, ignorand inregistrarile AAAA din DNS i refuzand sa se conecteze la adresele IPv6 specificate in adresele URL. In schimb, cu --inet6-only sau -6, wget se va conecta numai la gazde IPv6 i va ignora inregistrarile A i adresele IPv4. Niciuna dintre aceste opiuni nu ar trebui sa fie necesara in mod normal. In mod implicit, un wget compatibil cu IPv6 va utiliza familia de adrese specificata de inregistrarea DNS a gazdei. Daca DNS raspunde cu adrese IPv4 i IPv6, wget le va incerca in succesiune pana cand gasete una la care se poate conecta; (a se vedea, de asemenea, opiunea ,,--prefer-family" descrisa mai jos. Aceste opiuni pot fi utilizate pentru a fora in mod deliberat utilizarea familiilor de adrese IPv4 sau IPv6 pe sistemele cu doua familii, de obicei pentru a ajuta la depanare sau pentru a rezolva probleme de configurare a reelei. Se poate specifica in acelai timp doar una dintre --inet6-only i --inet4-only. Niciuna dintre aceste opiuni nu este disponibila in wget compilat fara suport IPv6. --prefer-family=none/IPv4/IPv6 Atunci cand se ofera posibilitatea de a alege intre mai multe adrese, se conecteaza mai intai la adresele cu familia de adrese specificata. Ordinea adreselor returnata de DNS este utilizata in mod implicit fara modificari. Astfel se evita erorile false i incercarile de conectare atunci cand se acceseaza gazde care se rezolva atat la adrese IPv6, cat i la adrese IPv4 din reele IPv4. De exemplu, www.kame.net se rezolva la 2001:200:0:8002:203:47ff:fea5:3085 i la 203.178.141.194. Atunci cand familia preferata este ,,IPv4", adresa IPv4 este utilizata mai intai; atunci cand familia preferata este ,,IPv6", adresa IPv6 este utilizata mai intai; daca valoarea specificata este ,,none", ordinea adreselor returnata de DNS este utilizata fara modificari. Spre deosebire de -4 i -6, aceasta opiune nu inhiba accesul la nici o familie de adrese, ci doar modifica ordinea in care sunt accesate adresele. De asemenea, reinei ca reordonarea efectuata de aceasta opiune este stabila -- nu afecteaza ordinea adreselor din aceeai familie. Altfel spus, ordinea relativa a tuturor adreselor IPv4 i a tuturor adreselor IPv6 ramane intacta in toate cazurile. --retry-connrefused Considera eroarea ,,conexiune refuzata" ca fiind o eroare tranzitorie i incearca din nou. In mod normal, wget renuna la o adresa URL atunci cand nu se poate conecta la sit, deoarece eecul conexiunii este considerat un semn ca serverul nu funcioneaza deloc i ca incercarile repetate nu ar ajuta. Aceasta opiune este destinata oglindirii siturilor nesigure ale caror servere au tendina de a disparea pentru perioade scurte de timp. --user=utilizator --password=parola Specifica numele de utilizator utilizator i parola parola atat pentru preluarea fiierelor prin FTP, cat i prin HTTP. Aceti parametri pot fi suprascrii folosind opiunile --ftp-user i --ftp-password pentru conexiunile FTP i opiunile --http-user i --http-password pentru conexiunile HTTP. --ask-password Solicita o parola pentru fiecare conexiune stabilita. Nu poate fi specificata atunci cand se utilizeaza opiunea --password, deoarece acestea se exclud reciproc. --use-askpass=comanda Solicita un utilizator i o parola folosind comanda specificata. Daca nu se specifica nicio comanda, se utilizeaza comanda din variabila de mediu WGET_ASKPASS. Daca WGET_ASKPASS nu este definita, se utilizeaza comanda din variabila de mediu SSH_ASKPASS. Putei stabili comanda implicita pentru ,,use-askpass" in fiierul .wgetrc. Aceasta configurare poate fi suprascrisa din linia de comanda. --no-iri Dezactiveaza suportul pentru adresele URI internaionalizate (IRI). Utilizai opiunea --iri pentru a-l activa. Suportul pentru IRI este activat in mod implicit. Putei stabili starea implicita a suportului IRI utilizand comanda ,,iri" din .wgetrc. Aceasta configurare poate fi suprascrisa din linia de comanda. --local-encoding=codificarea Foreaza wget sa utilizeze codificarea ca codificare implicita a sistemului. Aceasta afecteaza modul in care wget convertete adresele URL specificate ca argumente din codificarea locala dictata de configuraia regionala in UTF-8 pentru suportul IRI. wget utilizeaza funcia nl_langinfo() i apoi variabila de mediu ,,CHARSET" pentru a obine configuraia regionala (codificarea caracterelor). Daca nu reuete, se utilizeaza ASCII. Putei defini codificarea locala implicita folosind comanda ,,local_encoding" din .wgetrc. Aceasta configurare poate fi suprascrisa din linia de comanda. --remote-encoding=codificarea Foreaza wget sa utilizeze codificarea drept codificarea implicita a serverului de la distana. Acest lucru afecteaza modul in care wget convertete adresele URI gasite in fiiere din codificarea de la distana in UTF-8 in timpul unei preluari recursive. Aceasta opiune este utila doar pentru suportul IRI, pentru interpretarea caracterelor non-ASCII. Pentru HTTP, codificarea la distana poate fi gasita in antetul HTTP ,,Content-Type" i in metaeticheta HTML ,,Content-Type http-equiv". Putei stabili codificarea implicita utilizand comanda ,,remoteencoding" din .wgetrc. Aceasta configurare poate fi suprascrisa din linia de comanda. --unlink Foreaza wget sa dezlege un fiier in loc sa suprascrie fiierul existent. Aceasta opiune este utila pentru descarcarea in directorul cu legaturi dure. Opiuni director -nd --no-directories Nu creeaza o ierarhie de directoare atunci cand recupereaza recursiv. Cu aceasta opiune activata, toate fiierele vor fi salvate in directorul curent, fara a se face suprapunerea (suprascrierea), daca un nume apare de mai multe ori, numele fiierelor vor primi extensii .n. -x --force-directories Opusul lui -nd --- creeaza o ierarhie de directoare, chiar daca altfel nu ar fi fost creata niciuna. De exemplu, wget -x http://fly.srk.fer.hr/robots.txt va salva fiierul descarcat in fly.srk.fer.hr/robots.txt. -nH --no-host-directories Dezactiveaza generarea de directoare cu prefix de gazda. In mod implicit, invocarea Wget cu -r http://fly.srk.fer.hr/ va crea o structura de directoare care incepe cu fly.srk.fer.hr/. Aceasta opiune dezactiveaza un astfel de comportament. --protocol-directories Utilizeaza numele protocolului ca o componenta de director a numelor de fiiere locale. De exemplu, cu aceasta opiune, wget -r http://gazda va salva la http/gazda/..., mai degraba decat doar la gazda/.... --cut-dirs=numar Ignora numarul de componente ale directorului. Acest lucru este util pentru a obine un control fin asupra directorului in care va fi salvata recuperarea recursiva. Sa luam, de exemplu, directorul de la ftp://ftp.xemacs.org/pub/xemacs/. Daca il preluai cu opiunea -r, acesta va fi salvat local sub ftp.xemacs.org/pub/xemacs/. In timp ce opiunea -nH poate elimina partea ftp.xemacs.org/, ramanei blocat cu pub/xemacs. Aici este unde opiunea --cut-dirs este utia; aceasta face ca wget sa nu ,,vada" componentele directoarelor la distana numarul. Iata cateva exemple de funcionare a opiunii --cut-dirs. Fara opiuni -> ftp.xemacs.org/pub/xemacs/ -nH -> pub/xemacs/ -nH --cut-dirs=1 -> xemacs/ -nH --cut-dirs=2 -> . --cut-dirs=1 -> ftp.xemacs.org/xemacs/ ... Daca dorii doar sa scapai de structura directoarelor, aceasta opiune este similara cu o combinaie intre -nd i -P. Cu toate acestea, spre deosebire de -nd, --cut-dirs nu se pierde cu subdirectoarele - de exemplu, cu -nH --cut-dirs=1, un subdirector beta/ va fi plasat in xemacs/beta, aa cum ar fi de ateptat. -P prefix --directory-prefix=prefix Stabilete prefixul directorului la prefix. prefixul directorului este directorul in care vor fi salvate toate celelalte fiiere i subdirectoare, adica in varful arborelui de recuperare. Valoarea implicita este . (directorul curent). Opiuni HTTP --default-page=nume Utilizeaza nume ca nume de fiier implicit atunci cand acesta nu este cunoscut (de exemplu, pentru adresele URL care se termina cu o bara oblica), in loc de index.html. -E --adjust-extension Daca se descarca un fiier de tip application/xhtml+xml sau text/html i adresa URL nu se termina cu expresia regulata \.[Hh][Tt][Mm][Ll]?, aceasta opiune va face ca sufixul .html sa fie adaugat la numele de fiier local. Acest lucru este util, de exemplu, atunci cand facei o oglindire a unui sit de la distana care utilizeaza pagini .asp, dar dorii ca paginile oglindite sa poata fi vizualizate pe serverul Apache existent. O alta utilizare buna pentru acest lucru este atunci cand descarcai materiale generate de CGI. O adresa URL precum http://site.com/article.cgi?25 va fi salvata ca article.cgi?25.html. Reinei ca numele de fiiere schimbate in acest mod vor fi descarcate din nou de fiecare data cand vei reface o oglinda a unui sit, deoarece wget nu poate spune ca fiierul local X.html corespunde adresei URL de la distana X (deoarece nu tie inca daca adresa URL produce o ieire de tip text/html sau application/xhtml+xml. Incepand cu versiunea 1.12, wget se va asigura, de asemenea, ca toate fiierele descarcate de tip text/css se termina cu sufixul .css, iar opiunea a fost redenumita din --html-extension, pentru a reflecta mai bine noul comportament. Vechiul nume al opiunii este inca acceptabil, dar ar trebui considerat acum ca fiind depreciat. Incepand cu versiunea 1.19.2, wget se va asigura, de asemenea, ca toate fiierele descarcate cu un ,,Content-Encoding\[u201D] de br, compress, deflate sau gzip se termina cu sufixul .br, .Z, .zlib i, respectiv, .gz. La un moment dat in viitor, aceasta opiune ar putea fi extinsa pentru a include sufixe pentru alte tipuri de coninut, inclusiv tipuri de coninut care nu sunt analizate de wget. --http-user=utilizator --http-password=parola Specifica numele de utilizator utilizator i parola parola pe un server HTTP. In funcie de tipul provocarii, wget le va codifica folosind fie ,,basic" (nesigur), ,,digest", fie schema de autentificare ,,NTLM" de Windows. Un alt mod de a specifica numele de utilizator i parola este in adresa URL insai. Oricare dintre cele doua metode dezvaluie parola oricui se deranjeaza sa ruleze ps. Pentru a preveni ca parolele sa fie vazute, utilizai --use-askpass sau stocai-le in .wgetrc sau .netrc i asigurai-va ca protejai aceste fiiere de ali utilizatori cu chmod. Daca parolele sunt foarte importante, nu le lasai nici in acele fiiere -- editai fiierele i tergei-le dupa ce wget a inceput descarcarea. --no-http-keep-alive Dezactiveaza funcia ,,keep-alive" pentru descarcarile HTTP. In mod normal, wget solicita serverului sa menina conexiunea deschisa, astfel incat, atunci cand descarcai mai multe documente de pe acelai server, acestea sa fie transferate prin aceeai conexiune TCP. Acest lucru economisete timp i, in acelai timp, reduce sarcina pe server. Aceasta opiune este utila atunci cand, din anumite motive, conexiunile persistente (keep-alive) nu funcioneaza, de exemplu, din cauza unei erori a serverului sau din cauza incapacitaii scripturilor din partea serverului de a face faa conexiunilor. --no-cache Dezactiveaza memoria cache de pe server. In acest caz, wget va trimite serverului de la distana directivele corespunzatoare (Cache-Control: no-cache i Pragma: no-cache) pentru a obine fiierul de la serviciul de la distana, in loc sa returneze versiunea din memoria cache. Acest lucru este deosebit de util pentru recuperarea i golirea documentelor invechite de pe serverele proxy. Stocarea in cache este permisa in mod implicit. --no-cookies Dezactiveaza utilizarea modulelor cookie. Modulele cookie sunt un mecanism de meninere a starii pe server. Serverul trimite clientului un modul cookie folosind antetul ,,Set-Cookie", iar clientul raspunde cu acelai modul cookie la solicitarile ulterioare. Deoarece cookie-urile permit proprietarilor de servere sa ina evidena vizitatorilor i siturilor sa faca schimb de aceste informaii, unii le considera o incalcare a vieii private. Opiunea implicita este de a utiliza cookie-uri; cu toate acestea, stocarea cookie-urilor nu este activata in mod implicit. --load-cookies fiier Incarca cookie-urile din fiier inainte de prima recuperare HTTP. fiier este un fiier textual in formatul utilizat iniial de fiierul cookies.txt al Netscape. De obicei, vei utiliza aceasta opiune atunci cand oglindii situri care necesita conectare pentru a accesa o parte sau tot coninutul lor. Procesul de conectare funcioneaza de obicei prin emiterea de catre serverul web a unui modul cookie HTTP la primirea i verificarea acreditarilor dumneavoastra. Cookie-ul este apoi retrimis de catre navigator atunci cand accesai acea parte a sitului, dovedind astfel identitatea dumneavoastra. Oglindirea unui astfel de sit necesita ca wget sa trimita aceleai cookie-uri pe care navigatorul dvs. le trimite atunci cand comunicai cu situl respectiv. Acest lucru se realizeaza prin --load-cookies --- simplu direcionai wget catre locaia fiierului cookies.txt, iar acesta va trimite aceleai cookie-uri pe care le-ar trimite i navigatorul dvs. in aceeai situaie. Diferite navigatoare pastreaza fiierele cookie textuale in locaii diferite: "Netscape 4.x." Cookie-urile sunt in ~/.netscape/cookies.txt. "Mozilla and Netscape 6.x." Fiierul cookie al Mozilla se numete, de asemenea, cookies.txt, situat undeva sub ~/.mozilla, in directorul profilului dvs. Ruta completa ajunge de obicei sa arate oarecum ca ~/.mozilla/default/un-ir-ciudat/cookies.txt. "Internet Explorer." Putei produce un fiier cookie pe care wget il poate utiliza folosind meniul Fiier, Import i Export, Export Cookies. Acest lucru a fost testat cu Internet Explorer 5; nu se garanteaza ca va funciona cu versiunile anterioare. "Other browsers." Daca utilizai un alt navigator pentru a crea cookie-urile, --load-cookies va funciona numai daca putei localiza sau produce un fiier cookie in formatul Netscape pe care wget il ateapta. Daca nu putei utiliza --load-cookies, ar putea exista totui o alternativa. Daca navigatorul dvs. accepta un ,, administrator de cookie-uri", il putei utiliza pentru a vedea cookie-urile utilizate la accesarea sitului pe care il oglindii. Notai numele i valoarea cookie-ului i indicai-i manual lui wget sa trimita acele cookie-uri, ocolind suportul ,,oficial" pentru cookie-uri: wget --no-cookies --header "Cookie: =" --save-cookies fiier Salveaza cookie-urile in fiier inainte de a iei. Acest lucru nu va salva cookie-urile care au expirat sau care nu au un termen de expirare (aa-numitele ,,cookie-uri de sesiune"), dar consultai i opiunea --keep-session-cookies. --keep-session-cookies Atunci cand este specificata, face ca --save-cookies sa salveze i cookie-urile de sesiune. In mod normal, cookie-urile de sesiune nu sunt salvate, deoarece sunt destinate sa fie pastrate in memorie i uitate atunci cand ieii din navigator. Salvarea lor este utila pe siturile care va cer sa va autentificai sau sa vizitai pagina principala inainte de a putea accesa anumite pagini. Cu aceasta opiune, mai multe rulari wget sunt considerate o singura sesiune de navigare in ceea ce privete situl in cauza. Deoarece formatul fiierelor cookie nu conine in mod normal cookie-uri de sesiune, wget le marcheaza cu o data de expirare de 0. Opiunea --load-cookies a lui wget le recunoate ca fiind cookie-uri de sesiune, dar ar putea deruta alte navigatoare. Reinei, de asemenea, ca cookie-urile astfel incarcate vor fi tratate ca alte cookie-uri de sesiune, ceea ce inseamna ca, daca dorii ca --save-cookies sa le pastreze din nou, trebuie sa folosii din nou --keep-session-cookies. --ignore-length Din nefericire, unele servere HTTP (mai exact, programe CGI) trimit anteturi ,,Content-Length" false, ceea ce il face pe wget sa o ia razna, deoarece crede ca nu tot documentul a fost recuperat. Putei depista acest sindrom daca wget incearca din nou i din nou sa obina acelai document, pretinzand de fiecare data ca conexiunea (altfel normala) s-a inchis pe acelai octet. Cu aceasta opiune, wget va ignora antetul ,,Content-Length" --- ca i cum nu ar fi existat niciodata. --header=linie-antet Trimitei linie-antet impreuna cu restul antetelor in fiecare cerere HTTP. Antetul furnizat este trimis aa cum este, ceea ce inseamna ca trebuie sa conina numele i valoarea separate prin doua puncte i nu trebuie sa conina linii noi. Putei defini mai mult de un antet suplimentar specificand --header de mai multe ori. wget --header='Accept-Charset: iso-8859-2' \ --header='Accept-Language: hr' \ http://fly.srk.fer.hr/ Specificarea unui ir gol ca valoare a antetului va terge toate anteturile anterioare definite de utilizator. Incepand cu Wget 1.10, aceasta opiune poate fi utilizata pentru a anula anteturile generate automat. Acest exemplu ii indica lui wget sa se conecteze la localhost, dar sa specifice foo.bar in antetul ,,Host": wget --header="Host: foo.bar" http://localhost/ In versiunile de Wget anterioare versiunii 1.10, o astfel de utilizare a --header a cauzat trimiterea de anteturi duplicate. --compression=tip Selecteaza tipul de comprimare care urmeaza sa fie utilizat. Valorile posibile sunt auto, gzip i none. Daca se specifica auto sau gzip, wget solicita serverului sa comprime fiierul folosind formatul de comprimare gzip. Daca serverul comprima fiierul i raspunde cu campul de antet ,,Content-Encoding" definit in mod corespunzator, fiierul va fi decomprimat automat. Daca se specifica none, wget nu va cere serverului sa comprime fiierul i nu va decomprima niciun raspuns al serverului. Aceasta este valoarea implicita. Suportul pentru comprimare este in prezent experimental. In cazul in care este activat, va rugam sa raportai orice eroare la ,,bug-wget@gnu.org". --max-redirect=numar Specifica numarul maxim de redirecionari care trebuie urmate pentru o resursa. Valoarea implicita este 20, care este de obicei mult mai mult decat este necesar. Cu toate acestea, in acele ocazii in care dorii sa permitei mai multe (sau mai puine), aceasta este opiunea care trebuie utilizata. --proxy-user=utilizator --proxy-password=parola Specifica numele de utilizator utilizator i parola parola pentru autentificarea pe un server proxy. wget le va codifica folosind schema de autentificare ,,basic". Consideraiile de securitate similare cu cele din cazul --http-password se aplica i aici. --referer=url Include antetul ,,Referer: url" in cererea HTTP. Util pentru recuperarea documentelor cu procesare pe server care presupun ca acestea sunt intotdeauna recuperate de catre navigatoarele web interactive i ies corect doar atunci cand Referer este definit la una dintre paginile care indica spre ele. --save-headers Salveaza antetele trimise de serverul HTTP in fiier, inaintea coninutului propriu-zis, cu o linie goala ca separator. -U ir-agent --user-agent=ir-agent Se identifica ca ir-agent faa de serverul HTTP. Protocolul HTTP permite clienilor sa se identifice cu ajutorul unui camp de antet ,,User-Agent". Acest lucru permite distingerea software-ului WWW, de obicei in scopuri statistice sau pentru urmarirea incalcarilor de protocol. wget se identifica in mod normal ca Wget/versiune, versiune fiind numarul versiunii curente a wget. Cu toate acestea, se tie ca unele siteuri au impus politica de adaptare a rezultatului in funcie de informaiile furnizate de ,,User-Agent". Dei, in teorie, nu este o idee atat de rea, aceasta a fost abuzata de servere care au refuzat informaii pentru ali clieni decat (istoric) Netscape sau, mai frecvent, Microsoft Internet Explorer. Aceasta opiune va permite sa modificai linia ,,User-Agent" emisa de wget. Utilizarea acestei opiuni este descurajata, cu excepia cazului in care tii cu adevarat ce facei. Specificarea unui agent utilizator gol cu --user-agent="" ii indica lui wget sa nu trimita antetul ,,User-Agent" in cererile HTTP. --post-data=ir --post-file=fiier Utilizeaza POST ca metoda pentru toate cererile HTTP i trimite datele specificate in corpul cererii. --post-data trimite iruri ca date, in timp ce --post-file trimite coninutul lui fiier. In afara de aceasta, ele funcioneaza exact in acelai mod. In special, ambele ateapta un coninut de forma ,,cheie1=valoare1&key2=valoare2", cu codificare procentuala pentru caracterele speciale; singura diferena este ca una dintre ele ateapta coninutul ca parametru de linie de comanda, iar cealalta accepta coninutul dintr-un fiier. In special, --post-file nu este pentru transmiterea de fiiere ca ataamente la formulare: acestea trebuie sa apara ca date ,,cheie=valoare" (cu codificarea procentuala corespunzatoare), la fel ca orice altceva. wget nu accepta in prezent ,,multipart/form-data" pentru transmiterea de date POST; doar ,,application/x-www-form-urlencoded". Trebuie specificata numai una dintre opiunile --post-data i --post-file. Va rugam sa reinei ca wget nu solicita ca respectivul coninut sa fie de forma "cheie1=valoare1&cheie2=valoare2" i nici nu testeaza acest lucru. wget va transmite pur i simplu orice date care ii sunt furnizate. Cu toate acestea, majoritatea serverelor se ateapta ca datele POST sa fie in formatul de mai sus atunci cand proceseaza formulare HTML. Cand se trimite o cerere POST utilizand opiunea --post-file, wget trateaza fiierul ca pe un fiier binar i va trimite fiecare caracter din cererea POST fara a elimina caracterele de linie noua sau salt de pagina. Orice alte caractere de control din text vor fi, de asemenea, trimise ca atare in cererea POST. Va rugam sa reinei ca wget trebuie sa cunoasca in prealabil dimensiunea datelor POST. Prin urmare, argumentul pentru ,,-post-file" trebuie sa fie un fiier obinuit; specificarea unei FIFO (conducte cu nume) sau a ceva precum /dev/stdin nu va funciona. Nu este foarte clar cum se poate evita aceasta limitare inerenta la HTTP/1.0. Dei HTTP/1.1 introduce transferul chunked (in bucai) care nu necesita cunoaterea in avans a lungimii cererii, un client nu poate utiliza transferul in bucai decat daca tie ca vorbete cu un server HTTP/1.1. i nu poate ti acest lucru pana cand nu primete un raspuns, care la randul sau necesita ca cererea sa fi fost finalizata - o problema de tipul ,,oul i gaina". Nota: Incepand cu versiunea 1.15, in cazul in care wget este redirecionat dupa ce cererea POST este finalizata, comportamentul sau va depinde de codul de raspuns returnat de server. In cazul unei redirecionari 301 Moved Permanently (mutat permanent), 302 Moved Temporarily (mutat temporar) sau 307 Temporary Redirect (redirecionare temporara), wget va continua, in conformitate cu RFC2616, sa trimita o cerere POST. In cazul in care un server dorete ca clientul sa schimbe metoda de solicitare la redirecionare, acesta trebuie sa trimita un cod de raspuns 303. A se vedea seciunea ,,Alt cod de raspuns". Acest exemplu arata cum sa va conectai la un server folosind POST i apoi sa descarcai paginile dorite, probabil accesibile doar utilizatorilor autorizai: # Se conecteaza la server. Acest lucru se poate face doar o singura data. wget --save-cookies cookies.txt \ --post-data 'user=foo&password=bar' \ http://example.com/auth.php # Acum ia pagina sau paginile care ne intereseaza. wget --load-cookies cookies.txt \ -p http://example.com/interesting/article.php Daca serverul utilizeaza cookie-uri de sesiune pentru a urmari autentificarea utilizatorului, cele de mai sus nu vor funciona, deoarece --save-cookies nu le va salva (i nici navigatoarele nu le vor salva), iar fiierul cookies.txt va fi gol. In acest caz, utilizai --keep-session-cookies impreuna cu --save-cookies pentru a fora salvarea cookie-urilor de sesiune. --method=metoda-HTTP In scopul scriptarii RESTful, wget permite trimiterea altor metode HTTP fara a fi nevoie sa le definii in mod explicit folosind --header=linie-antet. wget va utiliza orice ir de caractere care ii este transmis dupa --method ca metoda HTTP catre server. --body-data=ir-date --body-file=fiier-date Trebuie sa fie definita atunci cand este necesar sa se trimita date suplimentare catre server impreuna cu metoda specificata cu ajutorul opiunii --method. --body-data trimite iruri ca date, in timp ce --body-file trimite coninutul lui fiier. In afara de aceasta, ele funcioneaza exact in acelai mod. In prezent, opiunea --body-file nu este pentru transmiterea fiierelor ca un intreg. wget nu accepta in prezent ,,multipart/form-data" pentru transmiterea de date; doar ,,application/x-www-form-urlencoded". In viitor, acest lucru poate fi modificat astfel incat wget sa trimita --body-file ca fiier complet, in loc sa trimita coninutul sau catre server. Va rugam sa fii contieni de faptul ca wget trebuie sa cunoasca in prealabil coninutul datelor BODY i, prin urmare, argumentul pentru --body-file trebuie sa fie un fiier obinuit. Pentru o explicaie mai detaliata, consultai --post-file. Trebuie specificata doar una dintre opiunile --body-data i --body-file. In cazul in care wget este redirecionat dupa ce cererea este finalizata, wget va suspenda metoda curenta i va trimite o cerere GET pana la finalizarea redirecionarii. Acest lucru este valabil pentru toate codurile de raspuns de redirecionare, cu excepia 307 Temporary Redirect (Redirecionare temporara), care este utilizat pentru a specifica in mod explicit ca metoda de solicitare nu trebuie sa se schimbe. O alta excepie este atunci cand metoda este stabilita ,,POST", caz in care se respecta regulile de redirecionare specificate la --post-data. --content-disposition Daca este stabilita la <>, este activat suportul experimental (nu este complet funcional) pentru antetele ,,Content-Disposition". Acest lucru poate duce in prezent la mai multe drumuri dus-intors catre server pentru o cerere ,,HEAD" i se tie ca sufera de cateva erori, motiv pentru care nu este activat in mod implicit. Aceasta opiune este utila pentru unele programe CGI de descarcare de fiiere care utilizeaza antetele ,,Content-Disposition" pentru a descrie numele unui fiier descarcat. Cand este combinata cu opiunile --metalink-over-http i --trust-server-names, un fiier Content-Type: application/metalink4+xml este denumit utilizand campul de nume de fiier ,,Content-Disposition", daca este disponibil. --content-on-error Daca aceasta opiune este stabilita la <>, wget nu va sari peste coninut atunci cand serverul raspunde cu un cod de stare http care indica o eroare. --trust-server-names Daca este definita, la o redirecionare, numele fiierului local se va baza pe adresa URL de redirecionare. In mod implicit, numele fiierului local se bazeaza pe adresa URL originala. In cazul recuperarii recursive, acest lucru poate fi util, deoarece in multe situri web, adresele URL redirecionate corespund unei structuri de fiiere subiacente, in timp ce adresele URL de legatura nu corespund. --auth-no-challenge Daca se specifica aceasta opiune, wget va trimite informaii de autentificare HTTP de baza (nume de utilizator i parola in text simplu) pentru toate solicitarile, la fel cum Wget 1.10.2 i versiunile anterioare faceau in mod implicit. Utilizarea acestei opiuni nu este recomandata i este destinata doar pentru a permite utilizarea unor servere obscure, care nu trimit niciodata provocari de autentificare HTTP, dar accepta informaii de autentificare nesolicitate, adica, in plus faa de autentificarea bazata pe formular. --retry-on-host-error Considera erorile de gazda, cum ar fi ,,Temporary failure in name resolution" (Eec temporar in rezolvarea numelui), ca fiind erori nefatale, tranzitorii. --retry-on-http-error=cod[,cod,...] Considera codurile de raspuns HTTP date ca fiind erori non-fatale, tranzitorii. Furnizeaza ca argument o lista de coduri de raspuns HTTP de 3 cifre, separate prin virgule. Util pentru a rezolva circumstane speciale in care sunt necesare incercari repetate, dar serverul raspunde cu un cod de eroare care, in mod normal, nu este incercat de wget. Astfel de erori pot fi 503 (,,Service Unavailable", serviciu nedisponibil) i 429 (,,Too Many Requests", prea multe cereri). Reincercarile activate de aceasta opiune sunt efectuate sub rezerva limitarilor normale de timp i numar de incercari ale wget. Utilizarea acestei opiuni este destinata doar pentru cazuri speciale de utilizare i, in general, nu este recomandata, deoarece poate fora reincercari chiar i in cazurile in care serverul incearca de fapt sa ii reduca sarcina. Va rugam sa o utilizai cu inelepciune i numai daca tii ce facei. Opiuni HTTPS (SSL/TLS) Pentru a asigura suportul pentru descarcari HTTP (HTTPS) criptate, wget trebuie compilat cu o biblioteca SSL externa. Cea implicita actuala este GnuTLS. In plus, wget accepta i HSTS (HTTP Strict Transport Security). Daca wget este compilat fara suport SSL, niciuna dintre aceste opiuni nu este disponibila. --secure-protocol=protocol Selecteaza protocolul securizat care urmeaza sa fie utilizat. Valorile posibile sunt auto, SSLv2, SSLv3, TLSv1, TLSv1_1, TLSv1_2, TLSv1_3 i PFS. In cazul in care se utilizeaza auto, biblioteca SSL are libertatea de a alege automat protocolul adecvat, ceea ce se realizeaza prin trimiterea unui salut TLSv1. Aceasta este valoarea implicita. Specificarea SSLv2, SSLv3, TLSv1, TLSv1_1, TLSv1_2 sau TLSv1_3 foreaza utilizarea protocolului corespunzator. Acest lucru este util atunci cand se vorbete cu implementari de servere SSL vechi i cu erori care fac dificila alegerea versiunii corecte de protocol de catre biblioteca SSL de baza. Din fericire, astfel de servere sunt destul de rare. Specificarea PFS impune utilizarea aa-numitelor suite de coduri ,,Perfect Forward Security". Pe scurt, PFS adauga securitate prin crearea unei chei unice pentru fiecare conexiune SSL. Aceasta are un impact ceva mai mare asupra CPU-ului clientului i serverului. Utilizam cifrari cunoscute ca fiind sigure (de exemplu, fara MD4) i protocolul TLS. De asemenea, acest mod exclude in mod explicit metodele de schimb de chei non-PFS, cum ar fi RSA. --https-only In modul recursiv, sunt urmate numai legaturile HTTPS. --ciphers Definete irul listei de cifruri. De obicei, acest ir stabilete suitele de cifrare i alte opiuni SSL/TLS pe care utilizatorul dorete sa le foloseasca, intr-o anumita ordine de preferina (GnuTLS il numete ,,ir de prioritate"). Acest ir va fi transmis textual motorului SSL/TLS (OpenSSL sau GnuTLS) i, prin urmare, formatul i sintaxa sa depind de acesta. wget nu il va prelucra sau manipula in niciun fel. Consultai documentaia OpenSSL sau GnuTLS pentru mai multe informaii. --no-check-certificate Nu verifica certificatul serverului in raport cu autoritaile de certificare disponibile. De asemenea, nu se solicita ca numele gazdei URL sa corespunda cu numele comun prezentat de certificat. Incepand cu Wget 1.10, opiunea implicita este de a verifica certificatul serverului in raport cu autoritaile de certificare recunoscute, intrerupand negocierea SSL i intrerupand descarcarea daca verificarea eueaza. Dei acest lucru ofera descarcari mai sigure, rupe interoperabilitatea cu unele situri care funcionau cu versiunile anterioare ale wget, in special cele care utilizeaza certificate auto-semnate, expirate sau nevalide in alt mod. Aceasta opiune foreaza un mod de operare ,,nesigur" care transforma erorile de verificare a certificatelor in avertismente i va permite sa continuai. Daca intampinai erori de ,,verificare a certificatului" sau erori care spun ca ,,numele comun nu corespunde cu numele de gazda solicitat" putei utiliza aceasta opiune pentru a ocoli verificarea i a continua descarcarea. Utilizai aceasta opiune numai daca suntei convins de autenticitatea sitului sau daca nu va pasa de validitatea certificatului acestuia. Este aproape intotdeauna o idee proasta sa nu verificai certificatele atunci cand transmitei date confideniale sau importante. Pentru certificatele interne/auto-semnate, ar trebui sa descarcai certificatul i sa il verificai in loc sa forai acest mod nesigur. Daca suntei foarte sigur ca nu dorii nicio verificare a certificatului, putei specifica ,,--check-certificate=quiet" pentru a-i spune lui wget sa nu afieze niciun avertisment cu privire la certificatele nevalide, dei in majoritatea cazurilor acesta este un lucru greit de facut. --certificate=fiier Utilizeaza certificatul clientului stocat in fiier. Acest lucru este necesar pentru serverele care sunt configurate sa solicite certificate de la clienii care se conecteaza la ele. In mod normal, un certificat nu este necesar i acest fanion este opional. --certificate-type=tip Specifica tipul certificatului clientului. Valorile legale sunt PEM (asumat implicit) i DER, cunoscut i ca ASN1. --private-key=fiier Citete cheia privata din fiier. Acest lucru va permite sa furnizai cheia privata intr-un fiier separat de certificat. --private-key-type=tip Specifica tipul cheii private. Valorile acceptate sunt PEM (valoarea implicita) i DER. --ca-certificate=fiier Utilizeaza fiier ca fiier cu pachetul de certificate ale autoritailor de certificare (,,CA") pentru a verifica omologii. Certificatele trebuie sa fie in format PEM. Fara aceasta opiune, wget cauta certificate CA in locaiile specificate de sistem, alese in momentul instalarii OpenSSL. --ca-directory=director Specifica directorul care conine certificate CA in format PEM. Fiecare fiier conine un certificat CA, iar numele fiierului se bazeaza pe o valoare de suma de control (hash) derivata din certificat. Acest lucru se realizeaza prin prelucrarea unui director de certificate cu ajutorul instrumentului <> furnizat cu OpenSSL. Utilizarea opiunii --ca-directory este mai eficienta decat utilizarea opiunii --ca-certificate atunci cand sunt instalate multe certificate, deoarece ii permite lui wget sa obina certificate la cerere. Fara aceasta opiune, wget cauta certificate CA in locaiile specificate de sistem, alese in momentul instalarii OpenSSL. --crl-file=fiier Specifica un fiier CRL in fiier. Acesta este necesar pentru certificatele care au fost revocate de catre autoritaile de certificare. --pinnedpubkey=fiier/algoritm-sume-control Ii indica lui wget sa utilizeze fiierul cu cheia publica specificata (sau sumele de control ,,hash") pentru a verifica omologul. Acesta poate fi o ruta catre un fiier care conine o singura cheie publica in format PEM sau DER sau orice numar de sume de control sha256 codificate in baza64 precedate de ,,sha256" i separate prin ,,;" La negocierea unei conexiuni TLS sau SSL, serverul trimite un certificat care indica identitatea sa. Din acest certificat se extrage o cheie publica, iar daca aceasta nu se potrivete exact cu cheia (cheile) publica (publice) furnizata (furnizate) pentru aceasta opiune, wget va intrerupe conexiunea inainte de a trimite sau primi date. --random-file=fiier [Numai OpenSSL i LibreSSL] Utilizai fiier ca sursa de date aleatorii pentru alimentarea generatorului de numere pseudoaleatorii pe sistemele fara /dev/urandom. Pe astfel de sisteme, biblioteca SSL are nevoie de o sursa externa de date aleatorii pentru a se iniializa. Datele aleatorii pot fi furniza de EGD (a se vedea opiunea --egd-file mai jos) sau citite dintr-o sursa externa specificata de utilizator. Daca aceasta opiune nu este specificata, wget cauta date aleatorii in $RANDFILE sau, daca aceasta nu este definita, in $HOME/.rnd. Daca primii eroarea ,,Could not seed OpenSSL PRNG; disabling SSL." (Nu s-a putut insamana PRNG OpenSSL; se dezactiveaza SSL.), ar trebui sa furnizai date aleatorii folosind unele dintre metodele descrise mai sus. --egd-file=fiier [Numai OpenSSL] Utilizeaza fiier ca soclu EGD. EGD vine de la Entropy Gathering Daemon (Demon de colectare a entropiei), un program din spaiul utilizatorului care colecteaza date din diverse surse imprevizibile ale sistemului i le pune la dispoziia altor programe care ar putea avea nevoie de ele. Programele de criptare, cum ar fi biblioteca SSL, au nevoie de surse de date aleatorii care nu se repeta pentru a insamana generatorul de numere aleatorii utilizat pentru a produce chei criptografice puternice. OpenSSL permite utilizatorului sa ii specifice propria sursa de entropie folosind variabila de mediu ,,RAND_FILE". Daca aceasta variabila nu este definita sau daca fiierul specificat nu produce suficiente date aleatorii, OpenSSL va citi date aleatorii din soclul EGD specificat folosind aceasta opiune. Daca aceasta opiune nu este specificata (i nu este utilizata comanda de pornire echivalenta), EGD nu este contactat niciodata. EGD nu este necesar pe sistemele Unix moderne care ofera suport pentru /dev/urandom. --no-hsts wget accepta HSTS (HTTP Strict Transport Security, RFC 6797) in mod implicit. Utilizai --no-hsts pentru ca wget sa acioneze ca un agent de utilizator ("User agent": UA) care nu respecta HSTS. Ca urmare, wget va ignora toate antetele ,,Strict-Transport-Security"' i nu va aplica nicio politica HSTS existenta. --hsts-file=fiier In mod implicit, wget ii stocheaza baza de date HSTS in ~/.wget-hsts. Putei utiliza --hsts-file pentru a trece peste acest lucru. wget va utiliza fiierul furnizat ca baza de date HSTS. Acest fiier trebuie sa fie conform cu formatul corect al bazei de date HSTS utilizat de wget. Daca wget nu poate analiza fiierul furnizat, comportamentul este nu este specificat. Baza de date HSTS a wget este un fiier text simplu. Fiecare linie conine o intrare HSTS (adica un sit care a emis un antet ,,Strict-Transport-Security" i care, prin urmare, a specificat o politica HSTS concreta care urmeaza sa fie aplicata). Liniile care incep cu un simbol (,,#")) sunt ignorate de catre wget. Va rugam sa reinei ca, in ciuda acestei facilitai de citire de catre om, modificarea manuala a bazei de date HSTS nu este, in general, o idee buna. O linie de intrare HSTS consta din mai multe campuri separate prin unul sau mai multe spaii albe: " SP [] SP SP SP " Campurile hostname i port indica numele de gazda i portul la care se aplica politica HSTS data. Campul port poate fi zero i va fi, in majoritatea cazurilor. Aceasta inseamna ca numarul portului nu va fi luat in considerare atunci cand se decide daca o astfel de politica HSTS ar trebui aplicata unei anumite cereri (va fi evaluat doar numele de gazda). Atunci cand port este diferit de zero, atat numele de gazda inta, cat i portul vor fi evaluate, iar politica HSTS va fi aplicata numai daca ambele corespund. Aceasta caracteristica a fost inclusa numai in scopuri de testare/dezvoltare. Suita de testare a wget (in testenv/) creeaza baze de date HSTS cu porturi explicite cu scopul de a asigura comportamentul corect al wget. Aplicarea politicilor HSTS la alte porturi decat cele implicite este descurajata de RFC 6797 (a se vedea apendicele B ,,Differences between HSTS Policy and Same-Origin Policy"). Prin urmare, aceasta funcionalitate nu ar trebui utilizata in mediile de producie, iar port va fi de obicei zero. Ultimele trei campuri fac ceea ce se ateapta de la ele. Campul include_subdomains poate fi 1 sau 0 i indica daca subdomeniile domeniului inta ar trebui sa faca i ele parte din politica HSTS data. Campurile created i max-age conin valorile temporale ale momentului in care a fost creata o astfel de intrare (vazuta prima data de wget) i valoarea ,,max-age" definita de HSTS, care stabilete cat timp ar trebui sa ramana activa politica HSTS respectiva, masurata in secunde scurse de la momentul stocat in created. Odata ce acest timp a trecut, politica HSTS respectiva nu va mai fi valabila i va fi in cele din urma eliminata din baza de date. Daca va furnizai propria baza de date HSTS prin --hsts-file, trebuie sa tii ca wget poate modifica fiierul furnizat in cazul in care apare vreo schimbare intre politicile HSTS solicitate de serverele de la distana i cele din fiier. Cand wget iese, actualizeaza efectiv baza de date HSTS prin rescrierea fiierului bazei de date cu noile intrari. Daca fiierul furnizat nu exista, wget va crea unul. Acest fiier va conine noile intrari HSTS. Daca nu a fost generata nicio intrare HSTS (niciun antet ,,Strict-Transport-Security" nu a fost trimis de niciunul dintre servere), atunci nu va fi creat niciun fiier, nici macar unul gol. Acest comportament se aplica i fiierului implicit al bazei de date (~/.wget-hsts): acesta nu va fi creat pana cand un server nu aplica o politica HSTS. Se are grija sa nu se anuleze eventualele modificari efectuate de alte procese wget in acelai timp asupra bazei de date HSTS. Inainte de a transfera intrarile HSTS actualizate in fiier, wget il va citi din nou i va fuziona modificarile. Utilizarea unei baze de date HSTS personalizate i/sau modificarea uneia existente este descurajata. Pentru mai multe informaii despre potenialele ameninari la adresa securitaii care decurg dintr-o astfel de practica, consultai seciunea 14 ,,Security Considerations" din RFC 6797, in special seciunea 14.9 ,,Creative Manipulation of HSTS Policy Store". --warc-file=fiier Utilizeaza fiier ca fiier WARC de destinaie. --warc-header=ir Insereaza irul intr-o inregistrare warcinfo. --warc-max-size=dimensiune Stabilete dimensiunea maxima a fiierelor WARC la dimensiune. --warc-cdx Scrie fiierele index CDX. --warc-dedup=fiier Nu stocheaza inregistrarile listate in acest fiier CDX. --no-warc-compression Nu comprima fiierele WARC cu GZIP. --no-warc-digests Nu calculeaza sumele de control SHA1. --no-warc-keep-log Nu stocheaza fiierul de jurnalizare intr-o inregistrare WARC. --warc-tempdir=director Specifica locaia pentru fiierele temporare create de scriitorul WARC. Opiuni FTP --ftp-user=utilizator --ftp-password=parola Specifica numele de utilizator utilizator i parola parola pe un server FTP. Fara aceasta opiune sau fara opiunea de pornire corespondenta, parola implicita este -wget@, utilizata in mod normal pentru FTP anonim. O alta modalitate de a specifica numele de utilizator i parola este chiar in URL. Oricare dintre aceste metode dezvaluie parola oricarei persoane care se obosete sa ruleze <>. Pentru a preveni vizualizarea parolelor, stocai-le in .wgetrc sau .netrc i asigurai-va ca protejai aceste fiiere de ali utilizatori cu <>. Daca parolele sunt foarte importante, nu le lasai nici in aceste fiiere - editai fiierele i tergei-le dupa ce wget a inceput descarcarea. --no-remove-listing Nu elimina fiierele temporare .listing generate de extragerile FTP. In mod normal, aceste fiiere conin listele brute de directoare primite de la serverele FTP. Neeliminarea lor poate fi utila in scopuri de depanare sau atunci cand dorii sa putei verifica cu uurina coninutul directoarelor serverului de la distana (de exemplu, pentru a verifica daca o oglinda pe care o executai este completa). Reinei ca, dei wget scrie intr-un nume de fiier cunoscut pentru acest fiier, aceasta nu este o brea de securitate in scenariul in care un utilizator face din .listing o legatura simbolica catre /etc/passwd sau ceva asemanator i cere ca ,,root" sa ruleze wget in directorul sau. In funcie de opiunile utilizate, fie wget va refuza sa scrie in .listing, facand ca operaia de globalizare/recursiune/marcaj-temporal sa eueze, fie legatura simbolica va fi tearsa i inlocuita cu fiierul .listing real, fie lista va fi scrisa intr-un fiier .listing.numar. Chiar daca aceasta situaie nu este o problema, ,,root" nu ar trebui sa ruleze niciodata wget in directorul unui utilizator care nu este de incredere. Un utilizator ar putea face ceva la fel de simplu ca legarea index.html la /etc/passwd i sa ceara ca ,,root\[u201D] sa ruleze wget cu -N sau -r astfel incat fiierul sa fie suprascris. --no-glob Dezactiveaza globalizarea FTP. Globalizarea se refera la utilizarea caracterelor speciale de tip shell (caractere joker), cum ar fi *, ?, [ i ] pentru a extrage mai multe fiiere din acelai director simultan, cum ar fi: wget ftp://gnjilux.srk.fer.hr/*.msg In mod implicit, globalizarea va fi activata daca adresa URL conine un caracter de globalizare. Aceasta opiune poate fi utilizata pentru activarea sau dezactivarea permanenta a globalizarii. Este posibil sa fie necesar sa punei intre ghilimele adresa URL pentru a o proteja de extinderea de catre shell. Globalizarea face ca wget sa caute o lista de directoare, care este specifica sistemului. Acesta este motivul pentru care funcioneaza in prezent numai cu serverele FTP Unix (i cele care emuleaza ieirea <> Unix). --no-passive-ftp Dezactiveaza utilizarea modului de transfer FTP pasiv. FTP pasiv impune ca clientul sa se conecteze la server pentru a stabili conexiunea de date i nu invers. Daca maina este conectata direct la internet, atat FTP pasiv, cat i FTP activ ar trebui sa funcioneze la fel de bine. In majoritatea configuraiilor cu paravan de protecie i NAT, FTP pasiv are mai multe anse sa funcioneze. Cu toate acestea, in unele configuraii rare de paravan de protecie, FTP activ funcioneaza atunci cand FTP pasiv nu funcioneaza. Daca banuii ca acesta este cazul, utilizai aceasta opiune sau configurai ,,passive_ftp=off" in fiierul de iniiere (init). --preserve-permissions Pastreaza permisiunile fiierului de la distana in loc de permisiunile stabilite de umask. --retr-symlinks In mod implicit, atunci cand se recupereaza directoare FTP recursiv i se intalnete o legatura simbolica, legatura simbolica este traversata i fiierele indicate sunt recuperate. In prezent, wget nu traverseaza legaturile simbolice catre directoare pentru a le descarca recursiv, dei aceasta caracteristica poate fi adaugata in viitor. Atunci cand se specifica --retr-symlinks=no, fiierul legat nu este descarcat. In schimb, este creata o legatura simbolica corespunzatoare pe sistemul de fiiere local. Fiierul indicat nu va fi recuperat decat daca aceasta recuperare recursiva l-ar fi intalnit separat i l-ar fi descarcat oricum. Aceasta opiune prezinta un risc de securitate in cazul in care un server FTP rau intenionat poate determina ca wget sa scrie in fiiere din afara directoarelor vizate printr-un fiier ,,.LISTING" special creat. Reinei ca atunci cand se recupereaza un fiier (nu un director) pentru ca a fost specificat in linia de comanda, mai degraba decat pentru ca a fost apelat, aceasta opiune nu are niciun efect. Legaturile simbolice sunt intotdeauna traversate in acest caz. Opiuni FTPS --ftps-implicit Aceasta opiune ii transmite lui wget sa utilizeze FTPS implicit. FTPS implicit consta in iniializarea SSL/TLS chiar de la inceputul conexiunii de control. Aceasta opiune nu trimite o comanda ,,AUTH TLS": presupune ca serverul inelege FTPS i incepe direct o conexiune SSL/TLS. Daca incercarea are succes, sesiunea continua la fel ca FTPS obinuit (,,PBSZ" i ,,PROT" sunt trimise, etc.). FTPS implicit nu mai este o cerina pentru implementarile FTPS i, prin urmare, este posibil ca multe servere sa nu il accepte. Daca se trece --ftps-implicit i nu se specifica niciun numar de port explicit, se va utiliza portul implicit pentru FTPS implicit, 990, in locul portului implicit pentru FTPS ,,normal" (explicit) care este acelai cu cel pentru FTP, 21. --no-ftps-resume-ssl Nu reia sesiunea SSL/TLS din canalul de date. Atunci cand pornete o conexiune de date, wget incearca sa reia sesiunea SSL/TLS pornita anterior in conexiunea de control. Reluarea sesiunii SSL/TLS evita efectuarea unei negocieri complet noua prin reutilizarea parametrilor SSL/TLS ai unei sesiuni anterioare. De obicei, serverele FTPS doresc acest lucru, astfel incat wget face acest lucru in mod implicit. Cu toate acestea, in circumstane rare, s-ar putea dori inceperea unei sesiuni SSL/TLS complet noi in fiecare conexiune de date. Acesta este scopul opiunii --no-ftps-resume-ssl. --ftps-clear-data-connection Toate conexiunile de date vor fi in text simplu. Numai conexiunea de control va fi sub SSL/TLS. wget va trimite o comanda ,,PROT C" pentru a realiza acest lucru, care trebuie aprobata de server. --ftps-fallback-to-ftp Revine la FTP daca FTPS nu este acceptat de serverul inta. Din motive de securitate, aceasta opiune nu este declarata in mod implicit. Comportamentul implicit este de a iei cu o eroare. Daca un server nu raspunde cu succes la comanda iniiala ,,AUTH TLS" sau, in cazul FTPS implicit, daca incercarea iniiala de conexiune SSL/TLS este respinsa, se considera ca serverul respectiv nu accepta FTPS. Opiuni reincercare recursiva -r --recursive Activeaza reincercarea recursiva a descarcarii. Valoarea maxima implicita a adancimii de descarcare este 5. -l adancimea --level=adancimea Stabilete numarul maxim de subdirectoare in care wget va cauta recursiv la adancimea. Pentru a preveni descarcarea accidentala a unor situri web foarte mari atunci cand se utilizeaza recursiunea, aceasta este limitata implicit la o adancime de 5, adica va parcurge cel mult 5 directoare in adancime pornind de la adresa URL furnizata. Definii -l 0 sau -l inf pentru o adancime de recursiune infinita. wget -r -l 0 http:///1.html In mod ideal, ne-am atepta ca aceasta sa descarce doar 1.html. dar, din pacate, nu este cazul, deoarece -l 0 este echivalent cu -l inf - adica, recursiune infinita. Pentru a descarca o singura pagina HTML (sau o mana de pagini), specificai-le pe toate in linia de comanda i lasai deoparte -r i -l. Pentru a descarca elementele eseniale pentru vizualizarea unei singure pagini HTML, consultai opiunea --page-requisites. --delete-after Aceasta opiune ii indica lui wget sa tearga fiecare fiier pe care il descarca, dupa ce a facut acest lucru. Este utila pentru preluarea prealabila a paginilor populare prin intermediul unui proxy, de exemplu: wget -r -nd --delete-after http://whatever.com/~popular/page/ Opiunea -r este pentru recuperarea recursiva, iar -nd pentru a nu crea directoare. Reinei ca --delete-after terge fiierele de pe maina locala. Aceasta nu emite comanda DELE catre siturile FTP de la distana, de exemplu. De asemenea, reinei ca atunci cand se specifica opiunea --delete-after, opiunea --convert-links este ignorata, astfel incat fiierele .orig pur i simplu nu sunt create in primul rand. -k --convert-links Dupa finalizarea descarcarii, convertete legaturile din document pentru a le face adecvate pentru vizualizarea locala. Acest lucru afecteaza nu numai hiperlegaturile vizibile, ci i orice parte a documentului care trimite la coninut extern, cum ar fi imagini incorporate, legaturi catre foi de stil, hiperlegaturile catre coninut non-HTML etc. Fiecare legatura va fi modificata in unul dintre cele doua moduri: o Legaturile catre fiierele care au fost descarcate de wget vor fi modificate pentru a se referi la fiierul catre care indica ca o legatura relativa. Exemplu: daca fiierul descarcat /foo/doc.html are legatura cu /bar/img.gif, de asemenea descarcat, atunci legatura din doc.html va fi modificata pentru a indica catre ../bar/img.gif. Acest tip de transformare funcioneaza fiabil pentru combinaii arbitrare de directoare. o Legaturile catre fiierele care nu au fost descarcate de wget vor fi modificate pentru a include numele gazdei i ruta absoluta a locaiei catre care indica. Exemplu: daca fiierul descarcat /foo/doc.html trimite la /bar/img.gif (sau la ../bar/img.gif), atunci legatura din doc.html va fi modificata pentru a trimite la http://hostname/bar/img.gif. Din acest motiv, navigarea locala funcioneaza fiabil: daca un fiier vinculat (catre care se indica) a fost descarcat, legatura se va referi la numele sau local; daca nu a fost descarcat, legatura se va referi la adresa sa completa de internet, in loc sa prezinte o legatura intrerupta. Faptul ca legaturile anterioare sunt convertite in legaturi relative asigura faptul ca putei muta ierarhia descarcata intr-un alt director. Reinei ca numai la incheierea descarcarii wget poate ti ce legaturi au fost descarcate. Din aceasta cauza, activitatea efectuata de -k va fi realizata la sfaritul tuturor descarcarilor. --convert-file-only Aceasta opiune convertete numai partea de nume de fiier a adreselor URL, lasand restul adresei URL neatinsa. Aceasta parte a numelui de fiier este uneori denumita ,,nume de baza", dei evitam acest termen aici pentru a nu crea confuzii. Funcioneaza deosebit de bine in combinaie cu --adjust-extension, dei aceasta asociere nu este impusa. Se dovedete utila pentru popularea cache-lor Internet cu fiiere descarcate de la diferite gazde. Exemplu: daca o legatura trimite la //foo.com/bar.cgi?xyz cu --adjust-extension declarata i destinaia sa locala este ./foo.com/bar.cgi?xyz.css, atunci legatura va fi convertita in //foo.com/bar.cgi?xyz.css. Observai ca numai partea cu numele fiierului a fost modificata. Restul adresei URL a fost lasat neatins, inclusiv ruta neta (,,//"') care altfel ar fi prelucrata de wget i convertita in schema efectiva (adica ,,http://"). -K --backup-converted Atunci cand convertete un fiier, face o copie de rezerva a versiunii originale cu un sufix .orig. Afecteaza comportamentul opiunii -N. -m --mirror Activeaza opiunile potrivite pentru oglindire. Aceasta opiune activeaza recursivitatea i marcarea timpului, stabilete adancimea de recursivitate infinita i pastreaza listele de directoare FTP. In prezent, este echivalenta cu -r -N -l inf --no-remove-listing. -p --page-requisites Aceasta opiune face ca wget sa descarce toate fiierele care sunt necesare pentru a afia corect o anumita pagina HTML. Aceasta include elemente precum imagini inserate, sunete i foi de stil asociate. In mod normal, atunci cand se descarca o singura pagina HTML, nu sunt descarcate toate documentele necesare pentru afiarea corecta a acesteia. Utilizarea opiunii -r impreuna cu opiunea -l poate ajuta, dar deoarece wget nu face in mod normal distincie intre documentele externe i cele incluse, ramanem in general cu ,,documente frunza" carora le lipsesc elementele necesare. De exemplu, sa spunem ca documentul 1.html conine o eticheta ,," care face referire la 1.gif i o eticheta ,," care trimite la documentul extern 2.html. Sa spunem ca 2.html este similar, dar ca imaginea sa este 2.gif i se leaga de 3.html. Sa spunem ca acest lucru continua pana la un numar arbitrar de mare. Daca cineva executa comanda: wget -r -l 2 http:///1.html atunci 1.html, 1.gif, 2.html, 2.gif i 3.html vor fi descarcate. Dupa cum putei vedea, 3.html nu are 3.gif necesar, deoarece wget numara pur i simplu numarul de salturi (pana la 2) de la 1.html pentru a determina unde sa opreasca recursiunea. In schimb, cu aceasta comanda: wget -r -l 2 -p http:///1.html vor fi descarcate toate fiierele de mai sus i imaginea 3.gif ceruta de 3.html. In mod similar, wget -r -l 1 -p http:///1.html va face ca 1.html, 1.gif, 2.html i 2.gif sa fie descarcate. S-ar putea crede ca: wget -r -l 0 -p http:///1.html ar descarca doar 1.html i 1.gif, dar, din pacate, acesta nu este cazul, deoarece -l 0 este echivalent cu -l inf - adica, recursiune infinita. Pentru a descarca o singura pagina HTML (sau o mana de pagini HTML, toate specificate in linia de comanda sau intr-un fiier de intrare cu adrese URL ca argument al opiunii -i) i cerinele acesteia (sau ale acestora), este suficient sa renunai la -r i -l: wget -p http:///1.html Reinei ca wget se va comporta ca i cum -r ar fi fost specificata, dar vor fi descarcate numai pagina respectiva i cerinele sale. Legaturile din pagina respectiva catre documente externe nu vor fi urmarite. De fapt, pentru a descarca o singura pagina i toate cerinele sale (chiar daca acestea exista pe situri web separate) i pentru a se asigura ca lotul se afieaza corect la nivel local, acestui autor ii place sa utilizeze cateva opiuni in plus faa de -p: wget -E -H -k -K -p http:/// Pentru a incheia acest subiect, merita sa tii ca ideea lui wget de legatura externa a unui document este orice adresa URL specificata intr-o eticheta ,,", o eticheta ,,", sau o eticheta ,," alta decat ,,". --strict-comments Activeaza analizarea stricta a comentariilor HTML. In mod implicit, comentariile se termina la prima apariie a lui -->. Conform specificaiilor, comentariile HTML sunt exprimate ca declaraii SGML. Declaraia este un marcaj special care incepe cu i se termina cu >, cum ar fi , care poate conine comentarii intre o pereche de delimitatori --. Comentariile HTML sunt ,,declaraii goale", declaraii SGML fara niciun text non-comentariu. Prin urmare, este un comentariu valid, la fel i , dar nu este. Pe de alta parte, majoritatea celor ce scriu pagini HTML nu percep comentariile ca fiind altceva decat text delimitat cu , ceea ce nu este chiar acelai lucru. De exemplu, ceva de genul funcioneaza ca un comentariu valid atat timp cat numarul de liniue este multiplu de patru (!). In caz contrar, comentariul dureaza tehnic pana la urmatorul --, care poate fi la celalalt capat al documentului. Din aceasta cauza, muli navigatori web populari ignora complet specificaia i implementeaza ceea ce utilizatorii se ateapta: comentarii delimitate cu . Pana la versiunea 1.9, wget a interpretat comentariile in mod strict, ceea ce a dus la lipsa legaturilor in multe pagini web care se afiau bine in navigatori, dar aveau ghinionul de a conine comentarii neconforme. Incepand cu versiunea 1.9, wget a intrat in randul clienilor care implementeaza comentarii ,,naive", terminand fiecare comentariu la prima apariie a lui -->. Daca, din orice motiv, dorii o analiza stricta a comentariilor, utilizai aceasta opiune pentru a o activa. Opiuni acceptare/respingere recursiva -A lista-acceptare --accept lista-acceptare -R lista-respingere --reject lista-respingere Specifica liste separate prin virgule de sufixe sau modele de nume de fiier pentru a fi acceptate sau respinse. Reinei ca daca oricare dintre caracterele joker, *, ?, [ sau ], apare intr-un element din lista-acceptare sau lista-respingere, acesta va fi tratat ca un model, mai degraba decat ca un sufix. In acest caz, trebuie sa includei modelul in ghilimele pentru a impiedica shell-ul sa il extinda, ca in -A "*.mp3" sau -A '*.mp3'. --accept-regex exp-reg_url --reject-regex exp-reg_url Specifica o expresie regulata pentru a accepta sau respinge adresa URL completa. --regex-type tip_exp-reg Specifica tipul expresiei regulate. Tipurile posibile sunt posix sau pcre. Reinei ca pentru a putea utiliza tipul pcre, wget trebuie sa fie compilat cu suport ,,libpcre". -D lista-domenii --domains=lista-domenii Definete domeniile care urmeaza sa fie urmarite. lista-domenii este o lista de domenii separate prin virgule. Reinei ca aceasta nu activeaza -H. --exclude-domains lista-domenii Specifica domeniile care nu trebuie urmate. --follow-ftp Urmarete legaturile FTP din documentele HTML. Fara aceasta opiune, wget va ignora toate legaturile FTP. --follow-tags=lista wget are un tabel intern de perechi de etichete / atribute HTML pe care le ia in considerare atunci cand cauta documente cu legaturi in timpul unei extrageri recursive. Cu toate acestea, daca un utilizator dorete ca numai un subset din aceste etichete sa fie luate in considerare, el sau ea ar trebui sa specifice aceste etichete intr- o lista separata prin virgule, cu aceasta opiune. --ignore-tags=lista Aceasta este opusul opiunii --follow-tags. Pentru a sari peste anumite etichete HTML atunci cand cautai recursiv documente pentru descarcare, specificai-le intr-o lista separata prin virgule. In trecut, aceasta opiune era cea mai buna opiune pentru descarcarea unei singure pagini i a cerinelor sale, utilizand o linie de comanda precum: wget --ignore-tags=a,area -H -k -K -r http:/// Cu toate acestea, autorul acestei opiuni a dat peste o pagina cu etichete precum ,," i i-a dat seama ca specificarea etichetelor de ignorat nu era suficienta. Nu se poate spune pur i simplu lui wget sa ignore ,,", pentru ca atunci foile de stil nu vor fi descarcate. Acum, cel mai bun pariu pentru a descarca o singura pagina i cerinele acesteia este opiunea dedicata --page-requisites. --ignore-case Ignora diferenele dintre majuscule i minuscule la potrivirea fiierelor i directoarelor. Aceasta influeneaza comportamentul opiunilor -R, -A, -I i -X, precum i globalizarea (folosirea caracterelor joker la crearea modelelor de cautat) implementata la descarcarea de pe situri FTP. De exemplu, cu aceasta opiune, -A "*.txt" se va potrivi cu fiier1.txt, dar i cu fiier2.TXT, fiier3.TxT i aa mai departe. Ghilimelele din exemplu sunt pentru a impiedica shell-ul sa extinda modelul. -H --span-hosts Activeaza traversarea intre gazde atunci cand se efectueaza recuperarea recursiva. -L --relative Urmeaza numai legaturile relative. Utila pentru recuperarea unei pagini de pornire (principale) specifice, fara nicio distragere a ateniei, nici macar a celor de la aceleai gazde. -I lista --include-directories=lista Specifica o lista de directoare separate prin virgule pe care doreti sa le urmareti la descarcare. Elementele din lista pot conine caractere joker. -X lista --exclude-directories=lista Specifica o lista de directoare separate prin virgule pe care doreti sa le excluzi de la descarcare. Elementele din lista pot conine caractere joker. -np --no-parent Nu urca niciodata la directorul parinte atunci cand se face o recuperare recursiva. Aceasta este o opiune utila, deoarece garanteaza ca vor fi descarcate numai fiierele aflate sub o anumita ierarhie. MEDIU wget accepta proxy-uri atat pentru preluarile HTTP, cat i pentru FTP. Modul standard de a specifica locaia proxy-ului, recunoscut de wget, este prin utilizarea urmatoarelor variabile de mediu: http_proxy https_proxy Daca sunt definite, variabilele http_proxy i https_proxy trebuie sa conina adresele URL ale proxy-urilor pentru conexiunile HTTP i, respectiv, HTTPS. ftp_proxy Aceasta variabila trebuie sa conina adresa URL a proxy-ului pentru conexiunile FTP. Este destul de frecvent ca http_proxy i ftp_proxy sa fie definite cu aceeai adresa URL. no_proxy Aceasta variabila ar trebui sa conina o lista de extensii de domeniu separate prin virgule pentru care proxy nu ar trebui sa fie utilizat. De exemplu, daca valoarea lui no_proxy este .mit.edu, proxy nu va fi utilizat pentru a extrage documente de la MIT. STARE DE IEIRE wget poate returna unul dintre mai multe coduri de eroare in cazul in care intampina probleme. 0 Nu au aparut probleme. 1 Cod de eroare generic. 2 Eroare de analizare -- de exemplu, la analizarea opiunilor liniei de comanda, .wgetrc sau .netrc... 3 Eroare de intrare/ieire asupra fiierului. 4 Eroare de reea. 5 Verificarea SSL a euat. 6 Autentificarea nume de utilizator/parola a euat. 7 Erori de protocol. 8 Serverul a emis un raspuns de eroare. Cu excepia codurilor 0 i 1, codurile de ieire cu numere mai mici au prioritate faa de cele cu numere mai mari, atunci cand sunt intalnite mai multe tipuri de erori. In versiunile de wget anterioare versiunii 1.12, starea de ieire a wget tindea sa fie nefolositoare i inconsecventa. Descarcarile recursive returnau practic intotdeauna 0 (succes), indiferent de problemele intampinate, iar descarcarile nerecursive returnau doar starea corespunzatoare celei mai recente incercari de descarcare. FIIERE /usr/local/etc/wgetrc Locaia implicita a fiierului de configurare global (la nivel de sistem). .wgetrc Fiierul de configurare al utilizatorului pentru wget. ERORI Va invitam sa trimitei rapoarte de erori prin intermediul sistemului de urmarire a erorilor GNU Wget (consultai ) sau pe lista noastra de corespondena . Vizitai pentru a obine mai multe informaii (cum sa va abonai, arhivele listei, ...). Inainte de a trimite un raport de eroare, va rugam sa incercai sa urmai cateva reguli simple. 1. Va rugam sa incercai sa va asigurai ca comportamentul pe care il observai este intr-adevar o eroare. Daca wget se blocheaza, este o eroare. Daca wget nu se comporta conform documentaiei, este o eroare. Daca lucrurile funcioneaza ciudat, dar nu suntei sigur de modul in care ar trebui sa funcioneze, s-ar putea sa fie o eroare, dar ai putea dori sa verificai din nou documentaia i listele de discuii. 2. Incercai sa repetai eroarea in circumstane cat mai simple posibil. De exemplu, daca wget se ,,prabuete" in timp ce descarcai wget -rl0 -kKE -t5 --no-proxy http://example.com -o /tmp/log, ar trebui sa incercai sa vedei daca blocajul se repeta i daca va aparea cu un set mai simplu de opiuni. Ai putea incerca chiar sa incepei descarcarea de la pagina unde a avut loc accidentul pentru a vedea daca pagina respectiva a declanat cumva accidentul. De asemenea, dei probabil voi fi interesat sa cunosc coninutul fiierului dvs. .wgetrc, este probabil o idee proasta sa il introducei direct in mesajul de depanare. In schimb, ar trebui sa incercai mai intai sa vedei daca problema se repeta cu .wgetrc mutat din loc. Doar daca se dovedete ca parametrii .wgetrc afecteaza problema, trimitei-mi prin e-mail parile relevante din fiier. 3. Va rugam sa pornii wget cu opiunea -d i sa ne trimitei rezultatul (sau parile relevante ale acestuia). Daca wget a fost compilat fara suport de depanare, recompilai-l - este mult mai uor sa depistai erorile cu suportul de depanare activat. Nota: va rugam sa va asigurai ca eliminai orice informaie potenial sensibila din jurnalul de depanare inainte de a-l trimite la adresa sistemului de urmarire a erorilor. Opiunea ,,-d"' nu se va stradui sa colecteze informaii sensibile, dar jurnalul va conine o transcriere destul de completa a comunicarii lui wget cu serverul, care poate include parole i bucai de date descarcate. Deoarece adresa sistemului de urmarire a erorilor este arhivata public, putei presupune ca toate rapoartele de erori sunt vizibile pentru public. 4. Daca wget s-a prabuit, incercai sa il rulai intr-un depanator, de exemplu <> i tastai ,,where" pentru a obine urmarirea. Acest lucru poate sa nu funcioneze daca administratorul de sistem a dezactivat fiierele ,,core", dar este sigur sa incercai. CONSULTAI I Acesta nu este manualul complet pentru GNU Wget. Pentru informaii mai complete, inclusiv explicaii mai detaliate ale unora dintre opiuni i o serie de comenzi disponibile pentru utilizarea cu fiierele .wgetrc i opiunea -e, consultai intrarea GNU Info pentru wget. Consultai i wget2(1), versiunea actualizata a GNU Wget cu suport i mai bun pentru descarcarea recursiva i protocoale moderne precum HTTP/2. AUTOR Scris iniial de Hrvoje Niksic . Meninut in prezent de Darshit Shah i Tim Ruhsen . DREPTURI DE AUTOR Drepturi de autor (C) 1996--2011, 2015, 2018--2024 Free Software Foundation, Inc. Se acorda permisiunea de a copia, distribui i/sau modifica acest document in conformitate cu termenii Licenei GNU Free Documentation, versiunea 1.3 sau orice versiune ulterioara publicata de Free Software Foundation; fara seciuni invariante, fara texte de coperta i fara texte de contra coperta. O copie a licenei este inclusa in seciunea intitulata ,,GNU Free Documentation License". TRADUCERE Traducerea in limba romana a acestui manual a fost facuta de Remus- Gabriel Chelu Aceasta traducere este documentaie gratuita; citii Licena publica generala GNU Versiunea 3 sau o versiune ulterioara cu privire la condiii privind drepturile de autor. NU se asuma NICIO RESPONSABILITATE. Daca gasii erori in traducerea acestui manual, va rugam sa trimitei un e-mail la . GNU Wget 1.24.5 26 iunie 2024 WGET(1)