Wget este un manager de descărcare open-source. Este o aplicație de consolă dezvoltată în principal pentru Linux, dar portată cu succes pe alte sisteme de operare, inclusiv Windows și MacOS.
driver de imprimare hp
Dacă nu sunteți familiarizat cu wget, cu siguranță ar trebui să îl încercați. Este foarte puternic. Permite preluarea fișierelor de pe site-uri web folosind HTTP, HTTPS și FTP, protocoalele de Internet pe care le folosim în prezent. Comportamentul său este controlat de argumentele liniei de comandă.
Wget acceptă o varietate de opțiuni pentru a prelua fișiere pe conexiuni lente sau instabile, inclusiv reîncercări, continuare acolo unde a rămas și multe altele. Acceptă fișierul „robots.txt”, astfel încât poate funcționa ca un crawler web. Poate prelua numai fișierele modificate, acceptă metacaractere, limite de tip de fișier și extensii obișnuite.
Wget acceptă regăsirea recursivă a site-urilor web HTML și a serverelor FTP, permițându-vă să creați o oglindă a site-ului web. Iată cum se poate face.
Înainte de a continua, trebuie să obțineți aplicația wget.
Cuprins ascunde Obțineți Wget pe Windows Obțineți Wget pe Linux Debian/Ubuntu/Mint: CentOS/Redhat Arch Linux Void Linux Pentru a face o copie offline a unui site cu Wget,Obțineți Wget pe Windows
De obicei folosesc binare din aceste surse:
Amândoi își fac treaba.
Obțineți Wget pe Linux
Utilizați managerul de pachete al distribuției dvs. Câteva exemple (rulați-le ca root):
Debian/Ubuntu/Mint:
|_+_|
CentOS/Redhat
|_+_|
Arch Linux
|_+_|
Void Linux
|_+_|
Pentru a face o copie offline a unui site cu Wget,
- Deschideți promptul de comandă/terminalul.
- Pe Windows, tastați calea completă către fișierul wget.exe.
- Pe Linux, tastați doar wget.
- Acum, tastați următoarele argumente pentru a obține următoarea comandă: |_+_|
- Înlocuiți |_+_| porțiune cu adresa URL reală a site-ului pe care doriți să o faceți o oglindă.
Esti gata!
Iată comutatoarele pe care le folosim:
- |_+_| - aplică o serie de opțiuni pentru a face descărcarea recursivă.
- |_+_| – Nu accesați cu crawlere directorul părinte pentru a obține doar o parte a site-ului.
- |_+_| - face ca toate linkurile să funcționeze corect cu copia offline.
- |_+_| - descărcați fișiere JS și CSS pentru a păstra stilul original al paginii atunci când răsfoiți o oglindă locală.
- |_+_| - adaugă extensiile corespunzătoare (de exemplu, html, css, js) fișierelor dacă acestea au fost preluate fără ele.
Asta este.