Mám otázku, tip na článok, alebo blog4all@blog4all.sk

blog4all.sk

blog4all.sk – PC tipy a triky, software rady, návody

Ako filtrovať a sťahovať obrázky z webových stránok

Extrahujte obrázky a informácie o obrázkoch z akéhokoľvek webu a uložte si vyextrahované obrázky na disk.

Občas môžeme potrebovať získať z určitého webu niektoré, prípadne všetky obrázky, prípadne môžeme chcieť získať prehľad o obrázkoch ako sú popisy, či rozmery obrázkov. Základné možnosti ukladania obrázkov ponúkajú aj samotné prehliadače. Ide o uloženie webovej stránky spolu s obrázkami. Nemožno však nijako ovplyvniť názvy ukladaných obrázkov, ani ktoré z obrázkov sa uložia. U väčšiny prehliadačov sa navyše neuložia zďaleka všetky obrázky z danej stránky, napr. obrázky definované cez kaskádové štýly. Taktiež je možné uložiť iba obrázky z konkrétnej stránky a nie hĺbkovo z podstránok.

Tieto a mnoho ďalších vecí adresuje webová aplikácia OWIDIG – Online Webpage Image Downloader and ImageInfo Grabber, teda online webový sťahovač obrázkov a extrahovač informácií o obrázkoch.

 

Ako extrahovať obrázky pomocou OWIDIG-u

Prejdite na adresu owidig.com. Zadajte URL, z ktorej chcete sťahovať obrázky, napr. adresu tohto blogu (stlačením Enteru alebo kliknutím na obrázok lupy).

Následne sa začnú zobrazovať v prehľadnom zozname obrázky zo zadanej stránky. Sú 2 módy zobrazenia, listový LIST mód a tabuľkový TABLE mód.

 

Výpis obrázkov v LIST móde

Výpis obrázkov v TABLE móde

V LIST móde sú zobrazované náhľady obrázkov jeden po druhom spolu s názvami obrázkov. Po prejdení myšou nad niektorý z obrázkov získame o niečo väčší náhľad spolu s ďalšími informáciami (rozmery obrázku, popis obrázku, plná adresa obrázku) a tlačidlami pre zdieľanie v rôznych sociálnych sieťach.

V TABLE móde máme obrázky vykreslené v 2 tabuľkách. V jednej pre štandardné obrázky a v druhej pre obrázky definované v rámci CSS kaskádových štýlov. Tabuľky obsahujú stĺpce rozmerov obrázkov, ich typu, zdrojovej adresy a popisu. Kliknutím na hlavičku niektorého zo stĺpcov možno tieto obrázky zotriediť podľa príslušného stĺpca.

Ďalšou základnou možnosťou je možnosť povoliť, alebo nepovoliť opakujúce sa obrázky zaškrtnutím/nezašrktnutím voľby Don’t include repeated images. Voľbou Deep grab možno aktivovať hĺbkovú extrakciu obrázkov (rekurzívne v stránke obsiahnutých odkazoch z rovnakej domény), prípadne extrahovať obrázkový obsah vygenerovaný pomocou JavaScriptu. Zaškrtnutím tejto voľby sa zobrazí nasledujúce okno:

V tomto okne možno presne nastaviť parametre hĺbkovej extrakcie.

Poslednou voľbou v hlavnom paneli je tlačidlo Get Link. Stlačením tohto tlačidla sa zobrazí nasledujúce okno:

V okne sa nachádza textové pole s vygenerovanou URL adresou. Táto adresa predstavuje aktuálny stav, v ktorom sa aplikácia nachádza, teda obsahuje informáciu o tom, z ktorej stránky sa má extrakcia vykonať a taktiež informácie o aktuálnych nastaveniach. Túto vygenerovanú URL adresu možno skopírovať označením a skopírovaním textu z uvedeného textového poľa, prípadne pomocou tlačidla Copy To Clipboard.

Veľmi dôležitou črtou služby OWIDIG je široká možnosť filtrovania vyextrahovaných obrázkov. Tieto filtre možno nastaviť kliknutím na ľavý bočný panel ADVANCED SETTINGS. Kliknutím naň sa panel roztvorí, tak ako je znázornené na nasledujúcom obrázku:

Je možné vybrať, či sa majú zobrazovať len štandardné obrázky v IMG tagoch, CSS obrázky, resp. oboje. Filtrovať je ďalej možné podľa rozmerov, typu, URL adresy obrázkov a názvu obrázkov. Taktiež je možné číselne (napr. 1,4,13, 15-26, t.j. čísla sú oddelené čiarkou a podporované sú aj rozsahy čísiel) zadať konkrétne obrázky, t.j. zobrazia sa len tie obrázky, ktoré by sa normálne v zadanom poradí na zadaných pozíciách zobrazili. Okrem toho možno v pokročilých nastaveniach ešte nastaviť hodnotu user-agenta, proxy servera, referrera a cookies. Podrobné popisy a inštrukcie k jednotlivým filtrom, resp. nastaveniam možno získať umiestnením kurzora myši nad ich návestia.

Ako sťahovať extrahované obrázky

Keď už máme vyextrahované a zobrazené požadované obrázky, môžeme ich chcieť stiahnuť. Pre tento úkon máme hneď viacero možností. Kliknutím na pravý bočný panel DOWNLOAD OPTIONS sa tento panel roztvorí, ako je znázornené na nasledujúcom obrázku.

Prvá voľba je Show all images in a new page. Zvolením tejto voľby sa v novom okne, alebo novej záložke prehliadača zobrazia pod sebou všetky vyextrahované obrázky, ktoré možno uložiť cez funkciu prehliadača Save As (Ulož ako, …) a jeho voľbu umožňujúcu uložiť webovú stránku spolu s obrázkami. Táto funkcia je dostupá v hlavnom menu prehliadača, prípadne cez klávesovú skratku CTRL + S.

Druhá voľba je Show download applet. Stlačením tejto voľby sa roztvoria jej jednotlivé podvoľby, ako je znázornené na nasledujúcom obrázku:

Pre jej použitie je nutné povoliť spustenie Java appletu, ktorý požaduje práva pre zápis na disk. Pomocou Choose directory…, prípadne priamym zadaním cesty je možné nastaviť priečinok, kam sa majú obrázky ukladať. Takisto je možné vyplnením textového poľa Image basename zadať predponu názvu obrázkov. V tomto prípade sa nebudú obrázky ukladať pod svojimi pôvodnými názvami, ale so zadaným názvom + poradovým číslom obrázka. Tieto nastavenia možno uložiť pre budúce použitie pomocou tlačidiel Save directory, resp. Save basename, a takisto možno prípadné uložené nastavenia zmazať tlačidlom Delete saved directory and image basename.

Poslednou možnosťou sťahovania je Download as ZIP. Ako názov napovedá, táto voľba umožňuje vytvoriť ZIP archív, v ktorom budú vyextrahované obrázky. Podporovaná je aj kompresia zaškrtnutím voľby Compress ZIP file. A podobne ako pri použití appletu aj tu je možné zadať predponu názvu obrázkov vyplnením textového poľa Image basename (ZIP). Vytvorenie ZIP archívu nie je podporované v prehliadači Microsoft Internet Explorer, pri prehliadači Chrome funguje len pre menšie archívy. V prípade prehliadača Opera sa pri ukladaní zobrazuje nesprávna veľkosť archívu (veľké množstvá GB), ale archív sa uloží normálne so svojou reálnou veľkosťou. Čo sa týka názvu vytvoreného archívu, Chrome generuje archív bez prípony .zip, treba ju teda po stiahnutí dopísať manuálne. Pri Opere je predvolený názov default.zip, pri Firefoxe sa archív ukladá s príponou .zip.part (príponu .part teda treba manuálne odstrániť). Tieto názvy možno zmeniť po uložení súboru, prípadne pri ukladaní, ak nie je nastavené automatické ukladanie súborov do predvoleného priečinka.

Za návod vďaka užívateľovi moyo

 

Post Tags - ,