Ubuntu Linux
-
#1597
Jó helyen kapisgálsz.
Először wgettel kell az oldalt a sztenderd kimenetre küldeni, majd sed vagy inkább awk segítségével kiszedni a megfelelő karakterláncokat - előbb azokat a sztringeket, amelyek <img-vel kezdődnek és > záródnak, de közben nincs bennük < vagy >; majd ezekből az src="-vel kezdődőeket és a "-al záródóak (közben ne legyen ") tartalmát.
A wget-es része így nézne ki:
wget -qO- http://sg.hu/
Az awk-sra csak halvány sejtéseim vannak perpillanat... csúnya reguláris kifejezések... brrr....
Pont ha relatív hivatkozások vannak. Meg ha több, az oldalhoz kapcsolódó oldalt is fel kell térképezni (akkor elő kell venni az <a> tagek href attribútumát is).
Jó kis feladat