taki_net: (Default)
taki_net ([personal profile] taki_net) wrote2006-11-17 10:08 am

Вопрос знатокам wget или подобных софтин

Я тут наткнулся на заброшенное зеркало Библиотеки Мошкова (не в России), замороженное по состоянию на ноябрь 2004 г. и решил скачать от греха. Качаю командой

wget -m -np URL

Однако эта сволочь натыкается в каждом каталоге на селектор koi-lat-win и качает ТРИ экземпляра одного и того же (с точки зрения статических ссылок это выглядит как три параллельных структуры каталогов
LIBRARY/koi/INOFANT...
LIBRARY/lat/INOFANT...
LIBRARY/win/INOFANT...
при том что копируемый URL был ниже в дереве каталогов чем LIBRARY/koi/INOFANT...

Вопрос раз: нельзя ли исключить из копирования не только отдельные файлы, но и ветки каталогов?

Вопрос два: если во wget нельзя, то нельзя ли решить эту задачу еще чем-либо?

[identity profile] golergka.livejournal.com 2006-11-17 01:08 pm (UTC)(link)
А почему не качать сразу из LIBRARY/koi/* например?

[identity profile] golergka.livejournal.com 2006-11-17 01:09 pm (UTC)(link)
А, недочитал.
wget -nH --cutdirs=2

man wget

[identity profile] golergka.livejournal.com 2006-11-17 01:10 pm (UTC)(link)
-nH
--no-host-directories
Не создавать пустые папки в начале структуры. По умолчанию 1776
fly.srk.fer.hr/. Это поведение выключается указанием данного
параметра.

--cut-dirs=number
Игнорировать number папок высшего уровня. Используется при
загрузке папок и файлов низкого уровня.

Возьмем, например, папку ftp://ftp.xemacs.org/pub/xemacs/. Если вы
загрузите ее с параметром -r, то она сохранится под именем
ftp.xemacs.org/pub/xemacs/. С параметром -nH из имени начальной
папки вырежется ftp.xemacs.org/, и она будет называться pub/xemacs.
А параметр --cut-dirs уберет number компонентов. Примеры работы
параметра --cut-dirs:

Без параметров -> ftp.xemacs.org/pub/xemacs/
-nH -> pub/xemacs/
-nH --cut-dirs=1 -> xemacs/
-nH --cut-dirs=2 -> .

--cut-dirs=1 -> ftp.xemacs.org/xemacs/