Back to Home:


1. В чем отличие от ТелеПорта?

Телепорт сам анализирует страницу (иногда в строке состояния, внизу, вы могли бы заметить надпись: Parsing HTML...), выбирает все ссылки и по вашим критериям обозначает в своей внутренней базе данных, по каким следовать, по каким -- нет. Это хорошо походит для периодической загрузки новостных сайтов, форумов, или часто обновляемых сайтов. ReGet несколько иного мнения о том, кому решать какой файл закачивать. Вы должны явно указать адрес файла и поставить его в очередь на закачку. ReGet умеет то, чего не умеет TelePort -- докачку файла (если, конечно, сервер, отдающий файл, понимает, с какого места его просят начинать пересылать байты, примерно 15% серверов в Инете не поддерживают докачку). То есть, вы можете в любой момент оборвать закачку или она сама оборвется, и вновь начать, не потеряв то, что уже закачано. TelePort, если он закачивал, скажем zip file в 1 мегабайт, не сохранит его на диске, если будет потерян последний байт и сервер не пришлет команду, подтверждующую успешное окончание закачки.
Итак, если на странице куча ссылок, но вам нужны конкретные картинки, файлы, звуки, скрипты и .т.д., то нужен ReGet.


2. Как ReGet может пригодится для архивирования форума?

Смысл использовать для закачки ReGet есть только для сообщений. Однако напрямую закачать нельзя, так как попробовав указать URL для сообщения, вы увидите, что ReGet не умеет автоматически именовать файл из запроса (файла на сервере не существует, он генерируется на лету, только для того, чтобы ответить клиенту), то есть обозвать его так, как это делает TelePort, например, book.cgi-book=Situation-in-Russia&i=974989521.htm. <-- здесь добавлено расширение .htm Однако у ReGet есть важное преимущество: он может читать список файлов из обычного текстового файла и ставить их в очередь для закачки. Если мы сможем из стартовой страницы генерировать список URL нужных файлов, то ReGet будет даже предпочтительнее TelePort'а. Как это сделать, я думаю, понятно (для знакомых с программированием) -- открыть файл с нитями, получить для объекта Document объект Collection для линков, отобрать из них относящиеся к сообщениям и проверить их наличие на диске. При отсутствии файла на диске Collection.Item(n) записать в файл в виде строки URL, ниже в строке записать имя с приделанным в конце расширением .htm, и еще ниже, в какую папку записывать полученный файл. Формат записи подсмотреть в файле .wrg ReGet (он туда записывает в текстовом виде установки для закачки). Остается подсунуть ему этот файл и закачать недостающие файлы.

ReGet -- русская программа, поэтому описание почитать будет легко, сходите на сайт разработчика и попробуйте.


Продолжение последует....  

 

Используются технологии uCoz