Скрипт копирования сатов из WebArchive

1 234 5
Fruit
На сайте с 15.07.2008
Offline
166
#21

hasugosu, у меня есть свое решение (дописывал Webarchive Grabber), которое делает все, кроме 5 и 8. По времени это заняло 2-3 часа. Доплачивать за 5 и 8 я готов, но явно не более 20$

ZoomY
На сайте с 07.11.2008
Offline
165
#22

Fruit, и оно работает с текущей версией веб-архива?

Размещу ваши статьи на сайтах с тИЦ до 1400 по 5$ (/ru/forum/846111) Сейчас многие ищут хостинг за пределами России. Ukrnames - один из лучших вариантов: (http://ukrnames.com/?ref_id=114) и лидер рынка, и привычно, и по-русски, и вне юрисдикции РФ.
borej
На сайте с 11.08.2008
Offline
171
#23

Ау, ТС, вы тут ? Как услуга ваша работает или где ?

все это чушь собачая
S
На сайте с 13.12.2009
Offline
81
#24
Fruit:
Будет, конечно. Лично мне необходимо:

1) вводим урл
2) получаем архив с сайтом
3) скрипт удаляет то, что вставлено веб-архивом
4) ко внешним ссылкам добавляет rel="nofollow" (опционально)
5) удаляет не существующие картинки (опционально)
6) исправляет внутренние ссылки
7) исправляет урлы, для несуществующих страниц (а так же для существующих, если придется править урлы) формируется файлик с редиректом
8) ну и самое интересное: версий сайта, как правило, несколько. Должна быть возможность выбора, с какой работаем. Если натыкаемся на несуществующий внутряк, то ищем его в других версиях сайта.

Такой скриптик я бы купил.

Почти доделал свою программу-парсер webarchive.org, то что Вы описали добавлено, плюс еще пару вкусностей(многозадачность, возможность выбора версий сайта(вернее даты), вставка и замена любого кода, то есть например вставить код sape или другой системы в любом выбранном месте очень просто), скрин текущей версии:

15.07 зарелизю, приблизительная стоимость 35$.

Batch Domain Tools (https://github.com/w3bstate/batch-domain-tools/releases) - пакетная работа с доменами и субдоменами.
Fruit
На сайте с 15.07.2008
Offline
166
#25
seomoneys:
15.07 зарелизю, приблизительная стоимость 35$.

Респект! Готов взять, напишите, пожалуйста, как будет готово.

S
На сайте с 27.01.2010
Offline
121
#26

Занимаюсь востановлением сайтов из архива

Восстановление сайтов из вебархива archive.org (/ru/forum/871012)
[Удален]
#27
seomoneys:
15.07 зарелизю, приблизительная стоимость 35$.

так, где релиз? я готов купить.

S
На сайте с 13.12.2009
Offline
81
#28
shum32:
так, где релиз? я готов купить.

http://seomoneys.net/?p=234

Kost Troll
На сайте с 20.12.2005
Offline
184
#29

Собственно интересует скрипт !

Вот только :

как-бы увидеть чего он реально выкачивает.

Почему собственно спрашиваю, а вот почему :

http://warrick.cs.odu.edu/

Recent changes made by the Internet Archive have broken Warrick’s ability to recover websites. We are aware of the problem but will not be able to fix it for several weeks. Sorry for the inconvenience.

Т.е. поменялись как я понял алгоритмы у вебархива и скажем тот же варрик уже не работает, впрочем как и archive grabber

Как предварительно посмотреть что она может ???

Ссылку что-ли дали на какой-нибудь выкачанный сайтик небольшой !

Собственно ответ на этот вопрос, хотелось-бы услышать и от hasugosu, и от seomoneys

Продажа компьютеров Спб (Купчино) (http://computer812.ru)
MT
На сайте с 23.03.2004
Offline
115
#30

заинтересован, но очень необходима возможность добавить пару десятков- сотню урлов для выкачивания и желателен серверный вариант

1 234 5

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий