Принципы чекалки гестов

Статус
В этой теме нельзя размещать новые ответы.
V

vitovt

Прохожие
С технической точки зрения что должен уменя скрипт для чеканья гесты. Наличие формы? Наличие определенных тегов\полей? Может кто писал чекакли, поделитесь опытом-познаниями ) заранее сенкс, за советы и прочее :yahoo:
 
Наличие формы, Наличие определенных тегов\полей, ходить по ссылкам в гесте искать форму на соседних страницах пысы : причем не только по ссылкам с анчорами аддсигн итп а и по всем ссылкам что есть в гесте но на том же хосте
 
Наличие формы, Наличие определенных тегов\полей, ходить по ссылкам в гесте искать форму на соседних страницах пысы : причем не только по ссылкам с анчорами аддсигн итп а и по всем ссылкам что есть в гесте но на том же хосте

но это уже такой сложный бот получается?
 
почему , зашел на страницу вытянул ссылки, сравнил с хостом этой страницы , откинул ссылки ведущие на другие хосты , с теми что остались просто прочекать на поля либо за надобностью сделать еще N-ое количество кругов. Вот и весь чекер , и не надо писать никаких сложных ботов, хотя естественно и этот чекер будет написать нелегко так как там есть много подводных камней.
 
почему , зашел на страницу вытянул ссылки, сравнил с хостом этой страницы , откинул ссылки ведущие на другие хосты , с теми что остались просто прочекать на поля либо за надобностью сделать еще N-ое количество кругов. Вот и весь чекер , и не надо писать никаких сложных ботов, хотя естественно и этот чекер будет написать нелегко так как там есть много подводных камней.

Ну так понятно, а вот чтобы еще само собирало имена полей там (вариант с проверкой формы и проверкой форм на соседних урлах написать можно без проблем)
 
>Ну так понятно, а вот чтобы еще само собирало имена >полей там (вариант с проверкой формы и проверкой форм >на соседних урлах написать можно без проблем)

Сейчас это на PHP пишу....
 
>Ну так понятно, а вот чтобы еще само собирало имена >полей там (вариант с проверкой формы и проверкой форм >на соседних урлах написать можно без проблем)

Сейчас это на PHP пишу....

давай. Интересно было бы посмотреть что у тебя получится
 
еще должен проверять возможность поста, иначе на кой он нужен этот сборщик мусора...
 
Фильтр по обьему страницы
Фильтр по анкорам
Подсчет линков на сторонние ресы
 
Я делаю так.
1)Поиск большой формы на первой странице, если форма не найдена, то с этой страницы берутся все ссылки, в анкорах которых есть слова Comment, Post и т.д., среди всех этих страниц находим самую большую форму, у этой формы определяем action и все поля путем сравнения с образцовыми полями. Если какие-то поля остались неизвестны, то лучше для них сгенерировать рандомные текстовые значения. Пишем все в базу.
2) Прогоняем по этой предварительной базе тестовую мессагу, в эту мессагу включено несколько слов аля "Hi, nice dflj234ljl23 guestbook", где dflj234ljl23 - это рандомно генерируемая метка нашей мессаги, чтобы потом было легче искать пост в гесте. После поста в гесту из полученной ответной страницы удаляем регуляркой все теги <form... </form> и пытаемся найти там метку. Если не нашли - запрашиваем ссылку из action формы, если и там не нашли - опять ищем по анкорам все подходящие ссылки и ищем среди них. Данные гест с найденными метками пишем в базу.

Это упрощенный вариант, без определения типа ссылок, но практика показывает, что в большинство гест если и проходят, то просто ссылки Для просмотра ссылки Войди или Зарегистрируйся.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху