Удаление js и внешних ссылок

extrimportal

Я за мир, во всём мире!
Заблокирован
Регистрация
28 Ноя 2008
Сообщения
590
Реакции
120
  • Автор темы
  • Заблокирован
  • #1
Добрый день. Помогите пожалуйста с скриптом. Нужно перелопатить много файлов в которых присутствует js и внешние ссылки. Можете помочь скриптом который бы удалял javascript, js и внешние ссылки c шаблона. Страницу могу сохранять в файл, или если можно просто вводить в скрипте урл, он тянул бы шаблон и чистил. Спасибо.
 
  • Автор темы
  • Заблокирован
  • #3
Согласен. Не был бы я еще нубом в пхп так бы и сделал :D
 
Если не хочется учить регулярные выражения, возможно, будет полезно: Для просмотра ссылки Войди или Зарегистрируйся
Все-таки jQuery селекторы намного проще и понятнее.
Если хочется - советую "Регулярные выражения" Джеффри Фридла.
 
Зачем советовать старьё?
Сразу
Для просмотра ссылки Войди или Зарегистрируйся
В примерах нашёл только вставку элементов, а как их удалять? Да и это смущает:
While possible, the DomCrawler component is not designed for manipulation of the DOM or re-dumping HTML/XML.
 
Google отключили?!
$crawler =new Crawler($html,$url);

$document =new \DOMDocument('1.0','UTF-8');
$root = $document->appendChild($document->createElement('_root'));
$crawler->rewind();
$root->appendChild($document->importNode($crawler->current(),true));
$domxpath =new \DOMXPath($document);

foreach($selectorsToRemove as $selector){
$crawlerInverse = $domxpath->query(CssSelector::toXPath($selector));foreach($crawlerInverse as $elementToRemove){
$parent = $elementToRemove->parentNode;
$parent->removeChild($elementToRemove);}}
$crawler->clear();
$crawler->add($document);

В итоге самый сложный вопрос как удалять из html нужный css селектор закрыт.
Далее остаётся сделать чтение содержимого из каталога, отделить html.
Создать массив селекторов, удалить, сохранить.
PS. смущает, тогда используйте библиотеки, которые устарели.
 
Назад
Сверху