Очистка контента от ссылок

Статус
В этой теме нельзя размещать новые ответы.

renegad

Постоялец
Регистрация
16 Авг 2008
Сообщения
84
Реакции
29
Есть тексты для доров, но в них содержится много ссылок и вставлять их вместе с текстом в дор не хотелось бы, чем можно автоматически очистить текст от всех "http://..." ссылок?
 
Search and Replace есть софтина, заменяет все что хочешь в куче файлов.
 
Search and Replace есть софтина, заменяет все что хочешь в куче файлов.

Эту софтину я активно использую :) Но видимо не знаю всего ее потенциала и использую только для того чтобы просто заменить одну строчку на другую, каким образом можно с помощью нее удалить все ссылки (а они все разные: может быть Для просмотра ссылки Войди или Зарегистрируйся, а может и Для просмотра ссылки Войди или Зарегистрируйся
 
С помощью её ссылки все не удалиш, если текст англоязычный, можно лиш удалить к примеру префикс http:// Вставляеш его в поле замены, а замещающее поле оставляеш пустым. Так же можно удалить .ru, .html и тд.

Если же тексты у вас русские, то можно попробовать удаление по каждой латинской букве, к примеру сначало "a" удалил из всего текста, потом "b" и тд, долго конечно, но должно получиться.
 
С помощью её ссылки все не удалиш, если текст англоязычный, можно лиш удалить к примеру префикс http:// Вставляеш его в поле замены, а замещающее поле оставляеш пустым. Так же можно удалить .ru, .html и тд.
Если же тексты у вас русские, то можно попробовать удаление по каждой латинской букве, к примеру сначало "a" удалил из всего текста, потом "b" и тд, долго конечно, но должно получиться.

Текст у меня русский, спасибо за предложенный вариант решения этой проблемы, буду пробовать заменять по одной букве, других вариантов я пока не вижу.
 
О ужас.... Любой редактор с функцией замены куска текста по regexp или маске.
Например notepad++ (поддерживает тока стандарт POSIX, поэтому регексп несколько неизящный) с регуляркой <a +href=([^>]+)>[^<]+</a> удалит все ссылки.

Если редактор поддерживает PRCE ((более родвинутый стандарт регулярных выражений) - то регулярка вообще записывается вот так <a.*?/a>
 
О ужас.... Любой редактор с функцией замены куска текста по regexp или маске.
Например notepad++ (поддерживает тока стандарт POSIX, поэтому регексп несколько неизящный) с регуляркой <a +href=([^>]+)>[^<]+</a> удалит все ссылки.
Если редактор поддерживает PRCE ((более родвинутый стандарт регулярных выражений) - то регулярка вообще записывается вот так <a.*?/a>
а есть полный мануал по таким вот манипуляциям в блокноте ?
сорри за отфтоп...
 
гугли на тему регулярные выражения ;)
 
О ужас.... Любой редактор с функцией замены куска текста по regexp или маске.
Например notepad++ (поддерживает тока стандарт POSIX, поэтому регексп несколько неизящный) с регуляркой <a +href=([^>]+)>[^<]+</a> удалит все ссылки.
Если редактор поддерживает PRCE ((более родвинутый стандарт регулярных выражений) - то регулярка вообще записывается вот так <a.*?/a>

Дело в том, что все ссылки в тексте идут обычным текстом без тегов "<a href=></a>" как их тогда удалить регэкспом?
 
В урлах пробелов нет? Тогда удаляй кусок от http до следующего пробела. Можно, скажем, в "Словогрызе" (на мой взгляд удобная программка) масками, примерно вот так:
Код:
http\*\_
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху