Помогите плз с регуляркой

Статус
В этой теме нельзя размещать новые ответы.

genarator2003

Постоялец
Регистрация
23 Авг 2007
Сообщения
115
Реакции
8
Требуется регулярка для разбиения текста на предложения, никак не осилю.
Требуется разбить текст на предложения. На конце предложений могут быть точка, воскл знак, многоточие, вопрос. В начале всегда большая буква. предложения могут быть неотделены друг от друга пробелами.
 
Навскидку:
Код:
/(.*?((\.)+|!|\?))/im
 
Не нужна тут регулярка. пользуйся strpos+substr. Так надежнее и быстрее. Учти что в русском языке завершать предложения могут еще ?! !.. ?.. Гарантии, что предложение начнется с большой буквы - сомнительны.
 
учти ФИО, инициалы разделяются точками. также предложения обращения.
 
С кириллицей должно работать нормально, латиницу добавить элементарно, задаче в целом соответствует:

PHP:
preg_match_all('/\s?([А-ЯЁ]{1,}[0-9а-яё\s]{1,}.*[^А-ЯЁ](?:!|[\.]{3}|\.|\?))/U', $text, $result);
foreach ( $result[1] as $a )
{
echo $a.'<br>';
}
мусор типа 1.А.Б!В. - не захватывается
p.s отсутствие ошибок не гарантирую ))
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху