Мой вариант - грабит законченные предложения c ,как минимум, двумя словами.
PHP:
$pars=preg_match_all("/[A-Z][\w\d]*(?:[\s,\-\(\)\:;\/\.'’]+[\w\d\-'«»\$\"’]+){2,}[\.\!\?;]{1,3}(?=\s|<|\$)/",$text,$out); //rus [А-Я][\w\d]*(?:[\s,\-\(\)\:;\/\.]+[\w\d\-'«»\$\"]+){2,}[\.\!\?;](?=\s|<|\$)