Спецсиволы и парсинг

Uglik

Старатель
Регистрация
8 Окт 2008
Сообщения
350
Реакции
14
Здравствуйте

Написал парсер проблемы с юникодом.
Получаю страницу функция file_get_contents(). Потом с помощью регулярку получаю необходимую строку и на выходе What to Expect When You're Expecting вместо What to Expect When You're Expecting.
Вопросы:
На каком этапе спецсимволы преобразуються в вид ' ?
Как перобразовать их в человеческий вид ?
 
На каком этапе спецсимволы преобразуються в вид ' ?
на выдаче в браузер могут, а может и раньше
Как перобразовать их в человеческий вид ?
Для просмотра ссылки Войди или Зарегистрируйся
а также не забыть флаг ENT_QUOTES
Для просмотра ссылки Войди или Зарегистрируйся
 
что то ничего не получаеться

PHP:
$str = ''';
$result = html_entity_decode($str, ENT_QUOTES);
echo $result;

Исходный код и тоже самое что и было
Одинарные ковычки это '
А в моем примере они почему то '
 
да, есть такой глюк, в таком случае надо еще encoding поставить UTF-8, т.е.
PHP:
$str = ''';
$result = html_entity_decode($str, ENT_QUOTES,'UTF-8');
echo $result;
т.к. ' - это то же самое, что и &#x27, только в десятичной и 16-ричной кодировках соответственно
 
Решил проблему еще вот таким способом:
Код:
function replace_special($string){
 
$string = preg_replace('/&.*?;/s', '-', $string);
return $string;
 
}
 
столкнулся дальше с такими трудностями . Русский текст Люди в Чёрном
Как перекодировать в человеческий вид данные строки по средством php
 
столкнулся дальше с такими трудностями . Русский текст Люди в Чёрном
Как перекодировать в человеческий вид данные строки по средством php
как я уже и говорил
PHP:
$result = html_entity_decode($str, ENT_QUOTES,'UTF-8');
 
Назад
Сверху