Опыт есть
              истинный
                               учитель

Янв 10, 2012 - Общее    No Comments

Поговорим о содержимом….

Решил продолжить тему о кодировке. На форумах стал замечать вопросы следующего плана:

Уже не знаю что и думать, может кодировка "charset=utf-8" Яндексу не нравится?
Сайт существует давно (больше года), Гуглем индексируется, яндексом — нет.
Начал стучаться в поддержку — позавчера яндекс показал, что две страницы проиндексированы. Сегодня смотрю: опять ноль!

еще как вариант (название темы Влияет ли кодировка на ранжирование сайта и SEO ?):

УДобрый день посоветуйте UTF-8 или windows-1251 ???????

Таких вопросов можно набрать с сотню, а может даже и больше. На некоторых есть ответы, но для многих вопрос так и остается открытым. Уже матерые СЕОшники отвечают двумя словами. По идее этого вполне достаточно, но если вопрос задал новичок?

Чтобы новичку понять что из себя представляет кодировка вида UTF-8 или CP-1251. Обратимся к определениям.

UTF-8 (от Unicode Transformation Format — формат преобразования Юникода) — в настоящее время распространённая кодировка, реализующая представление Юникода, совместимое с 8-битным кодированием текста. Нашла широкое применение в операционных системах и веб-пространстве.

Так гласит всемирно известная википедия и она права. Можно только добавить от себя одно, что данная кодировка совместима со старыми методами кодирования. Т. е. любой пользователь\машина сможет прочитать текст, который кодирован UTF-8.

А что же такое Windows-1251

Windows-1251 — набор символов и кодировка, являющаяся стандартной 8-битной кодировкой для всех русских версий Microsoft Windows. Пользуется довольно большой популярностью.

Тут тоже не поспоришь с вики. Один нюанс, что кодировка 1251 моложе UTF-8. Я не буду показывать все скрины от 77 браузеров. Да и после проверки сайтов, где использована кодировка Windows-1251 и UTF-8, можно поставить точку, сказав, пользователи не спят, а создатели браузеров и подавно. Проверка показала вот такую статистику:

Сайт с UTF-8:
77 загружено, из них 7 с ошибкой

Сайт с Windows-1251:
77 загружено, из них 9 с ошибкой.

Сразу же сваливать на кодировку не будет, так как не в ней дело. Сайты расположены на одном хостинге, а значит нет преимуществ у них по загрузке. В итоге остается одно, что у пользователя внутренняя ошибка браузера и этот браузер Konqueror 4.6 на системе Arch (Current). Другие браузеры (которые так же отказались загрузить страницу) выдали белый фон.

Не будем отчаиваться на достигнутом, а продолжим беседу про кодировки. Если с отображениями в браузерах мы разобрались, то как быть с php начиная от 5-й версии и выше. Поговаривают, что UTF ляжет на любую платформу и будет доступна всем странам мира, на сегодня можно сказать и про Windows-1251 (наша проверка подтвердила, а если быть точнее наши сайты просмотрели из Португалии, Германии, Франции, Англии, Нидерланды и другие).

Если учесть тот факт, что домен в зоне .РФ пишется кирилицей, то можно смело утверждать одно: описанная выше кодировка будет доступна. Хотя еще год назад cp-1251 на 20% браузеров отображалась вопросами.

Поэтому с выбором кодировки решать только вам, но рекомендовать я могу UTF-8 для освоившихся, а для новичков — Windows-1251.
И еще… Доверяйте переводам официальным, а не любительским (картинка).

Got anything to say? Go ahead and leave a comment!