|
|
|
Заработок в Интернете. Индексация сайтаИндексация (веб-проекта, сайта, сетевого ресурса) — условный термин, в технологиях веб-дизайна обозначающий процесс внесения фрагмента контента в базу данных какого-либо сетевого сервиса (как правило, независимых поисковых систем, ПС). К слову: сайтам, разработанным для заработка в интернете, полноценная индексация жизненно необходима. Постулат 1. Индексация является результатом сканирования фрагмента контента роботом поисковой системы. Нюансы. 1.1. Сканирование представляет собою просмотр всего (полностью, без каких-либо исключений) содержания страницы (листинг). Из листинга автоматически исключаются теги языков гипертекстовой разметки, команды, операторы и иные дескрипторы программирования, иногда комментарии в коде1 и прочие элементы, не имеющие прямого отношения к тематическому содержанию. Однако, учитывается содержание тегов / атрибутов, которое описывает характер контента — например, текстовая строка в дескрипторе <ALT>. Кроме того, учитываются все теги форматирования текста (особенно разметка таблиц и заголовки). Этот нюанс работы поисковых роботов необходимо учитывать, если вы разрабатываете сайт / блог для заработка в Интернете. 1.2. Говоря о «фрагменте» контента, следует иметь в виду не что иное, как именно отдельный фрагмент — но расценивать отрывок текста как «фрагмент» необходимо отнюдь не с нашей, человеческой точки зрения, а непосредственно так, как «видит» текст робот поисковика. Вообще, отдельным фрагментом нужно считать отдельный HTML-файл, то есть самостоятельную страницу веб-проекта. Однако, в процессе индексирования робот может воспринимать единый файл, как несколько отдельных; так происходит, если контент разделён заголовками формата <Н1> (оговоримся: не всегда, лишь при определённых условиях) или выделен в отдельной таблице (и здесь есть различные оговорки, которые сейчас мы не станем обсуждать). Кстати, есть и другие частные случаи, в которых алгоритм способен расценивать отрывки текста непосредственно как отдельные, а порою даже и как независимые фрагменты. Постулат 2. Индексации подлежит исключительно оригинальный контент. Нюансы. 2.1. На эту тему мы говорили в статье: «Эффективные способы заработка в интернете: Уникальность текста». Постулат 3. Тематика фрагмента должна быть ясно определима. Нюансы. 3.1. Естественно, что тематику контента робот определяет самостоятельно, ориентируясь на количество и плотность ключевых элементов в тексте фрагмента. Ещё раз напомним, что на содержимое метатегов (мета-определителей) алгоритм обращает лишь мимолётное внимание2. Постулат 4. Индексация есть результат алгоритмического сложения трёх предыдущих факторов.Сам алгоритм постоянно изменяется (незначительно), но это нисколько не влияет на общую оценку его действий. Таким образом, при более или менее корректном соблюдении изложенных выше условий, после публикации нашего гипотетического HTML-файла (страницы веб-проекта) произойдёт следующее: а) робот отсканирует контент; б) определит тематику фрагмента; в) проверит уникальность текста; г) произведёт классификацию и оценку содержания, учитывая указания метатегов, а также — внимание! — множество иных факторов (в том числе, заголовков и массы иных критериев оценки сайта); д) сделает вывод о степени значимости конкретного фрагмента, сравнивая полученный в результате вычислений коэффициент со всеми иными данными (разумеется, среди фрагментов той же тематики); е) разместит информацию о нашем контенте (в виде компактного файла) в своём индексе — на «полке», где хранятся данные по ключевым словам (не по запросам, а по тем ключевым элементам, которые мы выбрали для семантического ядра!). Индексация произведена.Этот процесс происходит далеко не сразу, ибо проверить ВЕСЬ, до последних закоулков, грандиозный информационный массив виртуального пространства весьма не просто. Заметим, что мы описали лишь самые основные этапы из всех, которые использует алгоритм при обработке данных.
РАЗДЕЛ
|
||
Краткое содержание материала: способы заработка в интернете, понятие индексации сайта и нюансы индексирования текста роботами поисковых систем. |
||
Примечания1 ...Иногда комментарии в коде... — исключение комментариев из данных, подлежащих индексированию, характерно для солидных сервисов общего назначения с большими массивами баз данных — в частности, Яндекса и Гугла, однако есть и исключения. Порою применяются алгоритмы, отслеживающие комментарии с указаниями на авторство и код разрешения на использование модуля. С точки зрения технологий веб-дизайна, написать и применить такой алгоритм не составляет никакого труда; а как эта информация используется для индексации в дальнейшем, мы здесь рассматривать не будем.
|
||
Мастерская Сергея Добрынина © 2007 - 2013 Все права защищены. |
|
![]() ![]() |
|