Заработок в Интернете. Ранжирование сайтов
Сайт - великолепный инструмент для реализации многочисленных способов заработка в интернете, а эту страницу стоило бы назвать не ранжированием сайтов (дурацкий заголовок, правда ведь?), а как-то по-другому, вроде «методы ранжирования» (отсеивания? сортировки?), либо ещё чем-нибудь в этом плане; в общем, и так, и эдак получается не совсем корректно... но смысл читатель наверняка уловил на лету: здесь мы проведём душеспасительную беседу о том, как всё-таки в реальности функционирует алгоритм поисковой системы (причём, не абы какого немощного задохлика, а серьёзного робота, являющегося представителем мощного и популярного сетевого паука[1]).
Поскольку сфера нашей деятельности лежит в русскоязычной зоне интернета (и сайты для применения собственного способа заработка в интернете мы создаём здесь же), то ориентироваться будем на те принципы анализа качества сетевых ресурсов, которыми руководствуется наш удельный барон по имени Яндекс — в меру агрессор, в меру самодур, а временами даже и проповедник неприкрытой сегрегации.
О невозможности объективной оценки интеллектуальной продукции теми средствами, которыми пользуются поисковые системы, читайте в основной части данного проекта. Тем не менее, каким-то способом ранжирование ресурсов паук должен осуществлять, не так ли? Дабы понять, как это делает тупой алгоритм Яндекса, нужно представлять себе, какими характеристиками узлов автомат может оперировать. Такие характеристики, во-первых, должны быть абсолютными (то есть, их можно выразить в числовом значении), во-вторых, они обязательно должны быть сравнимы (а это обозначает, что пауку необходимо дать возможность нивелировать их величину таким образом, чтобы привести к общей единице измерения).
Пример первый: предположим, поисковой системе предложено провести оценку и ранжирование двух новых сетевых ресурсов[2], с тематикой «Сайт для заработка в интернете» и «О времени и месте явления Антихриста». Не надо морочить себе голову, вспоминая об эффективном контенте и прочих абсолютных критериях, потому что в первую очередь следует задать себе вот такой вопрос: сравнимы ли ВООБЩЕ такие темы? Очевидно, что нет, поскольку их содержание никоим образом не пересекается (запомним это, чтобы впоследствии, вновь вернувшись к этому примеру, посмотреть на способы их искусственной связи).
Прошу внимания! А каким макаром алгоритм способен сделать вывод, существует ли между ресурсами связь (и вообще, возможна ли в принципе подобная оценка)? Конечно, возможна: она реализуется на базе исследования логики семантического ядра и содержания эффективного контента. Робот поисковой системы (любой!) на этом начальном этапе работает так:
— читает название веб-страницы (не заголовок, но именно то, что автор вписал в теги <TITLE>...</TITLE>);
— знакомится с метатегами временной задержки, перезагрузки, переадресации (перенаправления) и иными, рангом ниже;
— в иерархической последовательности оценивает содержание метатега KEYWORDS[3];
— сканирует ту бредятину, которая призвана кратко описывать тематику страницы (НЕ сайта, а именно страницы!), то есть массив тега DESCRIPTION;
— считывает массив <BODY> файла HTML, сортируя (на базе анализа качества веб-проекта, естественно) тексты и прочее на эффективный контент, инструменты навигации и меню и т.п.;
— производит оценку уникальности гипертекста; затем идёт подсчёт ключевых элементов, исследуется плотность ключей и так далее.
Сравнивая структуру сайтов и их логику семантического ядра, паук имеет возможность сделать вывод о степени соответствия их тематики, а заодно — при совпадении таковой — и о взаимном ранжировании. Как видите, вплоть до строго определённого момента, всякий алгоритм действует по одной и той же схеме.
РАЗДЕЛ СПОСОБЫ ЗАРАБОТКА В ИНТЕРНЕТЕ.
СТАТЬЯ ЗАРАБОТОК В ИНТЕРНЕТЕ. РАНЖИРОВАНИЕ САЙТОВ
|