Интересно

Буллет тайм

14.06.2018

  Буллет тайм -еженедельник (англ. Буллет тайм купить,
Пять сайтов, которые расскажут все!

29.05.2018

Ежели заинтересовал вопрос недвижимости и возведени
Гобо проектор

27.05.2018

  Гобо проектор - вотан из свежайших вариантов рекламы
Что прописывается в договоре банковской гарантии?

23.05.2018

Что прописывается в договоре банковской гарантии? Люб

Друзья

s2.jpg
s3.jpg
s1.jpg


инвертированный индексПринципы, по которым поисковые системы организуют свою работу, достаточно сложны и постоянно меняются, однако существуют законы, которые актуальны на протяжении уже достаточно продолжительного времени, что позволяет относиться к ним как к своеобразным догмам. К таким неизменным законам можно отнести, например, стандартное сжатие данных, которое все поисковые системы, без исключения, используют в целях приведения поступающей информации к оптимальному объему.

 

Как правило, на первом этапе работы с интернет-страницами любого вида происходит очистка их от всевозможных элементов, не относящихся к чистому тексту, а именно графики любого формата, HTML-тег и др.

Далее, все слова, имеющиеся в тексте, располагаются в алфавитном порядке, а все что не имеет отношение к словоформам (знаки препинания, пробелы и пр.) вновь удаляются. Характерно, что в конечном итоге слова остаются не в исходном виде, а приводятся к своим грамматичным основам и только после этого производиться подсчет вхождения слов на каждой странице с указанием ее номера. В результате, получается, что-то вроде остаточного образа текста, схожего чем-то на инверсный след самолета, по аналогии с которым, такая структура возможно и получила свое название инвертированный индекс.

 

Впрочем, в ряде случаев поисковые машины успешно работают с текстами прямого индекса, такими например как цитаты, хотя в любом случае, если пользователя, в первую очередь, интересует раскрутка сайтов, он должен оперировать понятиями и принципами инвертируемых индексов. Иначе говоря, в обязательном порядке должны учитываться язык текста (тот же «Яндекс» опирается на тип алфавита), точное вхождение ключевых фраз, а также максимальное использование, в качестве ключевых, фраз начальных грамматических форм.

Дата публикации: 22.07.2013, 17:50

 

 

 

Добавить комментарий


Защитный код
Обновить

Вебдизайнерам


Об искусcтве на службе бизнеса
От функции Вернемся во вторую половину 90-х. Золотая пора становления интернета в России. Рождение неологизма «рунет». Скоростные модемы на 28.8 и модные провайдеры: «Ситилайн», «Россия Он-Лайн», «МТУ». Популярные колумнисты – Иван Паровозофф и еще кто-то, совсем уж не запомнившийся. Концептуал...

Продвижение


Продвижение сайта в топ - 10 правил
Целенаправленное продвижение сайта требует соблюдения определённых правил и требований, совокупность которых и приводит к высоким местам в выдаче поисковых систем. Конечно, правила и даже рекомендации могут варьироваться в зависимости от тематики продвигаемого ресурса, его аудитории, финансовых ...

IT-Архитекторам


Самоучитель программирования html, java
Помощник начинающих - самоучитель программирования html В настоящее время в мировой сети Интернет насчитывается около семнадцати миллиардов активных Интернет-сайтов, и их количество продолжает стремительно расти. Создать сайт может не только программист, но и любой человек, мало-мальски разбирающий...