По мнению журнала Fast Company, поисковая система «Яндекс» по итогам 2011 года вошла в ТОП 50 самых инновационно развивающихся мировых компаний.
В споре за первенство позади остались такие ИТ-гиганты, как Microsoft, Samsung и IBM. В России же «Яндекс» вообще захватил пальму первенства и стал самой популярной поисковой. Только за январь 2011 года «Яндекс» обрабатывал более 65 % от всех сделанных поисковых запросов в Рунете. Поступательный импульс в развитии стал возможен благодаря творческому подходу к любой технической задаче, внедрению только перспективных новшеств и стремлению разглядеть завтрашний день ИТ-технологий.
И вот новое достижение. Поисковик разработал и внедрил уникальную технологическую новинку под названием «Спектр». Поисковая программа “Краснодар”, ставшая носителем этой технологии, уже многими признана серьезным шагом вперед в развитии рынка ИТ. Уникальность нового продукта проявляется в абсолютно новом списке алгоритмических действий подачи информации на потупивший запрос от пользователя.
После серьезного анализа запросной статистики, который регулярно проводит Яндекс, выяснилось, что запросы, отправляемые пользователями в поисковик, где-то в 20% случаев сформулированы очень неоднозначно. Слова, которые содержат в себе насколько трактовок, зачастую подаются без комментариев и определения нужной категории. К примеру, запросив информацию по слову [наполеон], некоторые не уточняют что надо найти: полководца или рецепт торта. А кто-то, написав запрос [суши], может не определить зону поиска — что именно надо искать: рецепт блюда или ресторан, доставляющий продукты домой своим клиентам. Это мешало поисковым роботам выдать правильную и точную информацию. Разброс всех возможных вариантов ответа просто огромен. В результате этого поисковик выдавал всю информацию, которую обнаруживал в сети, в общей «куче». И тогда уже самому клиенту приходилось отыскивать в ней те крупицы знаний, которые ему были необходимы.
В новой системе Яндекса — «Спектр», после исследования всех запросов от пользователей, были выделены конкретные устойчивые словосочетания и собственные наименования, которые были обозначены, как объкт: названия зон отдыха, марок автомобилей, имена известных людей, названия книг и фильмов, а так же многое другое. Затем эти объекты разделили на несколько категорий и уже, исходя из принадлежности к той или иной группе, стали выдаваться пользователям. Причем некоторые словоформы могут принадлежать не к одной, а к двум, трем, и даже пяти категориям сразу. Так, если подается запрос [колдрекс инструкция], то по собственному наименованию лекарства — «Колдрекс» — оно автоматически попадет в группу «лекарства», так как трактуется однозначно. А вот запрос по слову «Пушкин» окажется сразу в двух категориях — «города» и «поэты». В соответствии с этим и будет производиться выдача ответов. Это значит, что процентное соотношение словоформы в запросах по категориям будет строго соответствовать ее процентному соотношению в ответах по тем же группам. Найденные документы ранжируются так, чтобы комплекс ответов соотносился с комплексом вопросов. Это значительно увеличивает вероятность того, что пользователь получит именно ту информацию, которую он искал. Обновление поисковых запросов осуществляется регулярно, не реже, чем несколько раз в неделю. А значение вновь поступивших слов поисковик может почерпнуть из различных словарей (например «Википедии») и других разнообразных источников, доступных в сети.
Пока определено около 60 категорий словоформ, но это не окончательное количество. Оно будет постоянно увеличиваться, так как в программу «Спектр» заложена возможность самообучения. Поисковая программа «Спектр» самостоятельно, в автоматическом режиме проводит анализ запросов и формирует дополнительные категории или группы. Не смотря на то, что постоянно обрабатывается огромная масса запросов (более 5 млрд.), эта дополнительная функция никак не отражается на быстродействии и корректности ее работы, так как обработка поступивших данных производится сразу на сотнях мощнейших компьютеров.
Начиная поиск, программа «Спектр» сразу же учитывает индивидуальные особенности каждого пользователя. Во всех категориях есть данные о том, с какими возможными потребностями пользователь будет искать ту или иную информацию. Например, если он хочет найти какой-нибудь товар, то система уже знает что может стоять за этим: обычно он покупает нужный предмет, хочет получить информацию о ценах или его свойствах, ищет отзывы других людей. Поэтому для его запроса в категории «товары» будут отражены следующие словоформы: «купить», «отзывы», «обзоры». Всего же в каждой категории может быть отражено одна, две или нескольких десятков потребностей.
Остается добавить, что новизна системы заключается не только в обновленном алгоритме действия «Спектра», но и в том, что впервые новинки ИТ-технологий внедряются сначала в русскоязычной зоне интернета.












+7 (902) 265-42-95
444-117-518