Reddit: возможность семантической обработки данных Google

  1. Разбивка семантической иерархии
  2. Первичный уровень: связанные термины
  3. Вторичный уровень: семантические пары
  4. Третичный уровень: семантические ветви
  5. SemRank
  6. Академическое исследование
  7. Дан Петрович

Посмотрите на эту идеально зацикленную последовательность изображений. Это линкбилдинг, создание цепей, Футурама, фабрика ... это удовлетворительно и гипнотично. Google, однако, не сможет связать эти концепции достаточно хорошо, если не будет использовать структурированные семантические данные. Они должны найти творческие способы соотнести «строки» и понять «вещи», поскольку веб-мастера не всегда имеют привычку структурировать свои данные, точно так же, как они не всегда используют rel = »nofollow» или пишут чистый код.

Они должны найти творческие способы соотнести «строки» и понять «вещи», поскольку веб-мастера не всегда имеют привычку структурировать свои данные, точно так же, как они не всегда используют rel = »nofollow» или пишут чистый код

Создание цепочки .gif loop ~ 2Mb

Вот где могут помочь иерархические обсуждения. Для практического понимания трудностей, связанных со структурированными комментариями, я выбрал семантически сложный Реддит нить и изучил актуальную иерархию комментариев верхнего уровня и то, как они повторяются в связанных подтемах. Вот мои заметки:

Разбивка семантической иерархии

первичный

Машины

Loops

гипнотизирующий

сытный

сваренный

Китай

клещи

второстепенный

Долго

трезвый

весна

КПД

Ювелирные изделия

Шестерни

Netflix

Коммунизм

Первичный уровень: связанные термины

Изображение описывает циклический, повторяющийся процесс изгиба на машине для изготовления цепей. Он символизирует совершенство и оказывает на зрителя удовлетворяющий / наркотический / завораживающий эффект. Выделенные термины семантически связаны в контексте этого изображения и, возможно, в других ситуациях. Мы также узнаем, что слово « цепочка » часто пишется с ошибкой как « фарфор » и наоборот, что потенциально может быть использовано в Google.

Вторичный уровень: семантические пары

Комментарии позволяют обнаруживать визуально похожие процессы и объекты, такие как ювелирные цепочки и пружины . Поисковая система также может начать связывать семантически связанные пары, такие как:

  1. Бендер - Футурама
  2. Петля - длинный
  3. Машина - Эффективность

Третичный уровень: семантические ветви

Третичный уровень показывает признаки серьезного местного разбавления, но все еще показывает ценный семантический потенциал сбора деревьев. Слово машина связана с эффективностью, которая связана с оперативной памятью .

SemRank

SemRank ( Semantic PageRank ) - это концепция, которую я использую для описания распределения тематической релевантности и демпфирования в расходящихся семантических иерархиях, включая потоки комментариев и другие семантические структуры в сети. Аналогично случайная модель серфера сложные семантические деревья могут быть применимы для PageRank-подобной обработки, где каждый узел в цепочке семантического дерева с меньшей вероятностью будет сильно связан с исходным обсуждением.

Однако, в отличие от PageRank, семантический демпфирующий фактор представляет собой актуальный сдвиг и потерю важности по отношению к исходной концепции и не представляет общую потерю важности в общем семантическом графе . Это означает, что в семантическом дереве комментарий на пятом уровне иерархии обсуждения может иметь такую ​​же ценность, что и комментарий верхнего уровня.

Это означает, что в семантическом дереве комментарий на пятом уровне иерархии обсуждения может иметь такую ​​же ценность, что и комментарий верхнего уровня

Рисунок выше иллюстрирует тематическое демпфирование и итерацию, где каждый уровень иерархии имеет 50% вероятности слайда темы. Наблюдайте, как меняются значения, когда СИСТЕМА A (A) и SYSTEM A (B) наблюдаются в их собственной системе отсчета. Узел с семантической оценкой связности 12,5 по основной теме также имеет оценку 50 по отношению к своему прямому вышестоящему узлу. Поэтому SemRank является относительным значением, которое зависит исключительно от расстояния от выбранного опорного узла.

Чтобы выяснить общую важность комментария, алгоритм, разработанный для работы с иерархией потока обсуждения, может также учитывать нисходящее дерево комментария (вся семантическая структура, вытекающая из исходного комментария). Система голосования Downtree будет подчиняться принципу SemRank, позволяя комментариям ближе к первичному узлу нижнего дерева вносить свой вклад с большим количеством семантического сока .

Важность предмета может быть выражена количественно через (а) сумму всех его узлов нисходящего дерева или (б) повторение того же процесса при вознаграждении плодотворных ветвей совокупным счетом (см. Расчет плодоносного дерева). Затем семантическое дерево может быть отсортировано по количеству узлов, открывая более богатые подтемы обсуждения.

Алгоритм Reddit уже упорядочивает комментарии аналогичным образом, используя явную систему голосования, где пользователи могут голосовать за голосование вверх или вниз. Сгенерированные пользователем качественные сигналы могут быть эффективными на качественном уровне, но не всегда отражают семантическую связь с оригинальной темой.

Я предлагаю использовать гибридный метод для сообществ с поддержкой голосования, чтобы сбалансировать доступные показатели в едином семантическом показателе качества.

Алгоритм Google уже оснащен механизмами для обработки семантических графов. Могут ли они обойти структурированные дискуссионные темы и собрать ценные семантические данные, неизвестно.

Академическое исследование

Бумага под названием « Изучение дискуссионных тем в социальных новостных сайтах: пример сообщества Reddit Тим Венингер, Сихао Ави Чжу и Джиавей Хан исследуют тематическую иерархию потоков комментариев на Reddit с целью улучшения веб-поиска. В статье предлагается использовать потоки комментариев для аннотирования связанного контента.

Вот некоторые из их выводов:

  1. Иерархические потоки комментариев состоят из комментариев верхнего уровня, которые начинают подтему.
  2. Комментарии верхнего уровня, особенно те, которые получают большое количество ответов, обычно создаются на ранних этапах жизненного цикла сообщения.
  3. Из ранних комментариев / подтем верхнего уровня создаются дополнительные подтемы как естественная часть онлайн-дискурса.
  4. Иерархические потоки комментариев на Reddit представляют актуальную иерархию.

Обновить:

Один из наших читателей, Милош Милосавлевич, задал интересный вопрос о том, как лучше всего обрабатывать / исключать комментарии троллинга. Троллинг может быть тематическим и, как таковой, действительным источником семантических данных, но он также может выступать в качестве актуального тупика, в то же время вызывая значительное количество ответов (как эмоциональный отклик сообщества). Это может потенциально раздуть семантическую оценку комментария тролля. Пользовательская система голосования должна выступать в качестве слоя защиты / модерации от таких событий.

Документ по теме: « Фильтрация комментариев троллинга через коллективную классификацию «Хорхе де ла Пена-Сордо, Игорь Сантос, Икер Пастор-Лопес и Пабло Дж. Брингаш

Дан Петрович

Дэн Петрович, управляющий директор DEJAN, является самым известным именем Австралии в области поисковой оптимизации. Дэн - веб-автор, новатор и уважаемый спикер индустрии поиска.

Больше сообщений - Веб-сайт

Похожие

Google + для бизнеса: Google+, король SEO
Прошло почти два полных года с момента официального запуска Google +, и многие компании до сих пор задаются вопросом, как использовать его в своем плане маркетинга в социальных сетях. Эта статья является
Google Caffeine влияет на SEO
Последнее обновление: 1 апреля 2019 года в 10:56 Всем любителям кофе вы полюбите новую поисковую систему Google. Ну, ты будешь любить это имя, по крайней мере. Google Caffeine давно ждал специалистов по SEO по всему миру из-за
Раскрыты: Топ-3 рейтинга Google!
Google недавно объявил о трех основных факторах SEO, которые влияют на рейтинг сайта. Мы долго задавались вопросом «как Google ранжирует результаты поиска !?» и теперь мы знаем! Google хранит молчание о том, как они ранжируют сайты, а SEO-сайт Moz даже управляет
Google не будет предоставлять SEO сертификацию
Хотя большинство оптимизаторов хочу SEO сертификацию от официальной и надежной организации Google не будет ее предоставлять. Вчера Гари Иллис из Google сказал в интервью
Обновление Google Penguin
Под кодовым названием «Пингвин» резюмируется существенное изменение (обновление) алгоритма рейтинга Google. Целью обновления Penguin является сохранение веб-спама в исходных (и более радикальных) результатах. Обновление Пингвин поэтому также под названием Обновление веб-спама известны. Изменение алгоритма
Новое обновление Google твики SEO Algoritm (снова)
Все мы знаем, что Google меняет алгоритм поиска несколько раз в день. Иногда изменения являются незначительными изменениями, а в других случаях мы получаем более масштабные и эффективные обновления в духе Панда ,
Новички Инструменты Google для веб-мастеров для SEO
Мне недавно позвонил клиент, для которого я только что открыл сайт. После быстрого ранжирования по нескольким ключевым словам он задался вопросом, почему все его ключевые слова не были ранжированы на первой странице результатов Google ... через 2 недели! Затем последовало: «Как я могу улучшить производительность моего
Пользователи Google + наиболее эффективны для SEO компаний
С точки зрения поисковой оптимизации наиболее полезна база пользователей социальной сети Google. Влияние органического SEO - это Facebook с точностью до секунды по порядку. Американское SEO-агентство TastyPlace решило проверить тезис о том, что социальные сети практически не влияют на поисковую
Понимание стоп-слов Google
Стоп-слова уже давно обсуждаются в мире SEO. Некоторые говорят, что стоп-слова вредят стратегиям SEO, в то время как другие полагают, что они естественны и неизбежны. Что такое стоп-слова и как они влияют на поисковую оптимизацию? Это то, что мы стремимся раскрыть в этой дискуссии. Ознакомьтесь с этим руководством для понимания стоп-слов Google,
Величественный SEO показывает больше входящих ссылок, чем Google!
Некоторые эксперты предполагают, что Majestic «не имеет столько данных, сколько Google». Изменения в отчетности Google, тем не менее, показывают, что когда дело касается ссылок INBOUND (в отличие от ВНУТРЕННИХ ссылок, которые Majestic игнорирует при составлении отчетов), Majestic имеет преимущество. В этой статье показано, как Google изменил свои отчеты о ссылках, а затем показано, насколько далеко впереди Majestic SEO. Инструменты Google для веб-мастеров объявили сегодня, что обновляют
Почему мой сайт не входит в рейтинг Google?
Веб-сайт, который не входит в рейтинг Google, похож на модный автомобиль, который отказывается заводиться. Даже если это выглядит хорошо, это бесполезно, если оно не может перевозить людей из одной точки в другую. Когда ваш сайт не оценивается, это обычно связано с одним аспектом, который не работает должным образом. Эта единственная проблема может перетянуть весь сайт вниз и повлиять на его производительность, оставив его полностью застрявшим. Следующие пять советов помогут вашему сайту

Комментарии

Хотите знать, если кто-то из Google просмотрел ваш веб-сайт и решил, что он заслуживает наказания в результатах поиска Google?
Хотите знать, если кто-то из Google просмотрел ваш веб-сайт и решил, что он заслуживает наказания в результатах поиска Google? Google сейчас сообщает о таких случаях почти в 100% случаев. «На самом деле мы начали отправлять сообщения практически по каждому ручному действию, которое напрямую повлияет на рейтинг вашего сайта», - сказал Мэтт Каттс, глава команды Google по веб-спаму, выступая на PubCon конференция на этой неделе. «Если команда
Что такое Google My Business, локальный каталог Google?
Что такое Google My Business, локальный каталог Google? Этот инструмент доступен для предприятий и других организаций Google. Это позволяет информировать и управлять локальным листом, содержание которого может подниматься в разных результатах поиска. Как правило, он содержит название заведения, фотографии, ссылку на сайт и контактные данные. В следующей части мы увидим, как его администрировать.
Google постоянно меняет свой алгоритм - но действительно ли Google меняет факторы ранжирования?
Google постоянно меняет свой алгоритм - но действительно ли Google меняет факторы ранжирования? Время от времени стоит проверять некоторые старые и новые заявления SEO на их правду. Джеймс Ринольдс и его коллеги из seosherpa.com сделали это, и 16 экспериментов , Однако эксперименты иногда работают только в лаборатории, и выводы часто бывают неоднозначными. И
Используете ли вы Google Analytics для отслеживания посетителей вашего сайта, лучших ключевых слов и других подобных данных?
Используете ли вы Google Analytics для отслеживания посетителей вашего сайта, лучших ключевых слов и других подобных данных? Если это так, вы должны взглянуть на плагин Google Analytics от MonsterInsights. Не только потому, что у него примерно 11 миллионов загрузок, но и потому, что стоит проверить его список функций: Используйте API Google Analytics на простых установках. Возможность использования асинхронного или универсального кода отслеживания.
Основной вопрос: «Как Google распознает, кто является автором контента или как Google распознает его копию?
Основной вопрос: «Как Google распознает, кто является автором контента или как Google распознает его копию?» Скорее всего, Google идентифицирует того, чей контент индексируется первым. Это может привести к проблемам, особенно с новыми сайтами, например Google Bot посещаются реже, потому что они внешне не так хорошо связаны. Если другие сайты берут контент и чаще от Google
Собственный аккаунт Google AdWords доступен?
Собственный аккаунт Google AdWords доступен? Нет проблем! Кроме того, если вы уже приобрели некоторый опыт работы в SEA и Google AdWords и, возможно, начали ту или иную кампанию, мы можем помочь вам своими знаниями. Мы предложим вам индивидуальный анализ вашей учетной записи AdWords и покажу, какие действия можно предпринять, чтобы получить еще больше пользы от ваших кампаний. Мы активно поддерживаем вас в этом отношении и делаем все возможное для достижения вашего бюджета.
Ваш сайт не может быть просканирован или проиндексирован Google, или ваши страницы загружаются так медленно, что ваши пользователи уходят, прежде чем попасть на вашу первую целевую страницу?
Ваш сайт не может быть просканирован или проиндексирован Google, или ваши страницы загружаются так медленно, что ваши пользователи уходят, прежде чем попасть на вашу первую целевую страницу? Поэтому первым шагом для проекта SEO должен стать технический аудит SEO. Не каждый понимает SEO правильно с первого раза. Так что, если ваша производительность в сети не совсем такая, как вы хотели, не беспокойтесь. Большинство из нас были там в какой-то момент.
Соблюдаете ли вы правила Google для веб-мастеров?
Соблюдаете ли вы правила Google для веб-мастеров? Вы также предлагаете услуги онлайн-маркетинга или консалтинг в дополнение к поисковому бизнесу на основе индексов? Каких результатов вы ожидаете в течение какого периода? Как вы оцениваете свой успех? Какой у вас опыт в моей отрасли? Какой опыт у вас есть в моей стране или городе? Какой у вас опыт разработки международных сайтов?
Вы хотите согласовать цену за работу Google Analytics сейчас или мы подождем, пока эта работа будет выполнена и оплачена?
Вы хотите согласовать цену за работу Google Analytics сейчас или мы подождем, пока эта работа будет выполнена и оплачена? Один из уроков, который должны выучить все фрилансеры, состоит в том, чтобы вначале изложить, что именно они соглашаются делать, и не позволять клиенту накапливать на них больше рабочих мест без дополнительной оплаты. SEO для копирайтеров: ключевые слова и мета-ключевые
Например, когда вы ищете « нестандартные портативные зарядные устройства «Разве вы не становитесь клиентом того, кто появляется в Google?
Почему важно появляться в моем списке результатов поиска Google перед моим веб-сайтом? Страница, которая не найдена в Поиске Google, как будто ее не существует! Те, кто находится на вершине списка поиска, могут получить почти непобедимое преимущество над своими конкурентами. В настоящее время Google обслуживает 85% всех поисковых запросов в мире. Пользователи поисковой системы Goolge выполняют миллиарды запросов в день и находят контент, услуги и продукты, которые их
Если вы похожи на нас, ваши первые вопросы были такими: «Что такое канал Google и как мне его оптимизировать?
Если вы похожи на нас, ваши первые вопросы были такими: «Что такое канал Google и как мне его оптимизировать?» Канал Google - это новая мобильная новостная лента Google. Что такое канал Google? Канал Google - это персонализированная лента новостей. Фид отображается под строкой поиска на мобильных устройствах с помощью приложения Google. Он делится

Что такое стоп-слова и как они влияют на поисковую оптимизацию?
Хотите знать, если кто-то из Google просмотрел ваш веб-сайт и решил, что он заслуживает наказания в результатах поиска Google?
Что такое Google My Business, локальный каталог Google?
Google постоянно меняет свой алгоритм - но действительно ли Google меняет факторы ранжирования?
Google постоянно меняет свой алгоритм - но действительно ли Google меняет факторы ранжирования?
Используете ли вы Google Analytics для отслеживания посетителей вашего сайта, лучших ключевых слов и других подобных данных?
Основной вопрос: «Как Google распознает, кто является автором контента или как Google распознает его копию?
Основной вопрос: «Как Google распознает, кто является автором контента или как Google распознает его копию?
Собственный аккаунт Google AdWords доступен?
Ваш сайт не может быть просканирован или проиндексирован Google, или ваши страницы загружаются так медленно, что ваши пользователи уходят, прежде чем попасть на вашу первую целевую страницу?