Google Wave всё

We don’t plan to continue developing Wave as a standalone product

http://googleblog.blogspot.com/2010/08/update-on-google-wave.html

Гугл Вейв (а как все начиналось!) провалился в качестве отдельного продукта и в этой ипостаси поддерживаться больше не будет. До конца года поживет – и потом всё.
Теперь его технологию попробуют употребить в других продуктах гугла, но мне пока непонятно, где оно вообще может пригодиться.

Ограничение видимости контента на странице для гугльбота

Оказывается, есть способ запретить к индексации гуглем не страницу целиком, а выборочный контент на странице. Для этого нужно использовать специальные тэги, которые понимает бот Гугля. Эта фича описана в официальном мануале:  http://code.google.com/intl/ru-RU/apis/searchappliance/documentation/46/admin_crawl/Preparing.html

<!--googleoff: all-->Этот текст не будет проиндексирован, не появится в снипетах и не будет влиять на ранжирование ссылок как анкор<!--googleon: all-->

<!--googleoff: anchor--><A href=fish.html>дельфин</A> <!--googleon: anchor-->  - анкор "дельфин" не будет проассоциирован с линком на fish.html и не будет оказывать влияния на ранжирование этой страницы по слову "дельфин".

<!--googleoff: snippet-->Этот текст будет проиндексирован, но не появится в снипетах<!--googleon: snippet-->

<!--googleoff: index-->Этот текст не будет проиндексирован, но ссылки, которые здесь встретятся, будут учитываться<!--googleon: index-->

via myfreeweb.

Повышение кликабельности

Куда смотрят люди ?

Люди смотрят туда, куда смотрят другие люди.

Понятная картинка:


Гугл теперь учитывает ссылки в RSS

RSS/Atom feeds have been very popular in recent years as a mechanism for content publication. They allow readers to check for new content from publishers. Using feeds for discovery allows us to get these new pages into our index more quickly than traditional crawling methods. We may use many potential sources to access updates from feeds including Reader, notification services, or direct crawls of feeds.
http://googlewebmastercentral.blogspot.com/2009/10/using-rssatom-feeds-to-discover-new.html

Хм, а разве он их раньше не учитывал ?
Получается, что нет.
Вот так, век живи – век учись.

Вся правда о дуплицированном контенте

Димок подкинул ссылку на толковую (наконец-то!) статью о дуплицированном контенте:

“Дуплицированного контента не существует, пока на него не ставятся ссылки”. http://seom.info/2009/10/30/duplicate-content/

Количество бреда, плодящегося в головах рунетовских сеошников вообще потрясает. Раньше это было “утекание пиара страницы через внешние ссылки”, сейчас же пальму первенства занял “дуплицированный контент”. Доходит до абсурда, особенно если почитать searchengines.ru . Ибо кто у нас нынче сеошник ? Студент или школьник в поисках быстрых денег. Учиться эти люди почти не умеют, хватают факты без подтверждения практикой, дальше все это выплескивается на форумы со своими домыслами и выводами, дальше их читает такой же студент или школьник в поисках новых знаний – и понеслось по кругу. Самоподдерживающаяся система.

Ранжирование в Google – год 2009й

Основные критерии:

24% Trust/Authority of the Host Domain
22% Link Popularity of the Specific Page
20% Anchor Text of External Links
15% On-Page Keyword Usage
7% Traffic and Click-Through Data
6% Social Graph Metrics
5% Registration and Hosting Data

Остальное – на http://www.seomoz.org/article/search-ranking-factors

Внутренние механизмы Google

На блоге Тормоза увидел упоминание о форуме make4you зашел и приятно удивился – в кои-то веки я вижу свежую волну, а не не старперское уныние 90х типа searchengines.ru или черный междусобойчик и между-строк-читальник типа gofuckbiz.com

Возможно, это просто первое впечатление, но оно вот такое.

Нашел на этом форуме ссылку на очень неплохое резюме по ранжированию в современном Гугле: http://wildo.ru/google/algoritmy-google . Рекомендую почитать, что-то освежить в памяти, что-то, возможно узнать.

Пара цитат:

LSI также понимает синонимизированную связь слов. Например, если смотреть статью об аэроплане, то LSI начнет искать синонимы: самолет, авиастроение. Будут учтены и просто схожие по тематическому смыслу слова, например: турбулентность, топливо, облака и небо. Смысл LSI заключается в обнаружении действительно полезного контента и отсеивании автоматически сгенерированного текста, который используется для манипуляции результатами выдачи.

Аарон Волл констатирует, что одна естественная ссылка равна 40-60 черным, то есть, если на вас ссылаются 60 заспамленных каталогов и 2 хороших сайта уровня ленты или серча, то на самом деле будет засчитан один хороший линк. Цифры, конечно, ориентировочные, но проверенные не одним человеком.

Seodigest

Вышел новый номер Сеодайджеста – уже аж 7й, оказывается!
Я в свое время обещал Стингеру написать про первый выпуск, надо наверстывать :)
Журнал стал вполне красивый визуально, с очень удобным онлайн-вьювером. Правда, мне странно видеть такое исполнение интернет-журнала, я бы верстал обычный html-сайт. Поисковый трафик опять же. Но авторам видней.

Из полезной инфы – я бы отметил работу с кейвордами, в частности сказано пару строк про мощные инструменты для белого вебмастера от команды seoquake – semrush.com и seopivot.com. Ну и про Facebook есть статья, хотя и несколько поверхностная и эклектичная.

Алгоритм ранжирования в Яндекс.Блогах

Понятная картинка:
как работает алгоритм ранжирования в популярных записях в яндекс.блогах

Поправка с пункту 2 – с блогов младше полугода не учитываются ссылки, сами блоги в топ попадать могут.

via Норвежский Лесной.

Прошерстил Google Reader

Не может не радовать тот факт, что гугль ридер я открываю все реже и реже, отдавая приоритет текущей работе и программингу для души.

Интересные вещи после последнего набега на RSS:

  • PHP-библиотека для работы с админкой Adsense. Полезно, например, для изучения того, как работает curl для авторизации в гугле. (via rmcreative.ru)
  • “On Modeling Trust in Social Media using Link Polarity” (via Кишиневский)

20 ноября – начало новой эры в SE

По-моему, это именно оно.
Гугль начал учитывать голоса серферов – при помощи кнопок, которые вы можете понаблюдать непосредственно в выдаче гугла.

Пока Гугль заявляет, что голоса не будут учитываться для построения выдачи для всех юзеров – выдачу можно менять только для себя. Но это уже Прецедент. Плюс еще один способ, причем отличный, для отделения белых агнцев от черных козлищ.

Изменения придут, конечно, не сразу, но они придут неотвратимо.

Возвращение. Еще раз о генерации контента. Разное.

Сории за огромную паузу – околоновогодние дни прошли в лихорадочном программинге для команды (да, наконец-то сложилась команда, довольно спонтанно) – боялись, что упустим гугль и тему.
Но время показало, что в seo по-прежнему изменения хоть и наступают неотвратимо, но наступают они медленно.

Дошли руки до гугл-ридера. Заметил забавное совпадение – как и год назад, вебмастеров заинтересовала схема генерации/изменения контента. Сначала Роман Янковский выкладывает распарсенную базу английской морфологии с aot.ru, затем он же напоминает, что у wordnet есть база в SQL и показывает, как её надо юзать, затем на умаксе появляется топик с весьма полезными линками. Практически все, что надо для написания собственного интеллектуального доргена.

Ну и о “интересном почитать”.
Добрый kass не перестает удивлять – на этот раз он выложил у себя базу из полутора тысяч англоязычных каталогов, отсортированную по PR и снабженную линками на форму сабмита. Димок пишет об инструментах работы с кейвордами (статья переводная, оригинал тут). На блоге Сео-Критика можно найти список блогохостингов, а на блоге ValentOs (кстати, рекомендую, неплохой новый блог) – список видеошаринг-хостингов.
Ну и теоретики могут ознакомиться с очередным seo-дайджестом с master-x.

Переменная as_qdr в языке запросов Гугла

Продублирую здесь, а то постоянно забываю, как она правильно пишется – as_qdr или as_gbr :).

Переменная as_qdr позволяет увидеть страницы, проиндексированные за указанный промежуток времени. Эта переменная может принимать следующие значения:
as_qdr=d (day – за один день)
as_qdr=w (week – за неделю)
as_qdr=m (month – за месяц)
as_qdr=y (year – за год).

Кроме того можно писать as_qdr=d5, тогда получите проиндексированные страницы за последние пять дней.

(текст взят отсюда)

Апдейт в Гугле – октябрь 2007го

Этот апдейт определенно войдет в историю.
Главный вопрос этих выходных, похоже – почему у youtube.com PR3 и что с этого факта можно поиметь. :)

Словарь адалт-тематики

На xmasterblog.blogspot.com увидел ссылку на словарь адалт-сленга – sex-lexis.com . Можно пропарсить и сделать список дополнительных кейвордов для адалт-ресурсов.

Тем временем курочка снесла дедушке яичко гугль снес PR многим сайтам, типа за размещение платных ссылок, показав этим, кто все-таки в доме хозяин. Похоже, совпадение тематики линкующихся сайтов начинает играть серьезную роль.

Next Page »