Фришный источник данных о бэках

Common Crawl выложила в открытый доступ на Amazon S3 индекс из 5 миллиардов веб-страниц с метаданными, PageRank и графом гиперссылок. (via habr)

Отличная задача для супермена – вычисление алгоритма ранжирования Гугля или Яндекса (хотя рунета в этой базе, наверное, немного), или хотя бы трастранка. Взять базу semrush или построить свою по нужным кейвордам, и проанализировать топовые сайты на предмет бэков/контента. Все данные есть, вопрос только в вычислительных мощностях и кумекалке.

Paypal начинает работать с Россией

24 сентября случится то, о чем так долго говорили большевики и мечтали все, кто хоть как-то связан с коммерцией в интернете – Paypal начинает полноценно работать с Россией, а именно разрешает прием денег.

Можно вешать мерчант на сайты !

Пруф: Upcoming Policy Updates
Процент, конечно, paypal берет нехилый, да и рефанды бывают, но расширение платежной аудитории в разы не может не радовать.
Остался месяц. Придумывайте идеи платных сервисов!

UPD Праздник отменяется, Paypal типа ошиблись…

Контент от гугля

Гугль в рамках своих Labs опубликовал н-граммы, распарсенные из книг.

http://ngrams.googlelabs.com/datasets

Можно заюзать.. ну, например в доргенах.

Хостинг за бакс в месяц от hostgator

Завтра, в честь дня благодарения, hostgator устраивает 80% дисконт на свой shared hosting , если сделать заказ с 14:00 до 18:00 по Москве. В итоге годовой хостинг с неограниченными диском, трафом, mysql-базами и доменами вам обойдется в 12$. Пользуйтесь, кому надо.

Разумеется, надо помнить, что пользоваться всем этим “неограниченным” полностью вам не дадут – как только вы станете нагружать процессор сверх положенного, вас попросят съехать.

Почему в Казань не приехал Мэт Кац

“Дмитрий Еремеев (группа компаний FIX) рассказывает, как собирался пул докладчиков, и почему на конференцию не приехал Мэтт Каттс, руководитель группы Google Webspam.”

http://www.seonews.ru/reviews/detail/121521.php

В Казани расскажут про глобальный баг Гугля

29-30 сентября в Казани пройдет SEO-конференция, на которой обещают, что спалят тему. Тема, естественно, уже кончилась, но не в ней суть.

Поражает её масштаб.

Глава оргкомитета Seoconference Василий Юзенчук рассказал Roem.ru, что на конференции впервые будет обнародована информация о дыре в алгоритмах Google, позволявшей в гигантских масштабах перенаправлять трафик по ключевым запросам на любой сайт – об этом будет рассказано в докладе Дмитрия Ермеева. Организаторы пытались получить в докладчики Мэтта Катса для комментирования этой ошибки, однако слишком поздно к нему обратились, когда он уже не мог внести мероприятие в календарь. Впрочем, на конференции и так будут присутствовать несколько представителей из Google.

Информация таки заслуживает доверия, ибо вот что о неё пишет в комментах сам главный редактор roem.ru:

The story began in 2006. The author managed to find a certain bug relating to passing the link weight by means of 301 redirect. It allowed any site (that got out of the sandbox) to occupy the first position in SERP within 24 hours by any keyword (including “online gambling”). Moreover, this bug allowed a webmaster to have any number of their resources in SERP and exchange them freely for other sites without any additional costs.

У меня больше информации, но все просили не публиковать, чтобы не смазать впечатления от доклада, я, думаю, было бы интересно послушать.

Как ТАКОЕ могло с 2006го оставаться незамеченным под пристальным взглядом сеошников и не быть растиражированным ?

Табор уходит в небо – vox.com всё.

Вслед за блогами на AOL в 2008, закрывается блогхостинг Vox:

  • As of September 2, Vox is no longer accepting new user registrations.  If you have an existing Vox account you can continue to sign in to manage your account and view posts from your neighborhood.
  • On Wednesday September 15th, you will no longer be able to create new posts on Vox or upload new photos or videos. You will still be able to sign in to view your blog and manage your account.
  • On Thursday September 30th, your blog will no longer be available at Vox.com, and you will no longer be able to sign in to Vox.

http://closing.vox.com/

В свое время этот хост отлично выходил по НЧ без каких-либо дополнительных действий – все благодаря сквозным nofollow тэгам.

Помянем старичка!

Где деньги

Понятная картинка:

Обфускатор Javascript

На Хабре нашел ссылку на отличный инструмент для шифрования js от чужих глаз:

http://utf-8.jp/public/jjencode.html

Например, alert(“test”); превращается вот в такую конструкцию:

$=~[];$={___:++$,$$$$:(![]+”")[$],__$:++$,$_$_:(![]+”")[$],_$_:++$,$_$$:({}+”")[$],$$_$:($[$]+”")[$],_$$:++$,$$$_:(!”"+”")[$],$__:++$,$_$:++$,$$__:({}+”")[$],$$_:++$,$$$:++$,$___:++$,$__$:++$};$.$_=($.$_=$+”")[$.$_$]+($._$=$.$_[$.__$])+($.$$=($.$+”")[$.__$])+((!$)+”")[$._$$]+($.__=$.$_[$.$$_])+($.$=(!”"+”")[$.__$])+($._=(!”"+”")[$._$_])+$.$_[$.$_$]+$.__+$._$+$.$;$.$$=$.$+(!”"+”")[$._$$]+$.__+$._+$.$+$.$$;$.$=($.___)[$.$_][$.$_];$.$($.$($.$$+”\”"+$.$_$_+(![]+”")[$._$_]+$.$$$_+”\\”+$.__$+$.$$_+$._$_+$.__+”(\\\”"+$.__+$.$$$_+”\\”+$.__$+$.$$_+$._$$+$.__+”\\\”)\\”+$.$$$+$._$$+”\”")())();

Это полностью рабочий js-код.
Но разобрать, что именно он делает – нереально.
Юзайте для шифрования доменов редиректов и прочего.

Разворачиваем USA веб-прокси на базе Google App Engine

Сам еще не делал, но идея интересная, в ближайшее время попробую.

На английском: http://www.labnol.org/internet/setup-proxy-server/12890/
На русском: http://vadim.com.ua/2010/03/delaem-sobstvennyiy-proksi-server-na-mac-os-x-s-pomoschyu-google-app-engine/

Многопоточные действия на PHP

На Хабре наткнулся на пример реализации многопоточных вычислений на php:

http://habrahabr.ru/blogs/php/90487/

Многопоток юзается для одновременного скачивания нескольких урлов. Конечно, здесь логичнее применить мультикурл, но автор хотел сделать одновременным не только скачивание, но и последующий разбор контента.

Разоблачение MatrixNet

Вот он, центр аналитики Яндекса:


(картинка из фликра Сегаловича)

Прости, бложик.

Как же давно я к тобой не занимался все-таки, у тебя уже pr2 вместо четверки, на морде реклама неоплаченная крутится, в категориях – окаменелое говно мамонта. Ну ничего, сейчас активизируем тебя немного, постов понапишем, на другой хостинг перенесем, Раббиту стукнем. :)

Нужна помощь

Наш коллега sicmusic попал в неприятную ситуацию в Таиланде – находится под следствием, сидит в СИЗО, к среде возможно будет шанс выйти под залог, адвокат сейчас занимается этим вопросом. Сумма залога будет в районе $20к-$23к. На данный момент собрана половина.

Деньги на залог собирают здесь: http://www.umaxforum.com/showthread.php?t=32701 . Не безвозмездно, в долг.

Прошерстил Google Reader

Не может не радовать тот факт, что гугль ридер я открываю все реже и реже, отдавая приоритет текущей работе и программингу для души.

Интересные вещи после последнего набега на RSS:

  • PHP-библиотека для работы с админкой Adsense. Полезно, например, для изучения того, как работает curl для авторизации в гугле. (via rmcreative.ru)
  • “On Modeling Trust in Social Media using Link Polarity” (via Кишиневский)
Next Page »