Фришный источник данных о бэках

Common Crawl выложила в открытый доступ на Amazon S3 индекс из 5 миллиардов веб-страниц с метаданными, PageRank и графом гиперссылок. (via habr)

Отличная задача для супермена – вычисление алгоритма ранжирования Гугля или Яндекса (хотя рунета в этой базе, наверное, немного), или хотя бы трастранка. Взять базу semrush или построить свою по нужным кейвордам, и проанализировать топовые сайты на предмет бэков/контента. Все данные есть, вопрос только в вычислительных мощностях и кумекалке.

Paypal начинает работать с Россией

Дмитрий Еремеев fix

24 сентября случится то, о чем так долго говорили большевики и мечтали все, кто хоть как-то связан с коммерцией в интернете – Paypal начинает полноценно работать с Россией, а именно разрешает прием денег.

Можно вешать мерчант на сайты !

Пруф: Upcoming Policy Updates
Процент, конечно, paypal берет нехилый, да и рефанды бывают, но расширение платежной аудитории в разы не может не радовать.
Остался месяц. Придумывайте идеи платных сервисов!

UPD Праздник отменяется, Paypal типа ошиблись…

Контент от гугля

Гугль в рамках своих Labs опубликовал н-граммы, распарсенные из книг.

http://ngrams.googlelabs.com/datasets

Можно заюзать.. ну, например в доргенах.

Идеальный лэндинг

Понятная картинка:

Дмитрий Еремеев fix

Взято с http://www.formstack.com/the-anatomy-of-a-perfect-landing-page/

Фришный Xweb на Ruby

Watir – gem для ruby, который позволяет работать с сайтами (парсить страницы, кликать по кнопкам), исполняя джаваскрипт. Да-да, позволяет работать с js на линукс-сервере, без сторонних инструментов.

Обзор на хабре: http://habrahabr.ru/blogs/ruby/109835/

Чего может, коротенечко: http://wiki.openqa.org/display/WTR/Cheat+Sheet
Примеры: http://wiki.openqa.org/display/WTR/Examples

Хостинг за бакс в месяц от hostgator

Завтра, в честь дня благодарения, hostgator устраивает 80% дисконт на свой shared hosting , если сделать заказ с 14:00 до 18:00 по Москве. В итоге годовой хостинг с неограниченными диском, трафом, mysql-базами и доменами вам обойдется в 12$. Пользуйтесь, кому надо.

Разумеется, надо помнить, что пользоваться всем этим “неограниченным” полностью вам не дадут – как только вы станете нагружать процессор сверх положенного, вас попросят съехать.

Почему в Казань не приехал Мэт Кац

“Дмитрий Еремеев (группа компаний FIX) рассказывает, как собирался пул докладчиков, и почему на конференцию не приехал Мэтт Каттс, руководитель группы Google Webspam.”

http://www.seonews.ru/reviews/detail/121521.php

В Казани расскажут про глобальный баг Гугля

29-30 сентября в Казани пройдет SEO-конференция, на которой обещают, что спалят тему. Тема, естественно, уже кончилась, но не в ней суть.

Поражает её масштаб.

Глава оргкомитета Seoconference Василий Юзенчук рассказал Roem.ru, что на конференции впервые будет обнародована информация о дыре в алгоритмах Google, позволявшей в гигантских масштабах перенаправлять трафик по ключевым запросам на любой сайт – об этом будет рассказано в докладе Дмитрия Ермеева. Организаторы пытались получить в докладчики Мэтта Катса для комментирования этой ошибки, однако слишком поздно к нему обратились, когда он уже не мог внести мероприятие в календарь. Впрочем, на конференции и так будут присутствовать несколько представителей из Google.

Информация таки заслуживает доверия, ибо вот что о неё пишет в комментах сам главный редактор roem.ru:

The story began in 2006. The author managed to find a certain bug relating to passing the link weight by means of 301 redirect. It allowed any site (that got out of the sandbox) to occupy the first position in SERP within 24 hours by any keyword (including “online gambling”). Moreover, this bug allowed a webmaster to have any number of their resources in SERP and exchange them freely for other sites without any additional costs.

У меня больше информации, но все просили не публиковать, чтобы не смазать впечатления от доклада, я, думаю, было бы интересно послушать.

Как ТАКОЕ могло с 2006го оставаться незамеченным под пристальным взглядом сеошников и не быть растиражированным ?

Табор уходит в небо – vox.com всё.

Вслед за блогами на AOL в 2008, закрывается блогхостинг Vox:

  • As of September 2, Vox is no longer accepting new user registrations.  If you have an existing Vox account you can continue to sign in to manage your account and view posts from your neighborhood.
  • On Wednesday September 15th, you will no longer be able to create new posts on Vox or upload new photos or videos. You will still be able to sign in to view your blog and manage your account.
  • On Thursday September 30th, your blog will no longer be available at Vox.com, and you will no longer be able to sign in to Vox.
  • Архив

http://closing.vox.com/

В свое время этот хост отлично выходил по НЧ без каких-либо дополнительных действий – все благодаря сквозным nofollow тэгам.

Помянем старичка!

Google Wave всё

We don’t plan to continue developing Wave as a standalone product

http://googleblog.blogspot.com/2010/08/update-on-google-wave.html

Гугл Вейв (а как все начиналось!) провалился в качестве отдельного продукта и в этой ипостаси поддерживаться больше не будет. До конца года поживет – и потом всё.
Теперь его технологию попробуют употребить в других продуктах гугла, но мне пока непонятно, где оно вообще может пригодиться.

Где деньги

Понятная картинка:

Дмитрий Еремеев fix

Обфускатор Javascript

На Хабре нашел ссылку на отличный инструмент для шифрования js от чужих глаз:

http://utf-8.jp/public/jjencode.html

Например, alert(“test”); превращается вот в такую конструкцию:

$=~[];$={___:++$,$$$$:(![]+”")[$],__$:++$,$_$_:(![]+”")[$],_$_:++$,$_$$:({}+”")[$],$$_$:($[$]+”")[$],_$$:++$,$$$_:(!”"+”")[$],$__:++$,$_$:++$,$$__:({}+”")[$],$$_:++$,$$$:++$,$___:++$,$__$:++$};$.$_=($.$_=$+”")[$.$_$]+($._$=$.$_[$.__$])+($.$$=($.$+”")[$.__$])+((!$)+”")[$._$$]+($.__=$.$_[$.$$_])+($.$=(!”"+”")[$.__$])+($._=(!”"+”")[$._$_])+$.$_[$.$_$]+$.__+$._$+$.$;$.$$=$.$+(!”"+”")[$._$$]+$.__+$._+$.$+$.$$;$.$=($.___)[$.$_][$.$_];$.$($.$($.$$+”\”"+$.$_$_+(![]+”")[$._$_]+$.$$$_+”\\”+$.__$+$.$$_+$._$_+$.__+”(\\\”"+$.__+$.$$$_+”\\”+$.__$+$.$$_+$._$$+$.__+”\\\”)\\”+$.$$$+$._$$+”\”")())();

Это полностью рабочий js-код.
Но разобрать, что именно он делает – нереально.
Юзайте для шифрования доменов редиректов и прочего.

И опять о мультикурле

Если кто-то не обзавелся в хозяйстве библиотекой для многопоточного асинхронного скачивания страниц – самое время это сделать.

http://rmcreative.ru/blog/post/rolling-curl
Скачать можно через svn отсюда: http://code.google.com/p/rolling-curl/
Там, в принципе, можно еще сделать кой-какие улучшения – можно добавить юзер-агенты, прокси, но в целом юзать эту либу можно и сейчас.
Из вкусностей – можно делать не только многопоточные GET-запросы , но и POST.

Поддерживать библиотеку будет один из лучших php-программеров-блоггеров рунета (сорри, Александр, за громкие слова), член команды разработчиков фреймворка Yii, автор нескольких полезных библиотек для Codeigniter – Александр Sam Dark Макаров. :)

Начинающим программистам

Нашел любопытный блог девушки-программиста: “Парсинг от А до Я“. Рекомендую молодым сеошникам, которые программят что-то для себя сами, просто и понятно о ключевых задачах, с которыми сталкивается практически каждый.

Разворачиваем USA веб-прокси на базе Google App Engine

Сам еще не делал, но идея интересная, в ближайшее время попробую.

На английском: http://www.labnol.org/internet/setup-proxy-server/12890/
На русском: http://vadim.com.ua/2010/03/delaem-sobstvennyiy-proksi-server-na-mac-os-x-s-pomoschyu-google-app-engine/

Next Page »