Перейти к содержимому
iborodikhin

Игорь Бородихин

@iborodikhin

На сайте с 22 августа 2010 г.Казахстан, Алматы

Пользователь пока ничего не рассказал о себе.

рейтинг

100

постов

10

комменты

62

подписчиков

10

подписки

2

Как делался счётчик посещений на internets.kz - v2.0

Когда-то давным-давно, в одной далёкой галактике… :)
Пару лет назад я захотел сделать свой собственный Каталог Сайтов, с преферансом и куртизанками. Так на свет появился сайт internets.kz. Если кому-то интересны цели — меня что-то всегда не устраивало в других каталогах, хотелось своего, хотелось размять пальцы.

Скандалы, интриги, расследования. Показать всё, что скрыто.

0
0
320

Маленькие хитрости Linux

Буду здесь собирать всяческие полезные штуки и "подводные камни", на которые наткнулся в процессе работы. Поскольку сам я, скорее, пользователь Linux, то многие вещи профессионалам покажутся очевидными. Не стоит за это меня казнить :) Я хочу всего лишь собрать для себя в одном месте шпаргалку. Итак. 1. Как остановить все экземпляры программы (по маске), если killall не помогает: kill -9 `ps -ef | grep %programm_name% | grep -v grep | awk '{print $2}'` 2. Поиск информации в файлах (аналоги ORDER BY / GROUP BY в SQL): cat access.log | sort | uniq -c | sort > access.1.log (sort - сортирует, с ключем -r сортирует в обратном направлении; uniq -c - выполняет "группировку", удаляет дубликаты и пишет количество вхождений) 3. Не запускается последний скрипт в cron Это связано с тем, что каждая…

0
0
473

Архитектура и история i-News.kz

Всем привет! Я долго собирался с мыслями и в итоге решился описать архитектуру своего сайта - i-news.kz. Но для начала немного истории. В далёком 2008 году я, вместе с товарищем Сашей Малым (Prankster) делал многообещающий (и ныне покойный) проект - uno.kz и в его рамках нам очень хотелось запустить новостной сайт. Останавливал нас тот факт, что новости эти кто-то должен размещать на сайте. Т.е. нужен человек, который будет заниматься скучной монотонной работой (примерно так, как сделано на www.zakon.kz). Внезапно в одной из бесед мой хороший друг Никита Вершинин (endeveit) упомянул, что собирается делать свой агрегатор новостей. Тогда я понял, что скучную монотонную работу можно здорово переложить на плечи программы. Так появился новостной раздел на uno.kz. Прошло время и наши с Сашей пу…

Очередной луч ненависти КТ

Не-не, я не ярый КТ-ненавистник :) Просто почему-то так выходит :) Был у меня сайтец, состоящий из четырёх файлов (файлы: база SQLite, капча, индекс и админка). Посещался весьма хило, порядка 2-3 человек в день, но и нужен он мне был, так сказать, для души. Хостился он на ID Free и кушать не просил. Внезапно 15 ноября (правильно, такие вещи нужно делать аккурат перед долгими выходными) сайт был отключен. Пытаюсь зайти на cp.idhost.kz - Статус аккаунта изменён на "Отключен". К слову, там же у меня хостились ещё парочка слабопосещаемых сайтов (для посещаемых бесплатного хостинга чертовски мало). Спросил у техподдержки, какого, собственно говоря, хуя. Ответили вот так: Аккаунт удален в связи с тем что большая часть имеющихся подписок истек срок, а также из-за того что Вы им долго не пользова…

0
1
435

Очередной способ борьбы со спамом

В прошлый раз я описал алгоритм шинглов для борьбы со спамом на сайте. Этот метод позволяет определять похожие тексты. С одной стороны - это отличное средство, с другой - существуют ситуации, при которых он бессилен. Одной из таких ситуаций может стать пример, который я хочу сейчас рассмотреть. Пользователь пишет сообщение "вася васечкин - лох". Его можно добавить в фильтры, но пользователь может изменить сообщение и написать его так: "в.а.с.я.в.а.с.е.ч.к.и.н.л.о.х" - с точки зрения смысловой нагрузки - это одно и то же сообщение. Пытаться его побороть шинглами бесполезно - определить границы слов программно (без использования словарей) - невозможно. Мы можем оставить только буквы в обоих сообщениях - сработает. А если пользователь напишет "в_а_с_я_в_а_с_е_ч_к_и_н_л_о_х_qwerty"? Решение д…

0
0
281

КТ, мегалайн, хостинг, интернеты и хомячки

Не то, чтобы я что-то хотел изменить этой записью или кому-то что-то поведать. Просто, как говорится, "накипело". Так случилось, что в КазНете пользователи делятся на две категории. Одна молится на КТ, другая всё понимает, но бороться с этими хомячками не в состоянии в силу разных причин. Тут в ветке про хостинг хвалят idhost... Нет, он, конечно хорош, особенно бесплатные тарифы. И плевать на слабую поддержку, хомячки ничего не потеряют, если их дняфка будет в дауне пару дней. Есть у меня там сайтик на ID Free - я даже MySQL не стал использовать, ограничился SQLite'ом. Маленький такой сайтик, на который в день заходит 3-4 человека. А все более-менее серьёзные проекты я держу "за бугром". Не потому, что я сильно не люблю КТ или презираю лично каждого мегалайнера - нет во мне таких чувств.…

DOMXpath как продвинутый парсер или Мой "експеримент"

Вдохновившись идеей пользователя xapon реализовал такое же "облако" ключевых слов на сайтах, зарегистрированных в каталоге iNternets.kz Отличия как в идеологии (данные берутся только для зарегистрированных сайтов, в оригинале же авторы сами добавляют сайты; я показываю только ключевики, занимающие больше 10% от общей массы и не показываю URL'ы сайтов, на которых они встречаются), так и в технике (я не возился два дня с парсером, а воспользовался простой и удобной связкой DOMDocument+DOMXpath). Вот код моего парсера, чтобы все поняли, как это просто :) <?php $content = file_get_contents($row['url']); if($content) { // Get charset $charset = mb_detect_encoding($content, "utf-8, windows-1251, koi8-r, koi8-u"); if(!$charset) { $dom = new DOMDocu…

0
5
806

Алгоритм шинглов - боремся со спамом на сайте

15 октября прошлого года я принял участие в Яндекс.Субботнике, проходившем в Алматы. При общении в кулуарах один из программистов Яндекса обмолвился, что для борьбы со спамом в почте используется Алгоритм Шинглов. Тогда я не придал этому особого значения, но про себя отметил, что это прекрасная идея. Позже у меня случился отпуск, я на 2 недели покинул страну, а когда вернулся обнаружил две взаимосвязанных вещи - посещаемость моего новостного сайта значительно возросла и вместе с ней возросло и количество спама в комментариях к новостям. Конечно же, у меня были инструменты для блокирования комментаторов по IP и для удаления комментариев. Но этого было недостаточно, поскольку спам шёл с разных IP. Чёткие шаблоны создавать тоже не получалось, потому что текст спама немного отличался каждый р…

1
1
846

Как делался счётчик посещений на iNternets.kz

В продолжение предыдущего поста Асинхронность PHP сегодня я расскажу, как применялись эти знания на практике. Больше двух лет назад впервые увидел свет очередной мой проект - каталог казахстанских сайтов iNternets.kz. Тогда это действительно был только каталог сайтов, но очень быстро пришло понимание того, что такой сайт не особо интересен нашим веб-мастерам и недостаточно конкурентоспособен. Я начал обвешивать его дополнительными функциями - проверка ТИЦ и PR, оценка семантичности вёрстки и, как естественное продолжение каталога сайтов - система статистики. Изначально было принято решение, что основным станет невидимый счётчик, а графический будет опцией и размещение любого счётчика (как и обратной ссылки) будет сугубо добровольным. Первая версия счётчика производила запись в таблицу MyS…

0
4
526

Асинхронность PHP, очередная попытка изменить мир

Дорогие ребята, этот пост посвящён в первую очередь новичкам (хотя, по опыту могу сказать, что зачастую у веб-программистов большие проблемы с адекватностью самооценки), опытные зубры наверняка знают всё, что я собираюсь написать (здоровая критика приветствуется). Итак, о чём это я? Асинхронность. Ваши скрипты, которые выдают что-то в браузер клиенту (будь то html-код, картинка или заголовок "302 Location /somewhere/else") должны делать как можно меньше операций. Всё, что делается в таких скриптах - делается синхронно (пришёл запрос, обработали данные, выдали результат). Всё, что делается синхронно - заставляет клиента ждать. Когда клиент вынужден ждать, он начинает ненавидеть ваш сайт и лично вас. Когда клиент ненавидит вас, у вас портится карма, потом здоровье и вас начинают преследоват…

0
5
683