Когда я еще не умел программировать на пхп, думал, как же это должно быть клево. Написал парсер того, потом парсер сего и еще вот этого, повешал эти парсеры на крон, все полученное замешал на своем сайте, … , PROFIT! Или хотя бы profit или даже совсем маленький profitочек, что тоже неплохо, так как это планировалось как полный автомат. Какой же это был наивняк :)


Когда я уже немного научился кодить и сделал несколько сайтов такого толка (один из них - рейтинг вебмастеров), вылез совершенно неочевидный по началу момент - автоматический парсинг информации скриптами идеален и стабилен только в теории, а на практике же, очень часто проходит с ошибками. На сайтах, с которых парсится информация, все время что-то меняется. Кто-то верстку сменит; кто-то забьет информацию в другом формате, не как всегда; у кого-то сайт в дауне; кто-то вообще забыл домен продлить и все в таком духе, что в итоге выливается в ошибку парсинга.


Практически каждый день, хотя бы 1 скрипт-парсер (со всех сайтов вместе взятых) выдает вместо результата ошибку. Каждый, блин, день. Надо смотреть, что за ошибка, если она из-за каких-то изменений на сайте-доноре информации, то, как минимум, переделывать регулярку. На первый-пятый-десятый раз это нормально, но на шестьсотпятьдесятвторой - достает уже в конец.


Никаких больше мифических “автопрофитов”. Буду делать нормальные небольшие сервисы для людей. Когда-нибудь.





Обсудить  

Читайте также


Комментарии Кто голосовал Похожие новости

Комментарии