Недавно появилась задача парсить странички. Точнее market.yandex.ru. Собрать все описания в готовом к вставке в базу виде а также доступные изображения к товару. Исторически сложилось что с регулярками у меня хуже чем с XSLT. Все хорошо но маркет не дает валидный код и парсить его напрямую у меня не получилось. На помощь пришел Tidy.