Недавно появилась задача парсить странички. Точнее market.yandex.ru.
Собрать все описания в готовом к вставке в базу виде а также доступные изображения к товару.
Исторически сложилось что с регулярками у меня хуже чем с XSLT.
Все хорошо но маркет не дает валидный код и парсить его напрямую у меня не получилось.
На помощь пришел Tidy.
9. Сентябрь 2008.