market.yandex.ru парсер

Недавно появилась задача парсить странички. Точнее market.yandex.ru.

Собрать все описания в готовом к вставке в базу виде а также доступные изображения к товару.

Исторически сложилось что с регулярками у меня хуже чем с XSLT.

Все хорошо но маркет не дает валидный код и парсить его напрямую у меня не получилось.

На помощь пришел Tidy.

Continue reading market.yandex.ru парсер