tagsoup
A SAX-compliant HTML parser written in Java
TagSoup is a SAX-compliant parser written in Java that, instead of parsing well-formed or valid XML, parses HTML as it is found in the wild: nasty and brutish, though quite often far from short. By providing a SAX interface, it allows standard XML tools to be applied to even the worst HTML.
Для openSUSE Leap 15.5 нет официального пакетаДистрибутивы
openSUSE Tumbleweed
openSUSE Slowroll
openSUSE Factory RISCV
SUSE SLE-15-SP2
SUSE SLE-12-SP5
Неподдерживаемые дистрибутивы
Следующие дистрибутивы не имеют официальной поддержки. Используйте их пакеты на свой страх и риск.