Preguntado hace 1 año
Beatriz Rojo
Trato de analizar unos ficheros html de texto pero tratarlos como cadena es una locura, estaría bien poder analizarlos como nodos o algo así. ¿Conoceís alguna librería para esto?
Hace 1 año
Mcallus
Yo uso jericho para parsear páginas html que exploro con un crawler que estoy haciendo.
Está muy bien porque puedes navegar por tipos de tipos de etiqueta, clases css o ids de elementos del árbol del html.
La web es esta (tiene ejemplos de uso bastante útiles): http://jericho.htmlparser.net/docs/index.html
La api esta: http://jericho.htmlparser.net/docs/javadoc/index.html
Un saludo
Rafa
Haberlas haylas.
Te pongo un par de cosas que he visto aunque no las conozco personalmente.
HTMLParser Varios HTML Parser
Espero que aquí encuentres lo que buscas.
Si sales ahora, perderás los cambios. ¿Estás seguro de querer salir?
Para participar en Babelias, debes estar convenientemente validado. Si ya eres usuario inicia sesión, si no lo eres, te puedes registrar.
Trata de ser descriptivo, usa al menos 25 caracteres
LLeva tu prestigio a tu página o blog, con el widget de Babelias
Usuario de ejemplo