Páginas

miércoles, 1 de enero de 2014

Gambas3: Como extraer el contenido de una pagina web (parsear)

Gambas3

Como extraer contenido 

de una pagina web (parsear)


Os dejo 2 maneras de extraer el contenido de una una página web y tenerlo almacenado en una variable tipo cadena (string) en nuestro programa, que posteriormente podremos analizar.


Método 1: usando el comando externo wget
->
Método 2: usando la clase HttpClient
->
Nota:
Para usar la clase HttpClient debeis de activa el componente gb.net.curl:
(menu Proyecto/Propiedades/pestaña Componentes)


Ejemplo de aplicación:
Os dejo un simple ejemplo de aplicación que extrae y muestra el contenido de una pagina web de las dos formas.
Tiene dos botones que extraen el contenido de las formas anteriormente explicada, un textbox donde pondremos la dirección Url que queremos descargar y un control Editor, donde mostramos el contenido extraido coloreado automaticamente.
->

Captura de la aplicación en funcionamiento:


Enlace de descarga: descarga desde Box

Otro ejemplo: http://jsbsan.blogspot.com.es/2011/10/updaterayo-nueva-clase-up-poder-buscar.html


Saludos