Hola compañeros, vereis, llevo un rato intentando crear una "sencilla" expresión regular para limpiar un código html que tengo, os explico:
Tengo esta cadena:
Código: Seleccionar todo
<td colspan="2" align="left" valign="bottom"><a class="maintitle" href="http://www.miservidor.com/hola_9898.html">Cadena que quiero recuperar</a><br>
De esa cadena, lo que quiero pasar a una variable es "Cadena que quiero recuperar", el enlace "
http://www.miservidor.com/hola_9898.html" puede variar en el nombre del fichero, es decir, el "hola_9898.html" en otro caso podria ser "hola_7656.html" o cualquier otro. Lo demás sería siempre igual (excepto la cadena a recuperar, claro :p)
ç
Yo he probado esta expresión regular:
Código: Seleccionar todo
$regexp = '/(?:<td colspan="2" align="left" valign="bottom">)(?:<a class="maintitle" href="http:\/\/www\.miservidor\.com\/hola_*html>)?(.+)(?:<\/a>)?(?:<br>)/';
El caso es que, más o menos, funciona, pero me devuelve la cadena del enlace completa, es decir, me devuelve todo esto:
<a class="maintitle" href="http://www.miservidor.com/hola_9898.html">Cadena que quiero recuperar</a> en lugar de devolverme solamente
Cadena que quiero recuperar
Algo hago mal en la expresión regular, pero no acabo de encontrar el que, alguna ayudita?
Gracias compañeros!