[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[linux] problem avec regexp
Kaixo!
Je voudrais pouvoir enlever, sur une page html, des portions
de texte entre deux tags donnés.
J'avas pensé à un truc du genre:
sed 's:<TAG>.*</TAG>::g'
mais le problème est que le '.*' matche la plus grande chaîne possible,
par exemple avec:
aa<TAG>bbbb</TAG>cccc<TAG>ddddd</TAG>eeee
la commande sed au dessus retourne "aaeeee", alors que je voudrais
"aacccceeee".
J'ai donc besoin d'une façon de matcher la plus petite chaîne possible.
Mais je ne sais pas comment faire; quelqu'un aurait une idée ?
merci
PS: je ne peux pas remplacer '.*' par '[^<]*' car il peux y avoir d'autres
tags (differents de celui qui m'interesse) à l'interieur, ex:
aa<TAG>bbbb<B>cccc</B>dddd</TAG>
--
Ki ça vos våye bén,
Pablo Saratxaga
http://www.srtxg.easynet.be/ PGP Key available, key ID: 0x8F0E4975
_______________________________________________
Linux Mailing List
Archives: http://unixtech.be/mailman/listinfo/linux