[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[linux] problem avec regexp



Kaixo!

Je voudrais pouvoir enlever, sur une page html, des portions
de texte entre deux tags donnés.
J'avas pensé à un truc du genre:

sed 's:<TAG>.*</TAG>::g'

mais le problème est que le '.*' matche la plus grande chaîne possible,
par exemple avec:

 aa<TAG>bbbb</TAG>cccc<TAG>ddddd</TAG>eeee

la commande sed au dessus retourne "aaeeee", alors que je voudrais
"aacccceeee".

J'ai donc besoin d'une façon de matcher la plus petite chaîne possible.

Mais je ne sais pas comment faire; quelqu'un aurait une idée ?

merci

PS: je ne peux pas remplacer '.*' par '[^<]*' car il peux y avoir d'autres
tags (differents de celui qui m'interesse) à l'interieur, ex:

 aa<TAG>bbbb<B>cccc</B>dddd</TAG>

-- 
Ki ça vos våye bén,
Pablo Saratxaga

http://www.srtxg.easynet.be/		PGP Key available, key ID: 0x8F0E4975

_______________________________________________
Linux Mailing List
Archives: http://unixtech.be/mailman/listinfo/linux