Parser HTML

Modérateurs: Ligevum, Crepuscule, Wargaming, Okracoke, Simerion, Heroes, Bestiaire, Exsulare, terato, pentacle, Nainwak

Parser HTML

Messagepar Nico100 » 19 Aoû 2008, 16:28

Salut a tous,

Je cherche un Parser HTML qui me permette de facilement récuperer dans un tableau (ou tout autre structure) le contenu d'une page HTML classé par tag...

J'en ai trouvé quelques-uns, mais pas encore celui suffisament simple et efficace qui me convient...

Pourriez-vous m'aider?

Merci
Avatar de l’utilisateur
Nico100
 
Messages: 283
Inscription: 13 Avr 2004, 15:23

Messagepar Haiken » 19 Aoû 2008, 19:18

heu.... document.getElementsByName() et toutes les fonctions DOM en javascript ? :D

Bon ok, ça existe aussi en PHP : http://fr3.php.net/manual/fr/book.dom.php
Tu parses un document avec DOMDocument::loadHTML puis après tu parcoures l'arbre comme tu veux ou avec DOMDocument::getElementsByTagName
Avatar de l’utilisateur
Haiken
Président de l'Association
 
Messages: 666
Inscription: 01 Avr 2004, 09:00

Messagepar Nico100 » 09 Sep 2008, 14:28

Salut,

Je voudrais activer l'extension DOMXML mais je n'y arrive pas.
je suis sous windows avec easyPHP 1.8 et j'ai toujours l'erreur
http://img380.imageshack.us/my.php?image=image1xi7.png

Impossible de la demarrer correctement... pourtant j'ai modifié le php.ini, les fichiers dll sont biens dans le path en question...

Une idée?

A vrai dire j'ai trouvé ca:
http://www.tintetoner-shop.de/DomUtilities/
qui me parait tout a fait correspondre a mes besoins, mais je n'arrive pas a le faire fonctionner.
Je me dis que DOMXML doit etre utile!

Please help!
Avatar de l’utilisateur
Nico100
 
Messages: 283
Inscription: 13 Avr 2004, 15:23

Messagepar Daimonos Tereutes » 09 Sep 2008, 17:05

DOMXML était inclus dans PHP4.
Pour PHP5, il faut utiliser DOM.

DOM de même que ses dépendances (iconv) sont inclus de base dans la distribution php.

EsayPHP1.8 est très ancien et de manière plus générale easyPHP est un projet quasi mort.

Change pour WAMP ou XAMP qui sont à jour et fournissent des versions de PHP qui fonctionnent.
Admin technique de nainwak.org
Daimonos Tereutes
Responsable Technique de l'Association
 
Messages: 926
Inscription: 30 Mar 2004, 18:39

Messagepar Nico100 » 10 Sep 2008, 15:57

Super merci!

j'ai installé WAMP et ca va deja mieux! ;)

J'arrive a parser un bout de HTML, et je me retrouve avec un DOMElement...

Mais apres je n'arrive plus rien a faire a part:
Code: Tout sélectionner
echo $domelement->tagName;

Les methodes qui pourraient etre vraiment utiles genre DOMElement::hasAttribute et surtout DOMElement::getAttribute ne semble pas disponibles dans ma version de php (5.2.6)...
Fatal error: Call to a member function getAttribute() on a non-object in C:\Program Files\Wamp\www\tests\test_DOMUtilities.php on line 32

Qu'est qu'on peut faire avec un DOMElement une fois qu'on l'a??

Merci d'avance
Avatar de l’utilisateur
Nico100
 
Messages: 283
Inscription: 13 Avr 2004, 15:23

Messagepar Nico100 » 10 Sep 2008, 16:00

Au temps pour moi!
c'etait pas sur le bon objet... en fait ca marche!

NICO100.passe.pour.un.con!
Avatar de l’utilisateur
Nico100
 
Messages: 283
Inscription: 13 Avr 2004, 15:23


Retourner vers Questions Pratiques/Techniques

Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité

cron