Jack Sleights Table-extractor(PHP) är det vackraste jag använt på länge
02 Sep 2009
Utveckling
Jag skulle i ett projekt extrahera tabeller ur HTML-sidor och tänkte att jag skulle lösa detta genom en kombination av Tidy och DOM-träd men bestämda mig för att Googla lite och fastnade istället för Jack Sleights Table Extractor. Ett helt fenomenalt verktyg som med 3 rader kod enkelt läser ut tabeller från HTML-sidor till arrayer i PHP. Otroligt enkelt. Ännu snyggare är hur man väljer ut vilken tabell man skall läsa ut om det finns flera tabeller på samma sida. Man bara anger en HTML-sträng som man skall börja leta ifrån.
http://jacksleight.com/old/blog/2008/01/14/really-shiny/scripts/table-extractor.txt
Så här ser syntaxen ut. Enklare kan det inte bli.
$tx = new tableExtractor; // Initiera klassen
$tx->source = file_get_contents(‘sample1.html’); // Läs in filen frÃ¥n disk eller url
$tx->anchor = ‘<h2>Our Products</h2>’; // Ange efter vilken kod man skall börja leta
$tableArray = $tx->extractTable(); // Hämta tabellen som en array.
Kommentera inlägget