<div dir="ltr"><div>You could always use xslt to parse the html to csv and then import to filePro from there</div><div>I have a large import that I do daily that parses XML and with proper tags in your xslt it will parse the html pretty much the same way</div><div><br></div></div><br><div class="gmail_quote"><div class="gmail_attr" dir="ltr">On Tue, Nov 12, 2019 at 7:35 PM Bill Campbell via Filepro-list <<a href="mailto:filepro-list@lists.celestial.com">filepro-list@lists.celestial.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;padding-left:1ex;border-left-color:rgb(204,204,204);border-left-width:1px;border-left-style:solid">On Tue, Nov 12, 2019, Fairlight via Filepro-list wrote:<br>
>The whole problem with that tech is that it's a moving target.  It's slower<br>
>moving than it used to be, but there are vast differences between 3, 3.2,<br>
>4, XHTML, and 5.<br>
><br>
>I would not want to have to support that, long-term.  I do not envy you,<br>
>unless it's one hell of a revenue stream.<br>
<br>
I've done a fair amount of html parsing, mostly using the python urllib,<br>
sometimes running the html through tidy to clean it up before digging into<br>
it.  Tidy will parse the html into well-formed xhtml making parsing the<br>
output much easier.<br>
<br>
I often parse the body of the HTML with regular expressions, finding that<br>
easier than running through libraries like the python lxml etree parser.<br>
<br>
Bill<br>
-- <br>
INTERNET:   <a href="mailto:bill@celestial.com" target="_blank">bill@celestial.com</a>  Bill Campbell; Celestial Software LLC<br>
URL: <a href="http://www2.celestial.com/" target="_blank" rel="noreferrer">http://www2.celestial.com/</a> 6641 E. Mercer Way<br>
Mobile:         (206) 947-5591  PO Box 820<br>
Fax:            (206) 232-9186  Mercer Island, WA 98040-0820<br>
<br>
Cutting the space budget really restores my faith in humanity.  It<br>
eliminates dreams, goals, and ideals and lets us get straight to the<br>
business of hate, debauchery, and self-annihilation.  -- Johnny Hart<br>
_______________________________________________<br>
Filepro-list mailing list<br>
<a href="mailto:Filepro-list@lists.celestial.com" target="_blank">Filepro-list@lists.celestial.com</a><br>
Subscribe/Unsubscribe/Subscription Changes<br>
<a href="http://mailman.celestial.com/mailman/listinfo/filepro-list" target="_blank" rel="noreferrer">http://mailman.celestial.com/mailman/listinfo/filepro-list</a><br>
</blockquote></div>