1. regular expressions2. use a webbrowser control, load the document into the control and retrieve the content through the object model, but it is an overkill3. develop a html library