写了一段小程序用于提取html中的url:
import java.util.ArrayList;class HtmlLink{  private ArrayList LinkList;
  
  public HtmlLink()
  {
       LinkList = new ArrayList();
  }
  
  public void CrackLink(String htm,ArrayList LinkStr)
 {
   int p; 
   String Linkbuf;
   p = htm.indexOf("<a href='");
   if (p!=0)
         htm = htm.substring(p);
   else
       return;
   p = htm.indexOf("'");
   Linkbuf = htm.substring(0, p+3);
   htm = htm.substring(p);
   LinkList.add(Linkbuf);
   CrackLink(htm,LinkStr);  
 }
 
  public void CrackImg(String htm,ArrayList LinkStr)
  {
    int p; String Linkbuf;
   p = htm.indexOf("<img");
   if (p!=0)
         htm = htm.substring(p);
   else
       return;
   p = htm.indexOf(">");
   Linkbuf = htm.substring(0, p+3);
   htm = htm.substring(p);
   LinkList.add(Linkbuf);
   CrackLink(htm);   
  }
  
  public void getLinks(String HtmlStr)
  {
       CrackLink(HtmlStr,LinkStr);
       CrackImg(HtmlStr,LinkStr);
  }
  
  public ArrayList getList()
  {
      return LinkList;
  }
    
}
但是调试出错,报错:
Exception in thread "AWT-EventQueue-0" java.lang.StringIndexOutOfBoundsException: String index out of range: -1 不知道怎么改,哪位大哥帮帮我哈~~
button事件:
String p = jTextArea2.getText();
         HtmlLink q = new HtmlLink();
         q.getLinks(p);
         ArrayList z = q.getList();
         for (int i=0;i<=z.size();i++)
         {
             System.out.println((String)z.get(i));
         }