4.27.2008

Http Parser 学习手册(一)

如何使用HTML Parser类

HTMLParser包是个很方便的HTML代码分析器

1.下载HtmlParser包

地址:http://prdownloads.sourceforge.net/htmlparser/htmlparser1_6_20060610.zip?download

2.随便解压到一个目录,设置CLASSPATH,指向lib目录里的htmlparser.jar

3.一个简单的例子:

import org.htmlparser.Parser;
import org.htmlparser.util.NodeList;
import org.htmlparser.util.ParserException;

class Test
{
public static void main (String[] args)
{
try
{
Parser parser = new Parser (args[0]); //args[0]可以是任意的一个网址
NodeList list = parser.parse (null);
System.out.println (list.toHtml ()); //输出网址的HTML代码
}
catch (ParserException pe)
{
pe.printStackTrace ();
}
}
}

4.解压目录里的doc目录里面有API和说明文档供大家研究,GOOD LUCK.