Jericho HTML 解析器开源项目

我要开发同款
匿名用户2009年04月10日
17阅读
开发技术Java
所属分类Web应用开发、HTML解析器
授权协议LGPL

作品详情

JerichoHTML解析器是一个Java库,以分析和操纵部分的HTML文件,其中包括服务器端的标签,而过滤掉任何无法识别的或无效的HTML。它也提供高层次的HTML表单操作函数。

示例代码:

importnet.htmlparser.jericho.*;importjava.util.*;importjava.io.*;importjava.net.*;publicclassEncoding{publicstaticvoidmain(String[]args)throwsException{StringsourceUrlString="data/test.html";if(args.length==0)System.err.println("Usingdefaultargumentof\""+sourceUrlString+'"');elsesourceUrlString=args[0];if(sourceUrlString.indexOf(':')==-1)sourceUrlString="file:"+sourceUrlString;System.out.println("\nSourceURL:");System.out.println(sourceUrlString);URLurl=newURL(sourceUrlString);Sourcesource=newSource(url);System.out.println("\nDocumentTitle:");ElementtitleElement=source.getFirstElement(HTMLElementName.TITLE);System.out.println(titleElement!=null?titleElement.getContent().toString():"(none)");System.out.println("\nSource.getEncoding():");System.out.println(source.getEncoding());System.out.println("\nSource.getEncodingSpecificationInfo():");System.out.println(source.getEncodingSpecificationInfo());System.out.println("\nSource.getPreliminaryEncodingInfo():");System.out.println(source.getPreliminaryEncodingInfo());}}
查看全文
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论