HTML解析器

Harser 是一个简单的 Python HTML 解析器。 安装:pip install harser 示例代码: >>> from harser import Harser >>>...
350PythonHTML解析器
JsoupXpath 是一款纯Java开发的使用xpath解析提取html数据的解析器,针对html解析完整实现了W3C XPATH 1.0标准语法,xpath的Lexer和Parser基于An...
320JavaHTML解析器
EscapeHTML 是一个简单的 Swift 库用来对 HTML 中的特殊字符进行转义。 示例代码: import EscapeHTML escape("<p>some html</p>")
380SwiftHTML解析器
htmlcxx 是一个 C++ 的 HTML 解析器和 CSS1 的解析器。The parsing politics attempt to mimic the behavior of Mozil...
500C/C++HTML解析器
NSoup是JSoup的Net移植版本。使用方法基本一致。 特性: jQuery 风格的 CSS 选择器 对不信任的源的 HTML 进行清理 操作 HTML 文档. 示例代码: NSoup.No...
150C#HTML解析器
SgmlReader 是一个敏捷的 C# .NET 库,通过 XmlReader API 解析 HTML 和 SGML 文件。同时提供一个命令行工具可以对这些内容进行格式化输出到 XML 结果。...
320C#HTML解析器
Aaron Patterson和Mike Dalessio开发了一个新的Ruby解析HTML/XML的ruby库 - Nokogiri。他的速度比目前应用的最广泛的Hpricot还要快许多。经过...
420JavaHTML解析器
Goutte 是一个抓取网站数据的 PHP 库。它提供了一个优雅的 API,这使得从远程页面上选择特定元素变得简单。 示例代码: require_once '/path/to/goutte....
350PHPHTML解析器
XSS HTMLFilter开源项目
XSS HTMLFilter这是一个采用Java实现的开源类库。用于分析用户提交的输入,消除潜在的跨站点脚本攻击(XSS),恶意的HTML,或简单的HTML格式错误。 示例代码: // retr...
380JavaHTML解析器
scrape.py 是一个 Python 模块用来从网页上提取内容的工具,可用它轻松实现页面抓取、链接点击、表单提交等操作,自动支持 Cookie、重定向和 SSL。 scrape.py 并不解...
450PythonHTML解析器
PyH 是一个用来生成HTML页面的Python模块,使用面向对象的方式,HTML的标签都会对应一个Python的对象,输出的HTML文档排版良好,易于阅读。 示例代码: from pyh im...
400PythonHTML解析器
Context Parser 是一款功能强劲的 HTML5 内容解析器,它能解析 HTML5 Web 页面。浏览器通常用 JavaScript 和 CSS 引擎来构建页面的动态组件。为了决定应该...
330JavaScriptHTML解析器
Oga 是一个 Ruby 的 XML/HTML 解析器。 示例代码1: require 'oga' require 'net/http' body     = Net::HTTP.get(UR...
470RubyHTML解析器
jsdom 是 WHATWG DOM 和 HTML 标准的 JavaScript 实现,主要用于 io.js 框架。 示例代码: // Count all of the links from t...
380JavaScriptHTML解析器
JoyHTML的目的是解析HTML文本当中的链接和正文,利用超链接密度法为主要判断依据的标记窗算法,采用DOM树解析模式。
380JavaHTML解析器
基于 node.js 开发的 xhtml 字符串解析引擎。 本项目是一个处理 HTML 模板的引擎,你可以用类似 jQuery 的方式去操作一段字符串模板,比如 Vue-loader 根据 te...
360JavaScriptHTML解析器
HTML Purifier开源项目
HTML Purifier是一个可以用来移除所有恶意代码(XSS),而且还能确保你的页面遵循W3C的标准规范的PHP类库。
410PHPHTML解析器
XIST 是一个可扩展的 HTML 和 XML 生成器,同时包含一个 XML 解析器,使用很简单的 Python 树 API,每个 XML 元素类型都被映射到 Python 的类中。你可以把 X...
400PythonHTML解析器
HtmlCompressor 是一个 Java 类库,用来对 HTML 内容进行压缩。HtmlCompressor 会删除 HTML 中无用的空格、空行、注释等内容。 该项目还提供了 Maven...
300JavaHTML解析器
woody 是一款基于 Java 的 HTML 解析/提取器,用法非常类似 webmagic,是对其抽取模块的完全重写。 功能: 多种结果数据类型(String, char, byte, sho...
230JavaHTML解析器
当前共54个项目
×
寻找源码
源码描述
联系方式
提交