Chardet 通用字符编码检测器开源项目

我要开发同款
匿名用户2017年03月03日
190阅读

技术信息

开源地址
https://github.com/chardet/chardet
授权协议
LGPL

作品详情

Chardet是一款通用字符编码检测器。

支持

ASCII、UTF-8、UTF-16(2种变体)、UTF-32(4种变体)

Big5、GB2312、EUC-TW、HZ-GB-2312、ISO-2022-CN(繁体中文和简体中文)

EUC-JP、SHIFT_JIS、CP932、ISO-2022-JP(日语)

EUC-KR、ISO-2022-KR(韩语)

KOI8-R、MacCyrillic、IBM855、IBM866、ISO-8859-5、widows-1251(斯拉夫语)

ISO-8859-5、widows-1251(保加利亚文)

ISO-8859-1、widows-1252(西欧语言)

ISO-8859-7、widows-1253(希腊语)

ISO-8859-8、widows-1255(希伯来语)

TIS-620(泰语)

注意:ISO-8859-2和widows-1250(Hugaria) 检测器模型有待重新训练,暂时还不可用。

要求Pytho2.6及以上版本

安装

PyPI :

pip istall chardet

功能介绍

Chardet 是一款通用字符编码检测器。 支持 ASCII、UTF-8、UTF-16(2种变体)、UTF-32(4种变体) Big5、GB2312、EUC-TW、HZ-GB-2312、ISO-...

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论