看看人家那文本识别系统,那叫一个优雅!

正文

今天,推荐一个文本识别系统项目。第一次使用就有点上头,爱不释手,必须要推荐给大家。

上次是谁要的文本识别系统项目啊,帮你找到了。

这是我目前见过最好的文本识别系统项目。功能完整,代码结构清晰。值得推荐。

项目介绍

说到文本识别大家已经非常熟悉了,这一技术早就深深融入我们生活的方方面面,今天,要和大家分享一个可以识别文本背后含义的工具——pyWhat。

图片

当你不知道特定一串文本代表什么时,它能快速判断它是否是 email、油管视频编号、手机号 或者是其他信息格式。你给它一个 .pcap 文件或者一段文本,它能告诉你这个文件或是文本代表了什么。

图片

目前,pyWhat已经在Github上标星3.9K,累计分支 127 个。

点击下方公众号Java精选回复文本识别即可获取项目源码

图片  



图片

同搜索不同,pyWhat 会自动进行文本分断,例如 5f4dcc3b5aa765d61d8327deb882cf99 如果没有完全匹配的信息格式,pyWhat 会切断文本进行多个不同字符串长度的完全匹配。

示例

图片

比如当你遇到了一个名为 WantToCry的新恶意软件,你回想起 Wannacry 并记得它被停止是因为研究人员在代码中发现了一个终止开关。

当一个硬编码到 Wannacry 的域被注册时,病毒就会停止。你可以通过这个工具识别恶意软件中的所有域,并使用域注册器 API 来注册所有域。如果 Wannacry 再次发生,你就可以在几分钟内阻止它,而不是几周。

更快地分析Pcap文件

图片

假设你有一个.pcap来自网络攻击的文件。What可以识别并快速找到以下内容:

1)所有哈希

2)信用卡号码

3)加密货币地址

4)联系方式等

简而言之,只要你想要在一个文件中找出所有有用的结构化数据,pywhat都适合你。

~阅读全文-人机检测~

微信公众号“Java精选”(w_z90110),专注Java技术干货分享!让你从此路人变大神!回复关键词领取资料:如Mysql、Hadoop、Dubbo、Spring Boot等,免费领取视频教程、资料文档和项目源码。微信搜索小程序“Java精选面试题”,内涵3000+道Java面试题!

涵盖:互联网那些事、算法与数据结构、SpringMVC、Spring boot、Spring Cloud、ElasticSearch、Linux、Mysql、Oracle等

评论

分享:

支付宝

微信