×

那些被低估的Python库

分类:互联网热点 编辑:小新 浏览量:2
2020-07-13 16:55:23

在这篇文章中,我们想展示一些不同于流行的东西。这些都是深夜浏览GitHub的感悟,以及同事们分享的压箱底东西。这些软件包中的一些是非常独特的,使用起来很有趣的Python包。

混合派

    Knock Knock:从Python发送通知到移动设备、桌面或电子邮件。 tqdm:可扩展的Python和CLI进度条,内置对pandas的支持。 Colorama:简单的跨平台彩色终端文本。 pandas -log:提供熊猫基本操作的反馈。非常适合调试长管道链。 Pandas-flavor:扩展pandas DataFrame/Series的简单方法。 More-Itertools:增加了类似于itertools的额外功能。 streamlit:为机器学习项目创建应用程序的简单方法。

数据清理和操作

    ftfy:修复mojibake和Unicode文本中的其他故障。 janitor:有很多很酷的功能来清理数据。 Optimus:另一个数据清理包。 Great-experctations:一个检查数据是否符合预期的好工具。

数据探索和建模

    Pandas-profile:创建一个包含来自pandas DataFrame的统计数据的HTML报告。 dabl:允许使用可视化和预处理进行数据探索。 pydqc:允许比较两个数据集之间的统计数据。 pandas-summary:对panda DataFrames描述功能的扩展。 pivottable-js:pands在jupyter notebook的拖放功能。

数据结构

    Bounter:有效的计数器,使用有限(有界)的数量的内存,无论数据大小。 Python -bloomfilter:可扩展的Bloom Filter,使用Python实现。 datasketch:提供概率数据结构,如LSH、加权MinHash、HyperLogLog等。 ranges:Python的连续范围、范围集和范围令数据结构

性能检查和优化

    Py-spy:Python程序的采样分析器。 pyperf:用于运行Python基准测试的工具箱。 snakeviz:一个浏览器内的Python配置文件查看器,对jupyter notebook有很大的支持。 Cachier:Python函数的持久、无延迟、本地和跨机缓存。 Faiss:用于高效的相似性搜索和密集向量聚类的库。

原文:

https://towardsdatascience.com/the-most-underrated-python-packages-e22bf6049b5e?gi=f9ed1a098270

【责任编辑:赵宁宁 TEL:(010)68476606】

声明:免责声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,也不承认相关法律责任。如果您发现本社区中有涉嫌抄袭的内容,请发

送邮件至:operations@xinnet.com进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。本站原创内容未经允许不得转载,或转载时

需注明出处:新网idc知识百科

免费咨询获取折扣

Loading