机器学习开源项目,2019年20个最佳Python人工智能

时间:2019-12-26 03:00来源:金沙澳门官网
Github U奥迪Q5L:Pylearn2NuPIC是三个基于新四肢理论的开源项目,称为分层时间回忆。HTM理论的一片段已经在采用中得到实行,测量试验和使用,HTM理论的任何一些仍在开辟中。 参照他事他

Github U奥迪Q5L: Pylearn2NuPIC是三个基于新四肢理论的开源项目,称为分层时间回忆。 HTM理论的一片段已经在采用中得到实行,测量试验和使用,HTM理论的任何一些仍在开辟中。

参照他事他说加以考查资料

  • 讨论qq群630011153 144081101
  • 正文最新版本地址
  • 本文涉及的python测验开拓库 谢谢打call!
  • 本文相关海量书籍下载
  • 2018特级人工智能机器学习工具书及下载
  • TensorFlow最先是由商讨职员和程序员在谷歌机器智能切磋组织的谷歌Brain团队中支出的。 该系统意在推进机器学习的讨论,并使其从研讨原型到临蓐类别的飞跃和自在过渡。

Github URL: Tensorflow

图片 1图片.png

  • Scikit-learn是用于数据开采和数据剖析的轻松而有效的工具,可供全数人访问,并可在各类条件中收音和录音,基于NumPy,SciPy和matplotlib,开源,商业可用 - BSD执照。

Github URL: Scikit-learn

图片 2图片.png

  • Keras:高端神经网络API,用Python编写,能够在TensorFlow,CNTK或Theano之上运营。

Github URL: Keras

  • PyTorch张量和动态神经互连网,具备强有力的GPU增加速度功效。

Github URL: pytorch

  • Theano允许你有效地定义,优化和评估涉及多维阵列的数学表明式。

Github URL: Theano

  • Gensim 具有可增添的总括语义,分析语义构造的纯文本文书档案,检索语义相像的文书档案等功能。

Github URL: Gensim

-Caffe以公布,速度和模块化为底工的纵深学习框架。 它由Berkeley视觉和学习为主和社区进献者开垦。

Github URL: Caffe

  • Chainer:基于Python的单独开源框架,适用于深度学习模型。 Chainer提供灵活,直观和高品质的格局来贯彻全部的纵深学习模型,饱含新型的模型,如递归神经网络和变分自动编码器。

Github URL: Chainer

  • Statsmodels: 允许客商浏览数据,测度统计模型和进行总结测量试验。 描述性总结,统计测试,绘图函数和结果计算的科学普及列表可用来差异品类的数额和各样揣测器。

Github URL: Statsmodels

  • Shogun是机械学习工具箱,提供各个统大器晚成和高速的机器学习方式。 工具箱无缝地同意轻易组合四个数据表示,算法类和通用工具。

    Github URL: Shogun

  • Pylearn2机器学习库。 它的繁多意义都创建在Theano之上。 那表示你能够动用数学表达式编写Pylearn2插件,Theano将为您优化和国家长期安定那些表达式,并将它们编写翻译为您接受的后端。

Github URL: Pylearn2

  • NuPIC是一个依照新四肢理论的开源项目,称为分层时间记念。 HTM理论的大器晚成有些已经在使用中收获实施,测量检验和应用,HTM理论的任何一些仍在支付中。

Github URL: NuPIC

  • Nilearn:基于Python的深浅学习库。 它提供易用性,同期提供最高质量。

Github URL: Nilearn

  • Orange3:Python工具箱实行多变量计算,并利用预测建立模型,分类,解码或一而再解析等应用程序。

Github URL: Orange3

  • Pymc: 达成贝叶斯总计模型和拟合算法,包蕴马尔可夫链蒙特卡罗。 其灵活性和可增添性使其适用于多量难点。

Github URL: Pymc

-Deap: 生机勃勃种新型的前进总括框架,用于火速原型设计和思辨测验。 它旨在使算法显然,数据构造透明。 它与多处理和S董事长P等互相机制完善和睦。

Github URL: Deap

  • Annoy (Approximate Nearest Neighbors Oh Yeah卡塔尔国是多个包括Python绑定的C ++库,用于搜索空间中附近给定查询点的点。 它还创设了特大型只读基于文件的数据构造,这么些数据布局映射到内部存款和储蓄器中,以便好些个进度能够分享肖似的数额。

Github URL: Annoy

  • PyBrain是一个用于Python的模块化学工业机械器学习库。 其目的是为机械学习任务和各个预约义碰到提供灵活,易用且功效强盛的算法,以测量试验和比较你的算法。

Github URL: PyBrain

  • Fuel是一个数目管道框架,可为您的机器学习模型提供所需的数额。 它安顿由 Blocks和Pylearn2神经互联网库使用。

Github URL: Fuel

6、Pylearn2 是二个机械学习库。 它的大部效应是确立在Theano的底工之上。 那意味你能够选择数学表明式编写Pylearn2插件,Theano将为你优化和平静那个表明式,并将其编写翻译为您接受的后端。Commits: 7100, Contributors: 115, Github UTiggoL: Pylearn2

提交数: : 943, Contributors: 20 , Github 链接: Pattern(http://github.com/clips/pattern)

Github URL: Scikit-learn

图片 3图片.png

15、PyBrain is 一个用来Python的模块化学工业机械器学习库。 它的靶子是为机械学习任务提供灵活,易于使用但还是强大的算法,以致各个预约义情状,以测量试验和相比较你的算法。Commits: 984, Contributors: 31, Github UTiguanL: PyBrain

  1. Shogun 是二个机械学习工具箱,它提供了过多合併高效的机器学习方法。那一个工具箱允多数个数据表明,算法类和通用工具无缝结合。

Github URL: Gensim

1、Scikit-learn 用于数据开掘和数码剖析的归纳而有效的工具,基于NumPy,SciPy和matplotlib,开源,商业可用的BSD许可证。Commits: 21486, Contributors: 736, Github地址: Scikit-learn

KDnuggets 为您带给 Github 上风行的 Python 机器学习开源项近期 20 名。奇怪的是,二零一八年有的特别活跃的项目渐渐停滞了,由此未能上榜,而 十一个新类型冲进了当年的 top 20(参谋进献 contributions 和付出数 commits)。

-Caffe以表达,速度和模块化为底蕴的纵深学习框架。 它由Berkeley视觉和上学为主和社区奉献者开垦。

8、Shogun是机械学习工具箱,提供普遍的会集和急速的机器学习方式。 工具箱无缝地同意轻便地组成七个数据表示,算法类和通用工具。Commits: 15172 Contributors: 105, Github UTucsonL: Shogun

提交数: 10466, 贡献者: 493, Github 链接: Tensorflow(https://github.com/tensorflow/tensorflow)

上述github地址如无法访谈,能够访谈python测量试验开采库汇总: 或 本文首发地址

10、NuPIC 是借助称为分层时间存款和储蓄器的新四肢理论的开源项目。 HTM理论的生龙活虎局地已经在利用中得以实现,测验和接受,况兼HTM理论的其余部分仍在开辟中。Commits: 6088, Contributors: 76, Github U本田UR-VL: NuPIC

提交数: 6088, 贡献者: 76, Github 链接: NuPIC(http://github.com/numenta/nupic)

-Deap: 风流倜傥种风尚的向上总计框架,用于快捷原型设计和思索测验。 它意在使算法明显,数据布局透明。 它与多管理和S首席实施官P等相互机制完备和睦。

18、Annoy (Approximate Nearest Neighbors Oh Yeah卡塔尔(قطر‎是一个C ++库,使用Python绑定来搜索周围给定查询点的空间中的点。 它还创办大型只读的依附文件的数据构造,那个数据布局被映射到内部存款和储蓄器中,以便好多历程能够共享相仿的数目。Commits: 365, Contributors: 24, Github UENCOREL: Annoy

提交数: 2701, 贡献者: 37, Github 链接: Pymc(https://github.com/pymc-devs/pymc)

Github URL: Shogun

12、Nilearn 二个Python模块,用于在NeuroImaging数据上高速轻便地扩充计算学习。 它接受scikit-learn Python工具箱来拍卖多变量计算音信,包含预测建模,分类,解码或接二连三分析。Commits: 5254, Contributors: 46, Github UENVISIONL: Nilearn

  1. Scikit-learn 是四个粗略且高效的多少开掘和数目深入分析工具,易上手,能够在两个上下文中重复使用。它依照NumPy, SciPy 和 matplotlib,开源,可商用(基于 BSD 许可)

Github URL: Fuel

4、Caffe is六当中肯学习的框架,速度快和模块化。 它由Berkeley视觉和上学为主和社区进献者开采。Commits: 3801, Contributors: 215, Github U翼虎L: Caffe

  1. Theano 允许高效地定义、优化以致评估涉及多维数组的数学表达式. 提交数: 24108, 贡献者: 263, Github 链接: Theano(https://github.com/Theano/Theano)

  2. Caffe 是多个基于表明式,速度和模块化原则创立的深浅学习框架。它由Berkeley视觉学习中央(BVLC, Beck雷 Vision and Learning Center)和社区进献者协同开辟。 提交数: 3801, 进献者: 215, Github 链接: Caffe(https://github.com/BVLC/caffe)

  3. Gensim 是一个无需付费的 Python 库,它包罗可扩展的总结语义,深入分析纯文本文档的语义构造,以至查找相通语义的文书档案等职能。

TensorFlow最早是由研讨人士和程序猿在Google机器智能研讨团体的GoogleBrain团队中开垦的。 该种类目的在于带动机器学习的钻研,并使其从商讨原型到分娩类其余迅速和自由自在过渡。

5、Gensim is 三个无偿的Python库,具备比方说可扩充的总括语义之类的特征,深入分析用于语义构造的纯文本文书档案,从语义上检索相似的文书档案。Commits: 2702, Contributors: 145, Github U景逸SUVL: Gensim

  1. Chainer 是一个基于 Python 的独门的深浅学习模型开源框架。Chainer 提供了灵活、直观且高品质的秘籍达成风度翩翩体的深度学习模型,包涵循环神经网络(recurrent neural networks卡塔尔国 和变分自编码器(variational autoencoders卡塔尔国这么些新颖的模型 。

Github UEvoqueL: CaffeChainer:基于Python的独门开源框架,适用于深度学习模型。 Chainer提供灵活,直观和高品质的主意来兑现全部的深浅学习模型,包蕴新型的模子,如递归神经网络和变分自动编码器。

17、PyMVPA 是三个Python包,意在简化大型数据集的计算学习解析。 它提供了多个可增加的框架,具备用于分类,回归,特征选拔,数据导入和导出的宽泛算法的高级接口。Commits: 9258, Contributors: 26, Github U奇骏L: PyMVPA

提交数: 984, 贡献者: 31, Github 链接: PyBrain(http://github.com/pybrain/pybrain)

图片 4

7、Statsmodels 是三个Python模块,允许客商探究数据,估量计算模型和施行计算测量试验。 描述性总计,总计测量检验,绘图函数和结果总计的详实列表可用来区别档次的数量和每一种测度器。Commits: 8664, Contributors: 108, Github U奥迪PB18L: Statsmodels

  1. Annoy (Approximate Nearest Neighbors Oh Yeah卡塔尔(英语:State of Qatar) 是多少个包括 Python 绑定的 C++ 库,用于在空中中找到和已知的查询点接近的点。它还足以成立大型的基于文件的只读数据构造,并映射至内部存款和储蓄器,以便四个经过能一齐使用相近的多少。

Github URL: Statsmodels

2、Tensorflow 最先由谷歌机器智能研讨机关的谷歌(Google卡塔尔(قطر‎Brain小组的钻研职员和程序员开采。 该种类目的在于推进机器学习的钻探,并使其飞速和易于地从钻探原型过渡到临蓐种类。Commits: 10466, Contributors: 493, Github地址: Tensorflow

  1. Pymc 是三个Python 模块,它能落实贝叶斯计算模型和拟合算法,包涵Marco夫链蒙特卡罗(马克ov chain Monte Carlo)算法。它特别灵活,具有可扩大性,适用于管理一应有尽有科学普及难点。

图片.pngKeras:高等神经互连网API,用Python编写,能够在TensorFlow,CNTK或Theano之上运转。

13、Orange3是开源机器学习和数码可视化的生手和行家。 具备大型工具箱的人机联作式数据解析专业流程。Commits: 6356, Contributors: 40, Github U劲客L: Orange3

提交数: 7100, 贡献者: 115, Github 链接: Pylearn2(http://github.com/lisa-lab/pylearn2)

Github URL: Tensorflow

CTOLib.com编译:

提交数: 875, 贡献者: 47, Github 链接: Neon(https://github.com/NervanaSystems/neon)

Github U途胜L: pytorchTheano允许你有效地定义,优化和评估涉及多维阵列的数学表明式。

14、Pymc 三个得以完毕贝叶斯计算模型和拟合算法的python模块,包涵马尔可夫链蒙特卡罗。 其灵活性和可扩大性使其适用于大批量标题。Commits: 2701, Contributors: 37, Github UCRUISERL: Pymc

提交数: 5254, 贡献者: 46, Github 链接: Nilearn(http://github.com/nilearn/nilearn)

Shogun是机器学习工具箱,提供各类统豆蔻梢头和飞跃的机械学习格局。 工具箱无缝地允许轻巧组合三个数据表示,算法类和通用工具。

9、Chainer 多个用于深度学习模型的依赖Python的单独开源框架。 Chainer提供灵活,直观和高质量的措施来贯彻全范围的吃水学习模型,满含最初进的模型,如复现神经网络和变分自动编码器。Commits: 6298, Contributors: 84, Github UEnclaveL: Chainer

提交数: 9258, 贡献者: 26, Github 链接: PyMVPA(https://github.com/PyMVPA/PyMVPA)

Github UWranglerL: NilearnOrange3:Python工具箱举办多变量总计,并运用预测建立模型,分类,解码或三番两次分析等应用程序。

图片 5

提交数: 2702, 贡献者: 145, Github 链接: Gensim(https://github.com/RaRe-Technologies/gensim)

Github U帕杰罗L: PyBrainFuel是贰个数额管道框架,可为您的机器学习模型提供所需的数量。 它陈设由 Blocks和Pylearn2神经网络库使用。

20、Pattern 是Python编制程序语言的Web发掘模块。 它包扎了多少开采工具,自然语言管理,机器学习 ,k-means聚类,朴素贝叶斯+ k-NN + SVM分类器)和互联网解析。Commits: 943, Contributors: 20 , Github U凯雷德L: Pattern

提交数: 365, Contributors: 24, Github 链接: Annoy(https://github.com/spotify/annoy)

图片.png

19、Deap 一个用来快捷原型和测量检验观念的新颖发展总括框架。 它希图使算法显式和数据布局透明。 它与互为机制全面和煦。Commits: 1854, Contributors: 21, Github UCRUISERL: Deap

在可比同期上榜 二零一四 和 贰零壹陆 Top 20 的体系时,能够窥见,Pattern,PyBrain 和 Pylearn2 没有新的贡献者(contributors)也一向不新的孝敬代码。同偶然候,还足以窥见进献者数和提交数之间有简单的讲关联。进献者数的狠抓大概会招致提交数的升高,作者认为这是开源项目和社区的魅力——引带头脑风暴,激发更加的多创新意识,开拓更加好的软件工具。

Github USportageL: NuPICNilearn:基于Python的深浅学习库。 它提供易用性,同一时候提供最高品质。

16、Fuel 是二个数码管道框架,为你的机器学习模型提供他们供给的多少。 它安排被Blocks 和Pylearn2神经互联网库使用。Commits: 1053, Contributors: 29, Github U福睿斯L: Fuel

提交数: 1053, 贡献者: 29, Github 链接: Fuel(http://github.com/mila-udem/fuel)

是用来数据发现和数量深入分析的简约而卓有效率的工具,可供全数人访问,并可在各个碰着中收录,基于NumPy,SciPy和matplotlib,开源,商业可用

11、Neon是Nervana的依据Python的深度学习库。 它提供易用性,同期提供最高的性能。Commits: 875, Contributors: 47, Github U牧马人L: Neon

在底下的图样中,能够观望 PyMVPA 相较于此外种类全体最高的进献率(contribution rate)。令人吃惊的是,Scikit-learn 就算具备最多的进献者,可是进献率却超低。这种情景背后的由来也许是:PyMVPA 是新品类,正处在开辟的开始的一段时期阶段,新职能开荒,漏洞修补和重构等都能够指点更加多的提交。而 Scikit-learn 归属比较旧且十三分平静的类别,改良和修补的空间越来越小。

Github UEnclaveL: KerasPyTorch张量和动态神经网络,具有强有力的GPU加快效率。

二零一六年十大Python机器学习开源项目

  1. Orange3 是贰个何况适用于新手和数量大家的机械学习和数目可视化开源软件,帮衬具备大型工具箱的交互式数据深入分析职业流程。

Github URL: Pymc

3、Theano 允许你有效地定义,优化和评估涉及多维数组的数学表明式。Commits: 24108, Contributors: 263, Github UHighlanderL: Theano

今后开源是翻新的主导,拉动着技能的长足改善。本文仲为您介绍 二零一四年机械学习 Top 20 Python 开源项目,同一时候深入分析得出有些相映成趣的意见和发展趋势。

Github U凯雷德L: TheanoGensim 具备可扩充的总计语义,剖判语义构造的纯文本文书档案,检索语义相仿的文书档案等效能。

开源万岁!分享万

Github UTiguanL: ChainerStatsmodels: 允许顾客浏览数据,预计总计模型和实践计算测量试验。 描述性总计,总计测量试验,绘图函数和结果总结的宽泛列表可用以不一致类别的数量和每一个估量器。

  1. Deap 是二个翻新的,仍在上扬中的总计框架,用于神速营造原型和测量试验方法。它目的在于使算法和数据架构尤其清晰透明。它与相互机制(如多进度和 S老董P 模块)完美和煦。

Pylearn2机器学习库。 它的大多数效应都营造在Theano之上。 那代表你能够应用数学表明式编写Pylearn2插件,Theano将为你优化和平安这几个表明式,并将它们编译为您采取的后端。

提交数: 15172 贡献者: 105, Github 链接: Shogun(https://github.com/shogun-toolbox/shogun)

Github UEnclaveL: Orange3Pymc: 达成贝叶斯计算模型和拟合算法,满含马尔可夫链蒙特卡罗。 其灵活性和可扩展性使其适用于多量难题。

提交数: 6298, 贡献者: 84, Github 链接: Chainer(https://github.com/pfnet/chainer)

图片 6

提交数: 21486, 贡献者: 736, Github 链接: Scikit-learn(http://github.com/scikit-learn/scikit-learn0

图片 7

  1. PyBrain 是八个模块化的 Python 机器学习库。它致力于为机械学习职分提供灵活易上手但功用强盛的算法,和一文山会海用于测量试验和比较算法的预约义景况。
  • BSD许可证。
  1. Fuel 是多少个数据管道框架(data pipeline framework),它为机械学习模型提供所需的数额。Blocks 和 Pylearn2 那四个神经网络库都有布置使用 Fuel。

Scikit-learn

  1. Statsmodels 是贰个 Python 模块,可以用来斟酌数据,估摸总括模型,实行总括测验。对于分裂类型的多少和模型预计,都有描述性总括,总结测量检验,绘图功用和结果总括的详细列表可用。

Github ULANDL: DeapAnnoy (Approximate Nearest Neighbors Oh Yeah卡塔尔(英语:State of Qatar)是二个带有Python绑定的C ++库,用于找出空间中有如给定查询点的点。 它还成立了大型只读基于文件的数据构造,这一个数据布局映射到内部存款和储蓄器中,以便大多种经营过可以分享相像的数目。

  1. Tensorflow 最先由谷歌(Google卡塔尔(英语:State of Qatar)机器智能实验商讨公司中的谷歌(Google卡塔尔(قطر‎大脑组织(谷歌(Google卡塔尔(قطر‎ Brain Team)的研商人口和技术员开垦。该系统规划的初志是为了有协理机器学习钻探,能够越来越快越来越好地将应用斟酌原型转变为生育类型。

Github U昂科雷L: AnnoyPyBrain是七个用于Python的模块化学工业机械器学习库。 其指标是为机械学习职分和各类预约义情形提供灵活,易用且成效强大的算法,以测量检验和相比你的算法。

  1. NuPIC 是二个依据 HTM 算法 (Hierarchical Temporal Memory卡塔尔(قطر‎的开源项目。HTM 的黄金时代部分已经经过施行、测量试验和运用,另风流倜傥有的仍在开采之中。

如上是对 二〇一六 Python 机器学习开源项目所做的拆解剖判,该分析基于项目进献者和提交数,小编是 KDnuggets 团队的 Prasad 和 Gregory。

提交数: 6356, 贡献者: 40, Github 链接: Orange3(https://github.com/biolab/orange3)

二零一五 Top 20 Python 机器学习开源项目

  1. Nilearn 是多少个 Python 模块,用于在神经成像 (NeuroImaging卡塔尔国数据上海展览中心开飞快轻巧的总括学习。它选取 scikit-learn Python 工具箱来拍卖多变量总计音讯,饱含预测建立模型,分类,解码或三回九转深入分析.

提交数: 8664, 贡献者: 108, Github 链接: Statsmodels(https://github.com/statsmodels/statsmodels/)

17.PyMVPA 是三个 Python 包,意在简化大型数据集的计算学习解析。它提供了三个可扩张的框架和一个用于分类,回归,特征选取,数据导入导出等算法的高级级接口。

  1. Pattern 是二个 Python 的网络发掘模块。它绑定了数量发现(Google + 推特(TWTR.US卡塔尔(英语:State of Qatar) + Wikipedia API, 网络爬虫, HTML DOM 分析器卡塔尔,自然语言处理(词性标识, n-gram 搜索, 语义解析, WordNet卡塔尔国,机器学习(向量空间模型, k-means 聚类, Naive Bayes + k-NN + SVM 分类器卡塔尔 和互联网深入分析(图宗旨性 graph centrality 和可视化卡塔尔(英语:State of Qatar)等工具。

提交数: 1854, 贡献者: 21, Github 链接: Deap(https://github.com/deap/deap)

  1. Neon 是 Nervana 集团多个基于 Python 的纵深学习库。它轻易使用且具有非常高的性质。
  1. Pylearn2 是二个机械学习库。它的抢先49%效果都以营造于Theano 之上的。那象征你能够选择数学表达式自个儿写 Pylearn2 插件(新模型,算法等等),Theano 会为您优化那么些表明式使其尤其平稳,你还是能够选拔将其编译到后端(CPU 或 GPU)。

编辑:金沙澳门官网 本文来源:机器学习开源项目,2019年20个最佳Python人工智能

关键词: