Java 机器学习库分享
Java在许多项目开发中仍然发挥着无可替代的作用,目前很多流行的机器学习框架也都是由java编写出来的。今天南京java培训学码思教育的老师就来为大家分享三个行业内优秀的java机器学习库,希望对于java从业者能有所参考。
一、Weka
毫无疑问,Weka 是目前首选的 Java 机器学习库。
它由新西兰怀卡托大学(University of Waikato)的机器学习项目组研发。其命名来源于一种新西兰特有的不会飞的鸟——新西兰秧鸡,新西兰秧鸡的英文名称就是 Weka。按照官网描述,Weka 吸收了许多目前常用的机器学习算法,并且完全基于 Java 环境,开源,直接,具有易于使用的图形界面,适合于数据挖掘,数据分析和预测建模等多种应用场景。
Weka 非常大的优势在于分类,因此需要自动数据分类的应用程序可以从中获益。但同时它也支持数据预处理、聚类、关联规则挖掘、时间序列预测、特征选择、和异常检测等场景。
开发者可以直接通过 Weka 软件处理目标数据集,同时也支持用户在自己编写的代码中调用,将 Weka 视为一个灵活的组件。更贴心的是,怀卡托大学还提供了许多直接的基于 Weka 的数据挖掘和机器学习视频教程,感兴趣的朋友可以在 Weka 官网点击查看。
二、MOA
和 Weka 一脉相承,MOA 的命名也是来源于一种新西兰特有的无翼大鸟——新西兰恐鸟(目前已灭绝)。MOA 也是基于 Java 环境,开源,直接,在面对复杂问题时,MOA 还能和 Weka 协同工作。
MOA 在运算效率和内存占用方面都做了特殊优化,通过提供易于扩展的底层结构、可复用的数据流分析设置以及一系列内部实现好机器学习算法,MOA 为实时数据流分析提供了一个非常优秀的基准框架,因此在实时数据流挖掘领域的应用非常广泛。其内部实现的机器学习算法包括:分类、回归、聚类、孤立点检测、概念漂移检测和推荐系统等。此外,MOA 还提供了多种评估工具,以及活跃的社区讨论、博客等配套资源。
三、Deep Learning For Java
Deeplearning4J(Deep Learning For Java)是 Java 和 Scala 环境下的一个开源分布式的深度学习项目,由总部位于美国旧金山的商业智能和企业软件公司 Skymind 牵头开发,并得到了腾讯的投资。正如它的命名,Deeplearning4J 的运行需要 Java 虚拟机 JVM 的支持。
去年,JAXenter 社区曾提名 Deeplearning4J 作为 Java 生态系统非常具创新的贡献者之一。
Deeplearning4J 旨在为工作在 Hadoop 框架下的 Java、Scala 和 CloJure 程序员提供一个可以灵活 DIY 的机器学习工具。团队在官网表示,他们希望通过一些机器学习算法的开发,将商业带入智能化数据的时代。也正是为了实现这一理想,惠及更多的用户,因此选择了移植性更好的 Java 环境来实现这些算法。目前,Deeplearning4J 在模式识别、时间序列检测和基于语音、文本的情感识别方面应用广泛,包括谷歌、Facebook和微软等巨头公司都是它的用户。
当然上述只是三个推荐,还有一些特别优秀的Java 机器学习库,比如MALLET、ELKI等,感兴趣的同学也可以咨询我们的老师,详细了解一番。南京学码思java培训学校为了让跟多java爱好者感受学习的乐趣,会不定期在网站上分享一些java教程,相信对于大家更好地了解java是个不错的平台。