RapidMiner9是一款专业的数据挖掘软件,软件内置了超过1500多种算法以及相关的函数库,能够帮助用户创建各种模型,通过与数据库无缝连接来帮助你分析各种数据以及报告,有需要的用户欢迎下载使用!
1、可视化工作流设计器
提高整个数据科学团队的工作效率,从分析师到专家
使用拖放可视界面加速预测模型的创建
丰富的1500多种机器学习算法和函数库,可为任何用例构建最佳模型
用于常见用例的预构建模板,包括客户流失,预测性维护,欺诈检测等等
Unique Wisdom of Crowds功能可在工作流程的每个步骤提供主动建议,包括参数填充
2、数据源
无论身在何处,都可以连接到您的所有数据
创建指向数据库,企业数据仓库,数据湖泊,云存储,业务应用程序和社交媒体的点击+单击连接
在任何上下文中重用连接,并轻松与需要访问权限的任何人共享
通过从Marketplace下载扩展来连接到新数据源
3、数据库内处理
直接在数据库中运行数据准备和ETL过程
无需编写复杂的SQL即可查询和检索数据
利用高度可扩展的数据库集群的强大功能
支持MySQL,PostgreSQL和Google BigQuery
4、探索和可视化数据
评估数据的健康状况,完整性和质量
通过散点图,直方图,折线图,平行坐标,箱形图等了解数据中的模式,趋势和分布
识别并修复常见的数据质量问题,包括缺失值和异常值
使用强大的统计概述和30多种交互式可视化来探索数据
5、数据准备和混合
消除为预测建模准备数据的麻烦
跨任意数量的源提取,加入,过滤和分组数据
创建可以调度和共享的可重复数据准备和ETL过程
跳转到Turbo Prep ,获得完全交互式点击+点击数据准备体验
6、机器学习
无需编写代码即可创建强大的机器学习模
从数百种有监督和无监督的机器学习算法中进行选择
实施各种ML技术,包括回归,聚类,时间序列,文本分析和深度学习
使用自动和手动功能工程来提高模型精度
与Auto Model集成, 使用自动化机器学习,通过5次点击创建模型
7、模型验证
在部署到生产之前了解模型的真实性能
通过独特的方法消除过度拟合,防止模型训练预处理数据泄漏到模型的应用程序中
只需单击鼠标即可将经过验证的技术(如交叉验证)添加到模型中
8、可解释的模型不是黑盒子
创建易于理解且易于理解的可视化数据科学工作流程
记录数据准备,建模和验证过程中的每个步骤,以实现完全透明
可视化工作流程很容易向组织中的其他人解释
支持本地可解释的模型 - 不可知解释(LIME)框架
9、灵活的评分和部署
将预测性见解转化为规范性行为
快速将评分数据部署到电子表格和数据可视化工具
使用Server将模型转换为生产Web服务
为要求苛刻的高事务/低延迟用例添加 实时评分
10、自动化与过程控制
构建复杂的可视化工作流程并自动完成重要任务
使用流程控制运算符创建重复和循环任务,分支流和访问系统资源的工作流
支持各种脚本语言,用于自定义集成和自动机
安排流程
11、开放和可扩展
与现有应用程序和代码集成
使用R和Python代码和库来扩展程序
通过灵活的扩展机制为软件添加新功能
开放核心在AGPL许可下可用
1、图形用户界面的互动交流原形
2、支持正确引导剖析
3、支持可再用搭建控制模块
4、有1500几台机器学习和数据预处理作用
5、易于集成R&Python脚本制作
6、有着靠谱的验证方式
7、可以浏览全部种类的数据信息
8、在全部流行服务平台和电脑操作系统上运作
9、云联接和储存库
10、支持人群聪慧
11、支持预测性剖析模型与认证
12、支持数据可视化实际操作自然环境
1、数据访问
以任何规模连接到任何数据源,任何格式。
2、数据探索
快速发现模式或数据质量问题
3、数据混合
为预测分析创建最佳数据集。
4、数据清理
专业清理高级算法的数据。
5、造型
快速有效地构建和交付更好的模型。
6、验证
自信而准确地估计模型性能。