java 数据挖掘,算法 环境搭建及工具包推荐

1
 当前主要做 一些地址分词,商品描述信息提取,销量预测等,还包含一些外部数据获取(天气等),以后还会有一些算法,数据挖掘的东西要做。主要用java + plsql实现,现在考虑搭建环境,java部分环境怎么搭建呢?用一些什么框架,工具包会比较好呢?大神们多多指教啊
已邀请:
1

SmartMining - 数据挖掘、商业智能、大数据从业者:相关产品设计、项目管理、咨询、培训 2015-12-06 回答

给您两种选择方案,一个是开源的,使用hadoop的框架,借助其mapreduce分布式计算框架进行分布式挖掘,它都是基于java实现的,可以解决TB级以上的数据量。hadoop的安装方法见附件!
另外一个,采用商业的基于JAVA开发的数据挖掘软件SmartMining,它有分布式的大数据挖掘版本(比hadoop更快),也有单机的桌面版。您需要的各种算法,它基本都具备,无需编程,菜单式操作,同时还支持您基于java自定义算法,安装后自带的有案例。
下载地址:http://pan.baidu.com/s/1dEnHzJ7
学习视频:http://wiki.smartbi.com.cn/pages/viewpage.action?pageId=17958393
学习文档及示例教程:http://wiki.smartbi.com.cn/pages/viewpage.action?pageId=17958341
 

要回复问题请先登录注册