• 大小: 174KB
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2021-05-28
  • 语言: 其他
  • 标签: 挖掘算  

资源简介

资源包含了大数据挖掘经典算法,譬如Apriori,KNN,神经网络算法等

资源截图

代码片段和文件信息

package apriori;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Set;
import java.util.TreeSet;
public class AprioriAlgorithm {
private int minSup;
 private static List data;
 private static List> dataSet;
 
 public static void main(String[] args) {
   
  long startTime = System.currentTimeMillis();
  AprioriAlgorithm apriori = new AprioriAlgorithm();
  
  //使用书中的测试集
  data = apriori.buildData();
  
  //设置最小支持度
  apriori.setMinSup(2);
  //构造数据集
  data = apriori.buildData();
  
  //构造频繁1项集
  List> f1Set = apriori.findF1Item(data);
  apriori.printSet(f1Set 1);
  List> result = f1Set;
  
  int i = 2;
  do{
   result = apriori.arioriGen(result);
   apriori.printSet(result i);
   i++;
  }while(result.size() != 0);
  long endTime = System.currentTimeMillis();
  System.out.println(“共用时: “ + (endTime - startTime) + “ms“);
 }
 public void setMinSup(int minSup){
  this.minSup = minSup;
 }
 
 /**
  * 构造原始数据集,可以为之提供参数,也可以不提供
  * 如果不提供参数,将按程序默认构造的数据集
  * 如果提供参数为文件名,则使用文件中的数据集
  */
 List buildData(String...fileName){
  List data = new ArrayList();
  if(fileName.length != 0){
   File file = new File(fileName[0]);
   try{
    BufferedReader reader = new BufferedReader(new FileReader(file));
    String line;
    while( ( line = reader.readLine()) != null ){
     data.add(line);
    }
   }catch (FileNotFoundException e){
    e.printStackTrace();
   }catch (IOException e){
    e.printStackTrace();
   }
  }else{
   data.add(“I1 I2 I5“);
   data.add(“I2 I4“);
   data.add(“I2 I3“);
   data.add(“I1 I2 T4“);
   data.add(“I1 I3“);
   data.add(“I2 I3“);
   data.add(“I1 I3“);
   data.add(“I1 I2 I3 I5“);
   data.add(“I1 I2 I3“);
  }
  
  dataSet = new ArrayList>();
  Set dSet;
  for(String d : data){
   dSet = new TreeSet();
   String[] dArr = d.split(“ “);
   for(String str : dArr){
    dSet.add(str);
   }
   dataSet.add(dSet);
  }
  return data;
 }
 
 /**
  * 找出候选1项集
  * @param data
  * @return result
  */
 List> findF1Item(List data){
  List> result = new ArrayList>();
  Map dc = new HashMap();
  for(String d : data){
   String[] items = d.split(“ “);
   for(String item : items){
    if(dc.containsKey(item)) {
     dc.put(item dc.get(item)+1);
    }else{
     dc.put(item 1);
    }
   }
  }
  Set itemKeys = dc.keySet();
  Set tempKeys = new TreeSet();
  for(String str : itemKeys){
   tempKeys.add(str);
  }
  
  for(String item : tempKeys){
   

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件      12274  2016-09-02 17:50  k_means\K-means算法运算结果图.jpg

     文件       8079  2016-09-02 17:50  k_means\Kmeans.java

     文件        989  2016-09-02 17:50  k_means\test.java

     目录          0  2018-11-08 15:46  k_means

     文件       1073  2016-09-02 17:46  kmedoids\Cluster.java

     文件       2711  2016-09-02 17:46  kmedoids\ClusterAnalysis.java

     文件       1458  2016-09-02 17:46  kmedoids\DataPoint.java

     文件       3173  2016-09-02 17:46  kmedoids\K中心点算法运算结果.jpg

     文件       1379  2016-09-02 17:46  kmedoids\Mediod.java

     文件       1925  2016-09-02 17:46  kmedoids\TestMain.java

     目录          0  2018-11-08 15:46  kmedoids

     文件        481  2016-09-02 14:33  knn\input.txt

     文件       3355  2016-09-01 10:57  knn\KNN.java

     文件        801  2016-09-02 14:37  knn\KNNNode.java

     文件       8001  2016-09-02 16:29  knn\knn运算结果.png

     文件        196  2016-09-02 14:32  knn\test.txt

     文件       1915  2016-09-02 14:37  knn\TestKNN.java

     目录          0  2018-11-08 15:46  knn

     文件       4385  2016-09-14 18:31  LogicRegression\linearRegressionAnalysis\LinearRegression.java

     文件       6364  2016-09-02 16:30  LogicRegression\linearRegressionAnalysis\线性逻辑回归.png

     目录          0  2018-11-08 15:46  LogicRegression\linearRegressionAnalysis

     文件        260  2016-09-14 18:31  LogicRegression\multipleLinearRegressionAnalysis\DataPoint.java

     文件       1525  2016-09-14 18:31  LogicRegression\multipleLinearRegressionAnalysis\LinearRegression.java

     文件       4446  2016-09-14 18:31  LogicRegression\multipleLinearRegressionAnalysis\RegressionLine.java

     文件       6711  2016-09-02 16:30  LogicRegression\multipleLinearRegressionAnalysis\多元线性回归.png

     目录          0  2018-11-08 15:46  LogicRegression\multipleLinearRegressionAnalysis

     目录          0  2018-11-08 15:46  LogicRegression

     文件      17087  2016-09-02 14:46  randomforest\CARTTool.java

     文件       4015  2016-09-02 14:46  randomforest\DecisionTree.java

     文件        481  2016-09-02 14:33  randomforest\input.txt

............此处省略47个文件信息

评论

共有 条评论