• 大小: 10.94MB
    文件类型: .zip
    金币: 1
    下载: 0 次
    发布日期: 2023-10-06
  • 语言: 其他
  • 标签: 代码  

资源简介

深入理解大数据:大数据处理与编程实践 书中所有代码

资源截图

代码片段和文件信息

import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;
import org.apache.hadoop.io.Writable;

/*
 * k-means聚类算法簇信息
 */
public class Cluster implements Writable{
private int clusterID;
private long numOfPoints;
private Instance center;

public Cluster(){
this.setClusterID(-1);
this.setNumOfPoints(0);
this.setCenter(new Instance());
}

public Cluster(int clusterIDInstance center){
this.setClusterID(clusterID);
this.setNumOfPoints(0);
this.setCenter(center);
}

public Cluster(String line){
String[] value = line.split(““3);
clusterID = Integer.parseInt(value[0]);
numOfPoints = Long.parseLong(value[1]);
center = new Instance(value[2]);
}

public String toString(){
String  result = String.valueOf(clusterID) + ““ 
+ String.valueOf(numOfPoints) + ““ + center.toString();
return result;
}

public int getClusterID() {
return clusterID;
}

public void setClusterID(int clusterID) {
this.clusterID = clusterID;
}

public long getNumOfPoints() {
return numOfPoints;
}

public void setNumOfPoints(long numOfPoints) {
this.numOfPoints = numOfPoints;
}

public Instance getCenter() {
return center;
}

public void setCenter(Instance center) {
this.center = center;
}

public void observeInstance(Instance instance){
try {
Instance sum = center.multiply(numOfPoints).add(instance);
numOfPoints++;
center = sum.divide(numOfPoints);
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}

@Override
public void write(DataOutput out) throws IOException {
// TODO Auto-generated method stub
out.writeInt(clusterID);
out.writeLong(numOfPoints);
center.write(out);
}

@Override
public void readFields(DataInput in) throws IOException {
// TODO Auto-generated method stub
clusterID = in.readInt();
numOfPoints = in.readLong();
center.readFields(in);
}
}

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2014-09-18 19:15  Chapter 10\
     目录           0  2014-09-18 19:11  Chapter 10\CH 10.1 - KMeans\
     文件         388  2014-07-31 20:49  Chapter 10\CH 10.1 - KMeans\Instance.txt
     文件         380  2014-08-31 11:00  Chapter 10\CH 10.1 - KMeans\README.md
     目录           0  2014-07-31 20:49  Chapter 10\CH 10.1 - KMeans\src\
     文件        2010  2014-07-31 20:49  Chapter 10\CH 10.1 - KMeans\src\Cluster.java
     文件        2663  2014-07-31 20:49  Chapter 10\CH 10.1 - KMeans\src\Instance.java
     目录           0  2014-07-31 20:49  Chapter 10\CH 10.1 - KMeans\src\king\
     目录           0  2014-07-31 20:49  Chapter 10\CH 10.1 - KMeans\src\king\Utils\
     文件         144  2014-07-31 20:49  Chapter 10\CH 10.1 - KMeans\src\king\Utils\Distance.java
     文件         526  2014-07-31 20:49  Chapter 10\CH 10.1 - KMeans\src\king\Utils\EuclideanDistance.java
     文件         467  2014-07-31 20:49  Chapter 10\CH 10.1 - KMeans\src\king\Utils\HammingDistance.java
     文件         878  2014-07-31 20:49  Chapter 10\CH 10.1 - KMeans\src\king\Utils\InstanceGenerator.java
     文件        1365  2014-07-31 20:49  Chapter 10\CH 10.1 - KMeans\src\king\Utils\ListWritable.java
     文件        4640  2014-07-31 20:49  Chapter 10\CH 10.1 - KMeans\src\KMeans.java
     文件        2862  2014-07-31 20:49  Chapter 10\CH 10.1 - KMeans\src\KMeansCluster.java
     文件        3632  2014-07-31 20:49  Chapter 10\CH 10.1 - KMeans\src\KMeansDriver.java
     文件        3779  2014-07-31 20:49  Chapter 10\CH 10.1 - KMeans\src\RandomClusterGenerator.java
     目录           0  2014-09-18 19:11  Chapter 10\CH 10.2 - KNearestNeighbour\
     文件         716  2014-08-31 11:15  Chapter 10\CH 10.2 - KNearestNeighbour\README.md
     目录           0  2014-07-31 20:50  Chapter 10\CH 10.2 - KNearestNeighbour\src\
     文件         636  2014-07-31 20:50  Chapter 10\CH 10.2 - KNearestNeighbour\src\Instance.java
     目录           0  2014-07-31 20:50  Chapter 10\CH 10.2 - KNearestNeighbour\src\king\
     目录           0  2014-07-31 20:50  Chapter 10\CH 10.2 - KNearestNeighbour\src\king\Utils\
     文件         353  2014-07-31 20:50  Chapter 10\CH 10.2 - KNearestNeighbour\src\king\Utils\Distance.java
     文件        1884  2014-07-31 20:50  Chapter 10\CH 10.2 - KNearestNeighbour\src\king\Utils\ListWritable.java
     文件        7048  2014-07-31 20:50  Chapter 10\CH 10.2 - KNearestNeighbour\src\KNearestNeighbour.java
     文件         119  2014-07-31 20:50  Chapter 10\CH 10.2 - KNearestNeighbour\src\train.txt
     目录           0  2014-09-18 19:13  Chapter 10\CH 10.3 - NaiveBayes\
     文件        8375  2014-08-02 18:12  Chapter 10\CH 10.3 - NaiveBayes\ReadMe-NaiveBayes.html
     文件       54827  2014-08-02 18:18  Chapter 10\CH 10.3 - NaiveBayes\ReadMe-NaiveBayes.pdf
............此处省略98个文件信息

评论

共有 条评论