• 大小: 54KB
    文件类型: .zip
    金币: 1
    下载: 0 次
    发布日期: 2021-05-22
  • 语言: 其他
  • 标签: PageRank  MapReduce  

资源简介

PageRank算法的MapReduce实现

资源截图

代码片段和文件信息


package nudt.isiteam.PageRank;
import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;
import java.util.HashMap;
import java.util.Iterator;
import java.util.Set;
/**
 * PageRank
 * nudt.isiteam.PageRank -- Convergence.java  
 * @author GuoLiang
 * May 27 2014 - 7:46:13 AM
 */
public class Convergence{

public static double calDistance(String filePath1 String filePath2){
HashMap map1=Convergence.readFile(filePath1);
HashMap map2=Convergence.readFile(filePath2);
double distance=0;
Set keySet=map1.keySet();
Iterator itr=keySet.iterator();
while(itr.hasNext()){
String key=itr.next();
distance+=Math.pow(map1.get(key)-map2.get(key)2);
}

return distance;

}

public static HashMap readFile(String filePath){
HashMap map = new HashMap();
try {
FileReader fr = new FileReader(filePath);
BufferedReader br = new BufferedReader(fr);
String prStr = ““;

while ((prStr = br.readLine()) != null) {
String[] values = prStr.split(“\\s+“);
if (!map.containsKey(values[0])) {
map.put(values[0] Double.valueOf(values[1]));
}
}

br.close();
fr.close();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return map;
}
}

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2014-09-02 18:50  PageRank\
     目录           0  2014-05-27 23:19  PageRank\PageRank\
     文件        4284  2014-05-13 10:24  PageRank\PageRank\.classpath
     文件         419  2014-05-13 10:24  PageRank\PageRank\.project
     目录           0  2014-05-13 10:42  PageRank\PageRank\.settings\
     文件        5165  2014-05-13 10:45  PageRank\PageRank\.settings\org.eclipse.jdt.ui.prefs
     目录           0  2014-05-27 22:08  PageRank\PageRank\bin\
     目录           0  2014-05-27 22:08  PageRank\PageRank\bin\nudt\
     目录           0  2014-05-27 22:08  PageRank\PageRank\bin\nudt\isiteam\
     目录           0  2014-05-27 23:19  PageRank\PageRank\bin\nudt\isiteam\PageRank\
     文件        2575  2014-05-27 23:00  PageRank\PageRank\bin\nudt\isiteam\PageRank\Convergence.class
     文件        2223  2014-05-27 22:42  PageRank\PageRank\bin\nudt\isiteam\PageRank\PageCount$Map.class
     文件        2335  2014-05-27 22:42  PageRank\PageRank\bin\nudt\isiteam\PageRank\PageCount$NewCombiner.class
     文件        2627  2014-05-27 22:42  PageRank\PageRank\bin\nudt\isiteam\PageRank\PageCount$Reduce.class
     文件        2450  2014-05-27 22:42  PageRank\PageRank\bin\nudt\isiteam\PageRank\PageCount.class
     文件        3988  2014-05-27 23:13  PageRank\PageRank\bin\nudt\isiteam\PageRank\PageRank$PRMap.class
     文件        2441  2014-05-27 23:13  PageRank\PageRank\bin\nudt\isiteam\PageRank\PageRank$PRReduce.class
     文件        3292  2014-05-27 23:13  PageRank\PageRank\bin\nudt\isiteam\PageRank\PageRank.class
     目录           0  2014-05-13 16:11  PageRank\PageRank\in\
     目录           0  2014-05-27 23:19  PageRank\PageRank\input\
     文件          32  2014-05-27 22:41  PageRank\PageRank\input\.part-r-00000.crc
     文件           8  2014-05-27 22:41  PageRank\PageRank\input\._SUCCESS.crc
     文件        3063  2014-05-27 22:41  PageRank\PageRank\input\part-r-00000
     文件           0  2014-05-27 22:41  PageRank\PageRank\input\_SUCCESS
     文件        5978  2014-05-13 16:11  PageRank\PageRank\in\hm3
     目录           0  2014-05-27 23:19  PageRank\PageRank\output\
     目录           0  2014-05-27 23:19  PageRank\PageRank\output\0\
     文件          28  2014-05-27 23:14  PageRank\PageRank\output\0\.part-r-00000.crc
     文件           8  2014-05-27 23:14  PageRank\PageRank\output\0\._SUCCESS.crc
     文件        2165  2014-05-27 23:14  PageRank\PageRank\output\0\part-r-00000
     文件           0  2014-05-27 23:14  PageRank\PageRank\output\0\_SUCCESS
............此处省略80个文件信息

评论

共有 条评论