• 大小: 1.04MB
    文件类型: .zip
    金币: 1
    下载: 0 次
    发布日期: 2023-10-30
  • 语言: Python
  • 标签: 机器学习  

资源简介

本代码主要是用机器学习的方法判断红楼梦后四十回是不是曹雪芹写的

资源截图

代码片段和文件信息

# sample_build.py 
#
# Author: Xubin Lin

import jieba
import numpy as np


def sample_build(FeaturesPath ChapterLib SavePath):
Sample = {}
Features = {}
with open(FeaturesPath) as fr:     
featuresline = fr.readlines()
for line in featuresline:
line = line.strip()
Features[line] = 0
for (numval_chp) in ChapterLib.items(): 
FeaturesVector = []
Features_Tmp = Features.copy()    
seg_list = jieba.cut(val_chp cut_all = False)  
for words in seg_list: 
index = Features_Tmp.get(words-1)   
if index != -1:
Features_Tmp[words] = Features_Tmp.get(words-1) + 1 
for (keyval) in Features_Tmp.items():  
FeaturesVector.append(val)
Sample[num] = FeaturesVector
with open(SavePath ‘w‘) as fr:      
for (keyval) in Sample.items():
fr.write(str(val) + ‘\n‘)
return Sample   


#Application Demo






 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2018-04-12 20:51  SVM_Stone\
     文件         892  2018-04-12 20:50  SVM_Stone\sample_build.py
     文件        2335  2018-04-12 19:17  SVM_Stone\svm_prediction.py
     目录           0  2018-04-12 20:49  SVM_Stone\text_analysis\
     文件        1672  2018-04-10 13:10  SVM_Stone\text_analysis\keywords0.txt
     文件        1697  2018-04-10 13:10  SVM_Stone\text_analysis\keywords1.txt
     文件        1693  2018-04-10 13:10  SVM_Stone\text_analysis\keywords2.txt
     文件        1400  2018-04-10 15:56  SVM_Stone\text_analysis\KeyWord_final.txt
     文件       44079  2018-04-12 19:17  SVM_Stone\text_analysis\sample.txt
     文件        1594  2018-04-12 20:51  SVM_Stone\word_split.py
     文件     2523106  2018-04-10 20:04  SVM_Stone\红楼梦.txt

评论

共有 条评论