资源简介
本代码主要是用机器学习的方法判断红楼梦后四十回是不是曹雪芹写的

代码片段和文件信息
# sample_build.py
#
# Author: Xubin Lin
import jieba
import numpy as np
def sample_build(FeaturesPath ChapterLib SavePath):
Sample = {}
Features = {}
with open(FeaturesPath) as fr:
featuresline = fr.readlines()
for line in featuresline:
line = line.strip()
Features[line] = 0
for (numval_chp) in ChapterLib.items():
FeaturesVector = []
Features_Tmp = Features.copy()
seg_list = jieba.cut(val_chp cut_all = False)
for words in seg_list:
index = Features_Tmp.get(words-1)
if index != -1:
Features_Tmp[words] = Features_Tmp.get(words-1) + 1
for (keyval) in Features_Tmp.items():
FeaturesVector.append(val)
Sample[num] = FeaturesVector
with open(SavePath ‘w‘) as fr:
for (keyval) in Sample.items():
fr.write(str(val) + ‘\n‘)
return Sample
#Application Demo
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2018-04-12 20:51 SVM_Stone\
文件 892 2018-04-12 20:50 SVM_Stone\sample_build.py
文件 2335 2018-04-12 19:17 SVM_Stone\svm_prediction.py
目录 0 2018-04-12 20:49 SVM_Stone\text_analysis\
文件 1672 2018-04-10 13:10 SVM_Stone\text_analysis\keywords0.txt
文件 1697 2018-04-10 13:10 SVM_Stone\text_analysis\keywords1.txt
文件 1693 2018-04-10 13:10 SVM_Stone\text_analysis\keywords2.txt
文件 1400 2018-04-10 15:56 SVM_Stone\text_analysis\KeyWord_final.txt
文件 44079 2018-04-12 19:17 SVM_Stone\text_analysis\sample.txt
文件 1594 2018-04-12 20:51 SVM_Stone\word_split.py
文件 2523106 2018-04-10 20:04 SVM_Stone\红楼梦.txt
相关资源
- 机器学习(周志华)配套代码
- 机器学习-岭回归实现
- 012345手势识别神经网络代码
- 猫-非猫图二分类识别
- 机器学习k means算法实现图像分割
- kmeans聚类算法的python实现程序
- Python100经典练习题
- 南瓜书(PumpkinBook)
- 机器学习numpy和pandas基础
- python机器学习Sebastian Raschka中文最新完
- Python-DeepMoji模型的pyTorch实现
- 《机器学习实战》源代码Python3
- Python-使用DeepFakes实现YouTube视频自动换
- Introduction to machine learning with python (
- python新浪微博爬虫,爬取微博和用户
- Python-一系列高品质的动漫人脸数据集
- Python-Insightface人脸检测识别的最小化
- 非线性回归Python代码
- 093 2018北风网人工智能视频(完结)转
- python的色情图片识别
- 贝叶斯网络程序
- 《机器学习实战》Python3代码
- Python-自然场景文本检测PSENet的一个
- Python-在特征金字塔网络FPN的Pytorch实现
- Python-PyTorch实时多人姿态估计项目的实
- Python-用PyTorch10实现FasterRCNN和MaskRCNN比
- Python-心脏核磁共振MRI图像分割
- Python-基于YOLOv3的行人检测
- Python-RLSeq2Seq用于SequencetoSequence模型的
- Python-PyTorch对卷积CRF的参考实现
评论
共有 条评论