• 大小: 626KB
    文件类型: .zip
    金币: 1
    下载: 0 次
    发布日期: 2021-01-04
  • 语言: Python
  • 标签: AI  

资源简介

kaggle-美国人口普查年收入比赛,随机森林Python版本有很可以调用的库,使用随机森林非常方便,主要用到以下的库: sklearn pandas numpy

资源截图

代码片段和文件信息

# 本程序参考网页:
# https://blog.csdn.net/randompeople/article/details/81429264
# 数据已包含在同名文件夹中,且在上述网页中可以找到下载链接。
# 王磊-中国石油大学(北京)  2019-3-4 18:19:16


# coding: utf-8

# In[9]:

import pandas as pd  # load csv‘s (pd.read_csv)
import numpy as np   # math (lin. algebra)

import sklearn as skl   # machine learning
from sklearn.ensemble import RandomForestClassifier
#from plotnine import *
import matplotlib.pyplot as plt
from sklearn.preprocessing import LabelEncoder
from sklearn_pandas  import DataframeMapper


from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import classification_report


# In[10]:

def get_train_data():
#下面两个文件路径替换为你电脑上该文件的路径
    train_path = “D:/workspace/Data/kggal/AmericaIncome/adult.data“
    test_path = ‘D:/workspace/Data/kggal/AmericaIncome/adult.test‘
    

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2019-03-04 18:17  kaggle-2-American_population_income_prediction\AmericaIncome\
     文件     3974305  2019-03-04 17:00  kaggle-2-American_population_income_prediction\AmericaIncome\adult.data
     文件        5229  2019-03-04 17:00  kaggle-2-American_population_income_prediction\AmericaIncome\adult.names
     文件     2003153  2019-03-04 17:00  kaggle-2-American_population_income_prediction\AmericaIncome\adult.test
     文件        4267  2019-03-04 17:00  kaggle-2-American_population_income_prediction\AmericaIncome\old.adult.names
     文件        3655  2019-03-04 18:19  kaggle-2-American_population_income_prediction\American_population_income_prediction.py
     目录           0  2019-03-04 18:17  kaggle-2-American_population_income_prediction\

评论

共有 条评论