• 大小: 0.17M
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2021-01-31
  • 语言: 其他
  • 标签:

资源简介

通过python爬虫,对德语专业的招聘数据做了数据爬取,之后采用seaborn库作了可视化,包括了琴形图、柱状图、曲线图还有箱型图,此处给出爬虫python代码和可视化代码

资源截图

代码片段和文件信息


# coding: utf-8

# In[196]:



import pandas as pd
import re
import numpy as np

a=pd.read_csv(‘F:\\xiaofang\\1.csv‘)
t=[]
for i in a[‘salary‘]:
    
 t1=re.sub(‘K‘‘‘str(i))
 t2=re.sub(‘k‘‘‘t1).split(‘-‘)
    
 t.append(np.mean([int(tt) for tt in t2]))

a.loc[:‘salary_average‘]=t
#print(a.loc[:‘salary_average‘])
y=-1
for i in a[‘workYear‘]:
 y+=1 

 pat=‘.*\-.*‘

 p=re.compile(pat)
 p2=re.compile(‘.*年[以上|以下].*‘)   
    
 p3=re.compile(‘.*[应届毕业生|不限].*‘)
 if(p.match(i)):
     t1=re.sub(‘年‘‘‘str(i))
     t2=re.sub(‘y‘‘‘t1).split(‘-‘)
    
     vb=np.mean([int(tt) for tt in t2])
     a.loc[y‘workyear_average‘]=vb
   
 elif(p2.match(i)):
     t1=re.sub(‘年以上‘‘‘str(i))
     t2=re.sub(‘年以下‘‘‘t1)
    
     vb=np.mean([int(tt) for tt in t2])
     a.loc[y‘workyear_average‘]=vb
    
 

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件     285883  2018-09-21 16:23  keshi.ipynb

     文件       2950  2018-09-21 16:19  lagouspider.py

     文件      47487  2018-09-21 16:19  lagouspider.ipynb

     文件       7749  2018-09-21 16:23  keshi.py

----------- ---------  ---------- -----  ----

               344069                    4


评论

共有 条评论