• 大小: 85KB
    文件类型: .zip
    金币: 1
    下载: 0 次
    发布日期: 2021-06-12
  • 语言: 其他
  • 标签: python脚本  

资源简介

从qq国际版中提取出的全球主要国家、省州、城市的数据库(XML版),并转换为csv版。数据库包含country_name,country_code,state_name,state_code,city_name,city_code信息。上传资源包括xml版数据库、csv版数据库、xml转csv脚本。

资源截图

代码片段和文件信息

#!/usr/bin/env python 3.7
# -*- coding:utf-8 -*-
import pandas as pd
import xml.etree.ElementTree as ET

def xml_to_csv(data=“../data/QQ-LocList/LocList.xml“):
    tree=ET.parse(data)
    root=tree.getroot()
    result=[]
    for country in root.iter(‘CountryRegion‘):#country
        country_name country_code = country.attrib[“Name“] country.attrib[“Code“]
        for state in country:#state
            try:
                state_name state_code = state.attrib[‘Name‘] state.attrib[‘Code‘]
            except:
                state_name = state_code = None
            for city in state:#city
                city_name city_code = city.attrib[‘Name‘] city.attrib[‘Code‘]
                result.append({‘country_name‘:country_name‘country_code‘:country_code
                               ‘state_name‘:state_name‘state_code‘:state_code
                               ‘city_name‘:city_name‘city_code‘:city_code})
    result=pd.Dataframe(resultcolumns=[‘country_name‘‘country_code‘‘state_name‘‘state_code‘‘city_name‘‘city_code‘])
    result.to_csv(‘../output/FSN_fromQQ.csv‘)
    print(“城市数量有:“result.shape[0])
    result.drop_duplicates(subset=[‘country_name‘ ] keep=‘first‘ inplace=True)
    print(“国家数量有:“ result.shape[0])
    return 0

if __name__==“__main__“:
    xml_to_csv()

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2019-07-05 10:19  01_qq导出的原始xml数据库\
     文件      184907  2019-07-04 09:36  01_qq导出的原始xml数据库\LocList.xml
     目录           0  2019-07-05 10:20  02_pyhton脚本转换后的csv版本\
     文件      139146  2019-07-05 09:54  02_pyhton脚本转换后的csv版本\FSN_fromQQ.csv
     目录           0  2019-07-05 10:31  03_xml_to_csv脚本\
     文件        1359  2019-07-04 17:57  03_xml_to_csv脚本\xml_processing.py

评论

共有 条评论