资源简介

中华新华字典数据库。包括歇后语,成语,词语,汉字。提供新华字典API。 中华新华字典数据库和 API 。收录包括 14032 条歇后语,16142 个汉字,264434 个词语,31648 个成语。 对性能没需求的话,可以用我的新华字典 API 。所有的数据放在 data/ 目录。github:https://github.com/pwxcoo/chinese-xinhua 上的资源

资源截图

代码片段和文件信息

import pandas as pd

chengyu = pd.read_json(‘chengyu.json‘)  

replace = {‘ā‘:‘a‘ ‘á‘:‘a‘ ‘ǎ‘:‘a‘ ‘à‘:‘a‘ ‘ō‘:‘o‘ ‘ó‘:‘o‘ ‘ǒ‘:‘o‘ ‘ò‘:‘o‘\
           ‘ē‘:‘e‘ ‘é‘:‘e‘ ‘ě‘:‘e‘ ‘è‘:‘e‘}
def abbreviation(pinyin):
    each = pinyin.split(‘ ‘)
    return ‘‘.join(list(map(lambda x: replace[x[:1]] if x[:1] in replace else x[:1] each)))

chengyu[‘abbreviation‘] = chengyu[‘pinyin‘].apply(abbreviation)

chengyu.to_json(‘idiom.json‘ force_ascii=False orient=‘records‘)
    

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2018-08-21 01:56  chinese-xinhua-master\
     文件          39  2018-08-21 01:56  chinese-xinhua-master\.gitignore
     文件        1063  2018-08-21 01:56  chinese-xinhua-master\LICENSE
     文件        5182  2018-08-21 01:56  chinese-xinhua-master\README.md
     目录           0  2018-08-21 01:56  chinese-xinhua-master\data\
     文件    18550223  2018-08-21 01:56  chinese-xinhua-master\data\ci.csv
     文件    26129191  2018-08-21 01:56  chinese-xinhua-master\data\ci.json
     文件    12430802  2018-08-21 01:56  chinese-xinhua-master\data\idiom.json
     文件    27354320  2018-08-21 01:56  chinese-xinhua-master\data\word.json
     文件     1272390  2018-08-21 01:56  chinese-xinhua-master\data\xiehouyu.json
     目录           0  2018-08-21 01:56  chinese-xinhua-master\scripts\
     文件         491  2018-08-21 01:56  chinese-xinhua-master\scripts\addAbbreviation.py
     文件        1791  2018-08-21 01:56  chinese-xinhua-master\scripts\chengyu.py
     文件        2285  2018-08-21 01:56  chinese-xinhua-master\scripts\ci.py
     文件        1824  2018-08-21 01:56  chinese-xinhua-master\scripts\word.py
     文件        1064  2018-08-21 01:56  chinese-xinhua-master\scripts\xiehouyu.py

评论

共有 条评论