内容字号:默认大号超大号

段落设置:取消段首缩进段首缩进

字体设置:切换到微软雅黑切换到宋体

业界资讯软件之家
Win10之家WP之家
iPhone之家iPad之家
安卓之家数码之家
评测中心智能设备
精准搜索请尝试:精确搜索

GitHub上最全中华古诗词数据库又火了

2019/12/26 20:08:01来源:IT之家作者:玄隐责编:玄隐评论:

IT之家12月26日消息 近期,GitHub上最全中华古诗词数据库再次登上热榜,又火了一把。根据介绍,chinese-poetry最全中华古诗词数据库集合了唐宋两朝近一万四千古诗人, 接近5.5万首唐诗加26万宋诗. 两宋时期1564位词人,21050首词。该项目已经获得了 22.6k 个「star」以及 4.2k 个「fork」。

GitHub项目:https://github.com/chinese-poetry/chinese-poetry

最全的中华古典文集数据库,包含5.5万首唐诗、26万首宋诗、2.1万首宋词和其他古典文集。诗人包括唐宋两朝近1.4万古诗人,和两宋时期1.5千古词人。数据来源于互联网。

为什么要做这个仓库? 项目作者表示,古诗是中华民族乃至全世界的瑰宝,我们应该传承下去,虽然有古典文集,但大多数人并没有拥有这些书籍。从某种意义上来说,这些庞大的文集离我们是有一定距离的。而电子版方便拷贝,所以此开源数据库诞生了。此数据库通过JSON格式分发,可以让你很方便的开始你的项目。

古诗采集没有记录过程,因为古诗数据庞大,目标网站有限制,采集过程经常中断超过了一个星期。2017年新加入全宋词,全宋词爬取过程及数据分析。

高频词分析图

宋词受欢迎的词牌名

宋词高频词

宋词作者作品榜

唐诗高频词

唐诗作者作品榜

宋诗高频词

宋诗作者作品榜

数据集

相关文章

关键词:古诗词GitHub

IT之家,软媒旗下科技门户网站 - 爱科技,爱这里。

Copyright (C)RuanMei.com, All Rights Reserved.

软媒公司版权所有

首页-体育投注现金网|英超、意甲、西甲、欧洲杯即时比分等足球比分网