数字古籍资源站—书格,以及古籍资源集成—全球汉籍影像集成开放系统

个人介绍

书格是一个古籍资料下载站点,日常更新维护产出了很多优质古籍,你可以直接在这里下载
全球汉籍影像集成开放系统是各种站点(官方/民间)的集合,你可以来这里搜索你想下载的资料,然后跳转到有这份资料的网站
比如这样

书格官方介绍

書格(Shuge.org)是一个自由开放的在线古籍图书馆。致力于开放式分享、介绍、推荐有价值的古籍善本,并鼓励将文化艺术作品数字化归档。分享内容限定为公共版权领域的书籍(参照标准 伯尔尼公约 [2]);我们最大限度地还原书籍品貌、内容;借此计划让大家自由、免费地欣赏到那些难以现世的书籍。让大家能从中感受到人类文明进程。

书格发布的书籍主要以高清彩色影像版本 PDF 格式,大部分书籍书籍单页宽度在 1400 像素以上,跨页宽度在 2400 像素以上。书籍刊行年代有从宋元珍本,明清善本到近代刊本。

在可能的情况下,面对同一书籍,我们尽量遵循刊行质量和时间优先,挑选同类中最优资源分享介绍。部分书籍会同比列出不同版本的优秀资源。在内容方面,我们尽量挑选欣赏和在阅读价值较高的善本,所以我们更倾向于:艺术类、影像类、珍稀类以及部分刊印水平较高的书籍。

书格十一周年报告,以及对全球汉籍影像集成开放系统的介绍

来了来了!大家好,今天是我们建站十一周年纪念日。这一年我们感受到了大环境的寒意,前行愈发艰难。也感受到了人工智能带来的冲击,既有惊喜也有顾虑。无论环境如何变化,我们都坚定地继续前行。依照惯例,继续汇报总结书格的相关状况。我们今年的主标题是:十一周年,士以弘毅,任重道远

士以弘毅 任重道远

主标题:士以弘毅 取自《论语》泰伯篇

曾子曰:「士不可以不弘毅,任重而道遠。仁以為己任,不亦重乎,死而後已,不亦遠乎。」

大致译文

曾子说:“有志者不可以不培养坚强的意志,因为责任重大而且道路遥远。把实现仁作为自己的责任,这样的责任不是很重大吗?为理想奋斗终身,这样的道路不是很遥远吗?”

这几年国内外相关机构公布的数字文献也越来越多。借助唐宸老师及团队开发的全球漢籍影像開放集成系統,我们可以轻松了解目前全球各个国家和地区公布在线的汉籍情况。通过这些数据,一旦有对比就有伤害。对比发现:

目前公布的古籍数字文件数量、质量、开放获取的便利性几乎都在海外。国内(含港澳台)大部分机构公布的数字文件似乎是上个世纪的产品,页面分辨率低、水印又很大。也几乎谈不上开放获取。中国国家图书馆这些年倒是有些改善,取消了登录浏览,也公布了一批高清原色资源。反而,台湾香港地区的一些机构开始开倒车。为了所谓的 “版权” 保护,防御技术不断翻新。一个水印不够就加两个,一种限制访问不够就再来一种……

杜泽逊老师说:很多图书馆不舍得把古籍数字资源挂出来,“仁” 和 “义” 一个都不沾。

……
还是有很多很多的图书馆不舍得把古籍数字资源挂出来,而这些不往外挂古籍资源的单位和个人,以及他们的工作人员,他们每天都在使用网上的信息,每天都在使用数以十万、百万计的古籍图像资源,是人家投放上去的,而你自己并不愿意把手里东西投放上去,“仁” 和 “义” 这两条一个都不沾,这是肯定沾不上的。……

(摘自 杜泽逊:中华优秀传统文化与 “忠孝节义”

优秀传统文化是国家发展的无尽资源。让优秀传统文化开放与传播,文明之花才能孕育新的结果,才能让我们更有文化自信。虽然道路还很遥远,只要我们向前迈进,也就和 “仁义” 沾上了。

全球汉籍影像集成开放系统官方介绍

https://guji.wenxianxue.cn

網站定位

  • 規模性:自建搜索引擎,對全球所有公開發佈的古籍影像進行集成式著録。
  • 持續性:分期建設,且至少每年進行一次常規數據更新。
  • 公益性:作爲“數字文獻學”核心基礎設施,堅持免費提供給學界人士(尤其是學生)和民眾愛好者使用。

更新動態

  • 20231003:補充十餘個搜索引擎接口(感謝書格網站長未曾先生提供信息)。——唐宸
  • 20231004:補充日本部分大學數據(感謝戴欣萌同學協助)。——唐宸
  • 20231007:完善了前端篩選器代碼bug(感謝搜韻網站長陳逸雲先生提供信息)。——唐宸
  • 20231125:訂正了越南文獻來源錯誤標註(感謝西南交大劉玉珺教授提供信息)。——唐宸
  • 20240129:常規數據更新。刪除了影像清晰度過低以致無法利用的台灣師範大學圖書館資料3967册/卷。——唐宸
  • 20240201:第二期集中更新,數據量由17萬條增加到30.7萬條,實際著錄50萬條(古籍21萬部又28萬册)。——唐宸
  • 20240205:數據錯誤修復。——唐宸
  • 20240207:優化前端結構化數據呈現方式,進一步保護各館藏機構的知識産權。——唐宸
  • 20240220:修復代碼bug。——唐宸
  • 20240320:架設CDN雲加速,提升用户訪問速度。——唐宸
  • 20240408:第三期集中更新,數據量上升到26萬部又28萬册。——唐宸

未來工作

  • 網站功能
    • 簡繁體字、異體字、人名字號的自動聯想通檢。
    • 將和刻本、朝鮮本納入檢索系統。
    • 與本站先前開發的全球漢籍GIS系統進行深度整合/合併。
  • 數據發佈
    • 繼續接入全球更多數據庫。