哈佛大学AI的开源AI涵盖了“机构书1.0”书籍,涵

IT Home于6月16日在Microsoft和OpenAI支持下报道,哈佛法学院图书馆上周正式开设了首个AI培训数据集“机构书1.0”。据说数据集包括哈佛大学系列中的983,000本书,其中涵盖了245种语言,总计2420亿个令牌,并且IT房屋附在项目地址上。据报道,相应数据集中收集的书籍中有40%是英文。出版的主要年份集中在19世纪和20世纪,总共分为20个受试者。此外,相应的数据集还为每本书提供了一个完整的元数据,其中涉及“ with -set,出版年份,语言,原始资源”之类的信息。哈佛法学院图书馆说,将来,研究人员将继续扩展数据内容。目前,相应的项目团队已与波士顿公共图书馆合作,并增加了“百万百万”以数字形式为上述数据集的历史报纸。随后,哈佛法学院图书馆还计划开发一系列的AI工具,以提高收集和开放性数据的分类效率,并促进“负责任的数据使用标准”。

Related Posts

Comments are closed.