清华大学自然语言处理与社会人文计算实验室共享资源协议

2023-02-21 15:23:12 文档大全网 [ 字体：小中大 ] [ 阅读： ]

【#文档大全网# 导语】以下是®文档大全网的小编为您整理的《清华大学自然语言处理与社会人文计算实验室共享资源协议》，欢迎阅读！
清华大学,自然语言,共享资源,实验室,人文

清华大学自然语言处理与社会人文计算实验室

共享资源协议

甲方：清华大学自然语言处理与社会人文计算实验室乙方：（此处填写申请人所在单位）

协议内容：

1. THULAC面向国内外大学、研究所、企业以及个人研究者免费开放源。乙方提交该协议

表示同意：（1）该资源或程序库不用于商业目的；（2）不将资源或程序库扩散给第三方。 2. 为了增进同行交流，促进自然语言处理技术的发展，甲方将相关自然语言处理算法代码

和模型资源免费共享给乙方，列表如下：共享内

详细内容

容算法源

THULAC中文分词和词性标注训练算法、测试算法

码

1-中文分词模型，由北京大学人民日报分词语料库训练产生。

模型资源

2-中文分词与词性标注联合模型。由多个分词语料库训练数据联合学习产生。 3-中文分词与词性标注联合+词表。更加复杂精确的模型，并含有多个大规模词表。

3. 乙方同意在发表论文或申报成果时声明“使用了清华大学THULAC工具”，并按如下格式

引用：

中文：孙茂松, 陈新雄, 郭志芃, 张开旭, 刘知远. THULAC：一个高效的中文词法分析工具包. 2016.

英文： Maosong Sun, Xinxiong Chen, Zhipeng Guo, Kaixu Zhang, Zhiyuan Liu. THULAC: An Efficient Lexical Analyzer for Chinese. 2016.

4. 甲方将继续丰富和完善相关功能模块，为了能够给乙方及时提供最新资源和程序库，乙

方需要完整提供如下信息，以及乙方负责人的电子签名：乙方负责人乙方联系人

姓名

乙方负责人电子签名：年月日

机构名称

职务

电话

电子邮件

机构所在国别地区

网站

通讯地址

邮编