【#文档大全网# 导语】以下是®文档大全网的小编为您整理的《清华大学自然语言处理与社会人文计算实验室共享资源协议》,欢迎阅读!
清华大学自然语言处理与社会人文计算实验室
共享资源协议
甲方:清华大学自然语言处理与社会人文计算实验室 乙方:(此处填写申请人所在单位)
协议内容:
1. THULAC面向国内外大学、研究所、企业以及个人研究者免费开放源。乙方提交该协议
表示同意:(1)该资源或程序库不用于商业目的;(2)不将资源或程序库扩散给第三方。 2. 为了增进同行交流,促进自然语言处理技术的发展,甲方将相关自然语言处理算法代码
和模型资源免费共享给乙方,列表如下: 共享内
详细内容
容 算法源
THULAC中文分词和词性标注训练算法、测试算法
码
1-中文分词模型,由北京大学人民日报分词语料库训练产生。
模型资源
2-中文分词与词性标注联合模型。由多个分词语料库训练数据联合学习产生。 3-中文分词与词性标注联合+词表。更加复杂精确的模型,并含有多个大规模词表。
3. 乙方同意在发表论文或申报成果时声明“使用了清华大学THULAC工具”,并按如下格式
引用:
中文: 孙茂松, 陈新雄, 郭志芃, 张开旭, 刘知远. THULAC:一个高效的中文词法分析工具包. 2016.
英文: Maosong Sun, Xinxiong Chen, Zhipeng Guo, Kaixu Zhang, Zhiyuan Liu. THULAC: An Efficient Lexical Analyzer for Chinese. 2016.
4. 甲方将继续丰富和完善相关功能模块,为了能够给乙方及时提供最新资源和程序库,乙
方需要完整提供如下信息,以及乙方负责人的电子签名: 乙方负责人 乙方联系人
姓名
乙方负责人电子签名: 年 月 日
机构名称
职务
电话
电子邮件
机构所在国别地区
网站
通讯地址
邮编
本文来源:https://www.wddqxz.cn/c68eaa7031d4b14e852458fb770bf78a65293af9.html