数据质量是机器学习模型训练的天花板,同算力、算法一起被看作人工智能的关键要素。现代的心理学是一门科学,心理咨询是一个重要的行业,但是从自然语言处理、机器学习角度,没有很好的开放数据,Chatopera在研发心理咨询AI助手期间,投入大量人力和精力,制作了Emotional First Aid Dataset, 即心理咨询问答语料库,简称efaqa-corpus-zh,现开放给研究机构,心理咨询服务者使用。
数据集详细介绍和语料获取地址:https://github.com/chatopera/efaqa-corpus-zh
心理咨询问答语料库(以下也称为"数据集","语料库")是为应用人工智能技术于心理咨询领域制作的语料。据我们所知,这是心理咨询领域首个开放的 QA 语料库,包括 20,000 条心理咨询数据,也是公开的最大的中文心理咨询对话语料。数据集内容丰富,不但具备多轮对话内容,也有分类等信息,制作过程耗费大量时间和精力,比如标注过程是面向多轮对话,平均每条标记耗时 1 分钟。
数据集由斯坦福大学,UCLA 和台湾辅仁大学临床心理学等心理学专业人士参与建设,并由 Chatopera 和诸多志愿者合作完成。
相关文章
猜你喜欢