Human-level control through deep reinforcement learning

Abstract 强化学习理论在动物行为上,深入到心理和神经科学的角度,关于在一个环境中如何使得智能体优化他们的控制,提供了一个正式的规范。为了利用强化学习成功的接近现实世界

7月前820

基于知识图谱的human-machine conversation

1. 我们提出了基于知识图谱的主动对话任务,让机器像人类一样主动和用户进行对话。referenceProactive Human-Machine Conversation with Explicit Conversat

7月前460

《Proactive Human-Machine Conversation with Explicit Conversation Goals》

论文出处:ACL 2019 1. 摘要 论文提出了一种基于知识图谱能主导对话的对话系统,并开源了对应的数据集DuConv。该数据集涉及电影、导演和演员相关题材,包含3w个多轮对话,约27w个句子。每个对话包含一个目标三元组[START,

7月前470