卡洛

结合蒙特卡洛树算法与对话规划：论文解读《Prompt-Based Monte-Carlo Tree Search for Goal-oriented Dialogue Policy Planning》

摘要在目标导向的对话规划中，通常需要模拟未来的对话互动并估计任务进展。因此，许多方法考虑训练神经网络来执行前瞻性搜索算法，如A*搜索和蒙特卡洛树搜索（MCTS）。然而，这种训练往往需要大量的标注数据，当面临噪声标注或资源稀缺的情况下，会

7月前640