弱人工智能、强人工智能
自然语言处理=自然语言理解+自然语言生成
专家系统->统计方法->深度学习->大型语言模型
翻译系统:谷歌翻译
智能问答/对话:IBM沃森、Siri、ChatGPT
知识图谱:谷歌知识图谱
自然语言生成:根据给定的输入,自动生成可读性好、内容可靠的自然语言语句和篇章
难点:搜索空间大,$O(W^L)$,L文本长度,W词表大小;质量评价困难,无法自动评估
sakana.ai、NotebookLM(做PPT不赖)
经典文本生成内容:
文本扩写:AMR2Text、Data2Text、Topic2Text、对话
文本缩写:Summarization、Headline generation
文本改写:Paraphrasing、Simplification、Style transfer、Machine translate
文本生成经典方法:
流水线:数据采集-数据分析-文档规矩-语句输出
端到端:数据采集-端到端深度学习-稿件生成