人工智能术语解析：从生成式AI到算法偏差，了解AI领域的专业术语

2023-05-17 14:32:04

【ITBEAR科技资讯】05月17日消息，人工智能(AI)领域的迅猛发展带来了大量术语，其中包括生成式AI、训练数据、算法偏差等专业术语。这些术语对于希望进入这一领域的人来说至关重要。ITBEAR科技资讯将为您介绍一些人工智能的专业术语，帮助您在这个快速发展的领域中取得进展。

生成式AI是一种人工智能技术，它可以创造文本、图像、声音和视频等内容。与传统的人工智能应用主要侧重于对内容进行分类不同，生成式人工智能模型能够创造内容。例如，语音识别模型可以识别您的声音，而生成语音模型则可以使用您的声音创造有声读物。近期引起公众关注的许多模型都属于生成式AI，包括ChatGPT等聊天机器人，以及稳定扩散和midjourney等图像生成器，还有esemble等语音克隆程序。

(资料图片)

训练数据是用于帮助人工智能模型完成任务的文本、图像、声音等信息的集合。在语言模型中，训练数据集主要基于文本，例如书籍、社交媒体评论甚至代码。然而，低质量的训练数据可能会引入偏见，导致模型做出不公平的决策，表现出种族主义或性别歧视。据ITBEAR科技资讯了解，算法偏差是由于训练数据质量不佳和编程错误导致的，使得模型做出有偏见的决策。这些模型可能会基于性别、能力或种族做出不恰当的假设，从而对决策产生严重危害。一些批评人士对人工智能过快发展提出了担忧，指出算法偏见的潜在风险。

人工通用智能(AGI)是描述一种与人类具有相似甚至更强能力的程序。虽然全面的通用智能尚未实现，但模型正在变得越来越复杂。自主代理是一种拥有目标并具备足够工具来实现目标的人工智能模型。例如，自动驾驶汽车就是一种自主代理，它通过感官输入、GPS数据和驾驶算法独立决定导航和到达目的地的方式。斯坦福大学的研究人员已经证明，一组自主主体甚至可以发展出文化和传统。

提示链是利用与AI模型之前交互的信息来创建更准确的响应过程的技术，尤其在提示驱动的语言建模中应用广泛。例如，当您让ChatGPT给您的朋友发短信时，您希望它能记住您和她之间的语气、笑话和以前的对话内容。这些技术有助于整合上下文信息。

大型语言模型(LLM)是一种人工智能应用，通常是生成式的。这些模型的特点是规模庞大，例如最大的版本GPT-3包含1750亿个参数，并在570GB的数据上进行了训练。谷歌的PaLm模型更大，有5400亿个参数。随着硬件和软件的不断发展，预计这种规模还将继续增加。然而，这些模型也可能存在问题，如编造学术引用、对您要求其分析的数据撒谎，或编造训练数据中不存在的事件事实。

幻觉是指人工智能程序出现意外和错误的反应，可能是由于尚未完全理解的原因产生的。例如，当您询问如何种植果树时，语言模型可能会突然给出水果沙拉的食谱。目前尚不清楚为什么会发生这种情况，但可能与数据稀缺、信息缺失和错误分类有关。

突发性行为是指人工智能可能表现出并非专门设计用于的技能。例如，解释表情符号、理解讽刺和使用性别包容的语言都属于突发性行为。

一致性是指努力确保人工智能系统与其人类操作员具有相同的价值观和目标。为了实现一致性，研究人员致力于训练和校准模型，通常使用函数来奖励或惩罚模型。

多模态人工智能是一种能够理解和处理多种类型信息(如文本、图像、语音等)的人工智能形式。这种能力非常强大，因为它使得人工智能在多个维度上都能理解和表达自己，从而对任务有更广泛和更细致的理解。例如，多模态人工智能可以将日语漫画翻译成英语。

提示工程是给予人工智能指令的行为，以使其具备实现您目标所需的环境。提示工程与OpenAI的ChatGPT紧密相关，它描述了用户输入算法的任务，例如“给我五个流行的婴儿名字”。

训练是指使用数据来精细调整人工智能的过程，使其更适合完成特定任务。您可以使用包含希望人工智能学习的内容的数据来进行训练，就像将莎士比亚的十四行诗输入到一个诗歌机器人中一样。您可以在称为"epoch"的迭代中多次进行训练，直到模型的性能达到一致可靠。

神经网络是一种近似人类思维结构的计算机系统，它允许模型从抽象到具体进行建模。

狭义人工智能是指一些具有单一思维功能的AI算法，它们被设计成只能完成特定任务。例如，如果一个狭义人工智能算法可以下棋，那么它就不能下国际象棋。

关键词：