Zubnet AI学习Wiki › Classification
基础

Classification

别名:分类器、归类
将输入分配到一组预定义类别之一的任务。“这封邮件是垃圾邮件还是正常邮件?”(二分类)。“这张图片是猫、狗还是鸟?”(多分类)。“这篇文章适用哪些标签?”(多标签)。分类是最常见的监督学习任务,也是无数实际AI应用的基础。

为什么重要

分类是大多数人在实践中首次接触机器学习的场景——垃圾邮件过滤、内容审核、医学诊断、欺诈检测、情感分析。理解分类有助于理解整个监督学习管道:标注数据输入、训练模型、预测输出。

深度解析

分类器输出各类别的概率分布。对于二分类,一个0到1之间的数字就足够了(正类的概率)。对于多分类,模型为每个类别输出一个概率,通常使用softmax函数确保它们之和为1。预测的类别通常是概率最高的那个,但你可以根据对假阳性和假阴性的容忍度来调整决策阈值。

LLM作为分类器

现代LLM是出人意料的优秀分类器。无需训练专用模型,你可以提示LLM:“将这条客户评价分类为正面、负面或中性。”对于许多分类任务,这种零样本方法可以匹配或超越专用分类器,特别是当任务需要理解细微差别或上下文时。权衡在于成本和延迟——一次LLM API调用比在本地运行小型分类器要昂贵得多。

重要指标

准确率(正确百分比)是最直观的指标,但可能会产生误导。如果99%的邮件不是垃圾邮件,一个总是预测“非垃圾邮件”的模型准确率达到99%,但一封垃圾邮件都没有捕获。精确率(在预测的正例中,有多少是正确的)、召回率(在实际的正例中,有多少被找到了)和F1值(精确率和召回率的调和平均值)给出更完整的图景。正确的指标取决于你特定应用中错误的代价。

相关概念

← 所有术语
← Chatbot Arena CLIP →