传统的情感分析使用特征工程分类器(词袋模型+逻辑回归、基于词典的方法)。这些方法对简单情况有效,但在讽刺(“哦太好了,又延误了”)、隐含情感(“电池续航两小时”)和领域特定语言上失败。现代方法使用微调的BERT或基于LLM的分类,通过理解上下文能更好地处理这些细微差别。
真实的评论通常包含混合情感:“相机很棒但电池让人失望。”方面级情感分析识别方面(相机、电池)并为每个方面独立分配情感。这比整体情感对产品团队更有用,因为它能精确定位具体需要改进的地方。现代LLM通过结构化输出自然地处理这个问题——“从这条评论中提取方面及其情感。”
对于情感分析,你有三个选择:(1)微调的小模型(快速、便宜、适合大批量),(2)零样本LLM提示(灵活、处理边缘情况、更贵),或(3)API服务(Google NLP、AWS Comprehend)。对于大多数新项目,先用LLM提示,在量级足够大时再切换到微调模型,这是最务实的做法。