post_img

2025/1/18

摘要

大模型量化是一种优化技术,用于在尽量减少模型性能损失的情况下,降低大模型的计算成本和存储需求。其核心是将模型的权重和激活值从高精度 …

post_img

2025/1/4

摘要

Decoder-only 结构主要用于生成任务 深入解析 Decoder-only 结构 1. 什么是 Transformer 架 …

post_img

2024.12.20

摘要

大模型幻觉 1.事实性幻觉 1.模型生成的内容与可验证的现实世界的知识并不一致 2.事实不一致 :模型回复与现实世界的信息相矛盾 …

post_img

2024.12.6

摘要

技术点 SpaCy(英文分词,也支持其他语言) 分词 逐行分析: 导入spacy库,这是进行自然语言处理的另一个强大库。加载英文语 …