分类: 大模型 | Roger-Lv's space

分类 - 大模型

2025

Qwen3技术报告解读

2025-08-14

Qwen3技术报告解读

大模型蒸馏技术

2025-08-14

大模型蒸馏技术

Qwen2.5大模型微调入门实战

2025-08-14

Qwen2.5大模型微调入门实战

知识蒸馏技术原理详解:从软标签到模型压缩的实现机制

2025-08-14

知识蒸馏技术原理详解:从软标签到模型压缩的实现机制

Shall We Pretrain Autoregressive Language Models with Retrieval

2025-08-13

Shall We Pretrain Autoregressive Language Models with Retrieval

漫谈 LLM 解码策略-采样策略贪心解码、随机采样、Top-K 采样、Top-P 采样、核采样和搜索策略Beam Search

2025-08-13

漫谈 LLM 解码策略-采样策略贪心解码、随机采样、Top-K 采样、Top-P 采样、核采样和搜索策略Beam Search

Faiss入门及应用经验记录

2025-08-13

Faiss入门及应用经验记录

2024

Lora大模型微调

2024-09-11

Lora大模型微调

Seq2Seq

2024-09-11

两万字讲清楚：现在的AI产品有多难做？

2024-09-05

两万字讲清楚：现在的AI产品有多难做？

数据加载中