模型

GPT-2

Q: 什么是 GPT-2？

由OpenAI发布的大型语言模型

Q: GPT-2 最近有什么新动态？

traeai 已收录 4 篇与 GPT-2 相关的内容。最新一篇是「AI Paper Review: Language Models are Unsupervised Multitask Learners (GPT-2)」，由 freeCodeCamp.org 发布。

别名：gpt2

由OpenAI发布的大型语言模型

已跟踪 4 条高相关材料

TraeAI 观察

如果只读 3 篇

AI Paper Review: Language Models are Unsupervised Multitask Learners (GPT-2)

freeCodeCamp.org · 9.2 分

GPT-2证明了仅通过无监督的下一词预测训练，大语言模型可自发涌现出多任务能力，无需任务特定微调即可实现翻译、问答和摘要等功能。

Serving Multiple Users at Once: How Continuous Batching Keeps LLM Inference Efficient

Machine Learning Mastery · 8.7 分

连续批处理（Continuous Batching）通过动态调度和 ragged batching 解决静态批处理中因填充导致的 GPU 空闲问题，使 LLM 推理在多用户场景下更高效；实测显示其可将吞吐量提升 2–3 倍，同时减少平均延迟。

As America turns 250, we put together 250 open AI milestones from the US: open models, datasets, dem...

clem 🤗(@ClementDelangue) · 8.5 分

美国AI开放科学250年里程碑揭示：开放生态推动创新，当前AI领域正面临封闭化风险。

AI Paper Review: Language Models are Unsupervised Multitask Learners (GPT-2)

freeCodeCamp.org5月11日3193 字 (约 13 分钟)

GPT-2 demonstrated that training a large language model solely on unsupervised next-word prediction enables emergent multitask capabilities, performing translation, QA, and summarization without task-specific fine-tuning.

入选理由：GPT-2在800万网页文本上训练，参数量达15亿，首次展示零样本迁移能力。

FeaturedArticle#GPT-2#Large Language Models#Zero-Shot Learning#Transformer英文

Serving Multiple Users at Once: How Continuous Batching Keeps LLM Inference Efficient

Machine Learning Mastery6月1日6661 字 (约 27 分钟)

Continuous batching resolves static batching’s padding-induced GPU idleness by enabling dynamic scheduling and ragged batching, significantly improving throughput and latency in multi-user LLM inference—real-world tests show 2–3x throughput gains and up to 50% lower average latency.

入选理由：静态批处理因固定长度填充导致短请求空等，最长请求决定整批完成时间，GPU 利用率常低于 60%