T
traeai
登录

产品

FineWeb-Edu

Hugging Face的1.3万亿token教育数据集。

相关材料

已收录 1 条与 FineWeb-Edu 相关的内容,按评分排序。

How to Create an LLM Dataset | FineWeb Overview

如何创建LLM数据集 | FineWeb概述

Hugging Face5076 字 (约 21 分钟)
85

Hugging Face的FineWeb数据集提供开源框架,通过Common Crawl清洗生成15万亿token训练集,显著提升LLM性能。

入选理由:FineWeb基于96个Common Crawl快照,清洗后生成15万亿token数据集。

精选视频#LLM#数据集#Hugging Face#Common Crawl英文

跨材料问答 · FineWeb-Edu

回答基于:FineWeb-Edu 相关 1 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容