2y ago

Outperforming larger language models with less training data and smaller models

Distilling step-by-step: Outperforming larger language models with less training data and smaller model sizes

2y ago

Distilling step-by-step: Outperforming larger language models with less training data and smaller model sizes

2y ago

Distilling step-by-step: Outperforming larger language models with less training data and smaller model sizes

2y ago

Outperforming LLMs with less training data and smaller model sizes

No comments