deepseek-v3

2.9M Downloads Updated 11 months ago

A strong Mixture-of-Experts (MoE) language model with 671B total parameters with 37B activated for each token.

671b

Models

View all →

Name

5 models

Size

Context

Input

deepseek-v3:latest

404GB · 160K context window · Text · 11 months ago

deepseek-v3:latest

404GB

160K

Text

deepseek-v3:671b

latest

404GB · 160K context window · Text · 11 months ago

deepseek-v3:671b latest

404GB

160K

Text

Readme

Note: this model requires Ollama 0.5.5 or later.

DeepSeek-V3 achieves a significant breakthrough in inference speed over previous models. It tops the leaderboard among open-source models and rivals the most advanced closed-source models globally.

References

GitHub

Paper