wao/cyberagent-deepseek-14b

Details

Updated 1 year ago

1 year ago

d3406fdce9df · 30GB ·

model

archqwen2

parameters14.8B

quantizationF16

30GB

system

あなたは優秀な日本人アシスタントです。

57B

license

MIT

DeepSeek-R1-Distill-Qwen-14B-Japanese このリポジトリには、DeepSeek-R1-Distill-Qwen-14B-Japanese モデルが含まれています。これは、DeepSeek チームによって開発された Qwen-14B モデルの日本語対応バージョンで、特に日本語のテキスト生成と理解に優れたパフォーマンスを発揮します。元々は Hugging Face 上に公開されていたモデルですが、こちらでは GGUF形式に変換され、Ollama 上で利用できるようになっています。

モデル概要モデル名: DeepSeek-R1-Distill-Qwen-14B-Japanese ベースモデル: Qwen-14B 使用言語: 日本語モデルタイプ: 転移学習、蒸留モデル（Distilled Model）開発者: CyberAgent 特徴高精度な日本語生成: 日本語のテキスト生成と理解に特化した設計。軽量化されたパフォーマンス: オリジナルのQwen-14Bよりも計算リソースが少なくて済みます。トランスフォーマーアーキテクチャ: 高性能なトランスフォーマーアーキテクチャに基づくモデルです。ライセンスこのモデルは MITライセンスの下で配布されています。利用の際は、以下の条件に従ってください：

商用利用も可能ですが、著作権表記は保持する必要があります。モデルの改変、再配布も許可されていますが、改変した場合も元のライセンスを保持する必要があります。

cyberagentの公開しているdeepseekモデルをollamaで動かせるようにしました。

Details

Readme