XGenとは?Salesforceの隠れた宝石級大規模言語モデルを徹底解説

情報セキュリティのポスター #1

情報セキュリティのポスター #2

目次

結論は?

心藍/XGen専門官

・Salesforceが開発した大規模言語モデル!

・Salesforce AI ResearchはSalesforceの研究部門だよ!


・オープンソース&商用利用OK!

・大規模言モデルの中で一番長く文章を読める!


・ただし、GPT-4oには及ばないけど、実用性と特化力でガチ強い!

つまり?

心藍/XGen専門官

営業やるならXGenで!

XGenの始まり:2023年の衝撃デビュー、XGen-7B

XGenの歴史は2023年に遡る

Salesforce AI Researchが立ち上げたXGen-7Bシリーズがスタート。

当時、オープンソースLLMの主流(LLaMA、Falcon、MPTとか)はコンテキスト長が2K〜4Kトークンくらいで息切れしてたのに、こいつは8Kシーケンス長で訓練済み。 つまり、長い文章や会話、ドキュメントを一気に処理できるのが売り。

「長文苦手な他のモデル見て笑ってるわ」って感じで登場したよ。

主なバリエーション

  • XGen-7B-4K-Base:4Kコンテキストのベースモデル
  • XGen-7B-8K-Base:8K対応の主力
  • XGen-7B-8K-Inst:指示チューニング版(チャットボット向き、研究用)

訓練データ:RedPajama、Wikipedia、StarCoderとかの公開データで1.5兆トークン

ベンチマークでは、同サイズのLLaMAやFalconと互角かそれ以上

HumanEval(コード生成)やMMLU(多岐知識テスト)でいいスコア出してる。

GitHubとHugging Faceで今もダウンロード可能。Apache 2.0ライセンスで商用OKだぜ。

XGenファミリーの進化:2024〜2025年の派生モデルたち

心藍/XGen専門官

XGenはただの7Bで終わらない!Salesforceが企業向けにガンガンと派生させてるよ!

  • xGen-Sales (2024)営業特化モデル。コールサマリー、顧客インサイト生成、パイプライントラッキングとか自動化。 Einstein Agentforceプラットフォームで使われて、データプライバシー厳守で企業ウケ抜群。
  • xGen-Code (2025)開発者向け。CodeGenシリーズの進化版で、自然言語とコード両方得意。 Agentforce for Developersでコード補完やチャットアシスタントに使われてる。
  • xGen-MM (BLIP-3, 2025)マルチモーダル版。画像+テキスト処理。 オープンソースでリリースされ、ビジュアル理解ベンチマークで同サイズモデルに勝ってる。
  • xGen-Small (2025)4B/9Bパラメータの小型版。長コンテキスト対応で、低コスト・プライバシー重視の企業向け。 8兆トークン訓練で、環境負荷も少ないエコモデル。
心藍/XGen専門官

他にもxLAM(Large Action Models)ファミリーと連携して、ただ喋るだけじゃなく行動実行できるように進化中!

XGenの強みと弱み:他のLLMと比べてどうよ?

項目XGenシリーズLLaMA/Meta系GPTシリーズ (OpenAI)
コンテキスト長8K〜長め(拡張でさらに)基本短め(拡張版あり)超長い(128Kとか)
パラメータ7Bスタート、小型版多め7B〜70B多岐非公開だけど巨大
オープンソース多くがフルオープン研究用制限多めクローズド
企業向きプライバシー・カスタム強みコミュニティ強いパワー最強だけどコスト高
専門特化Sales/Code/Multimodalあり汎用メイン汎用最強
ベンチマーク同サイズで互角〜上回る強いトップクラス

強み

長コンテキスト企業ユースケース特化。Salesforce製品と相性抜群で、データ漏れ心配なし。

弱み

GPT-4oみたいな最新トップモデルには総合力で劣るかも。派手さより実用重視だから、注目度低め。

心藍/XGen専門官

だから今読んでる読者は先取りしてるかもです!

まとめ:XGen、侮れないよ本当に

2026年の新顔たちよ。

xGen-Sales使ったら、営業メールやコールまとめが自動で神レベルに仕上がる

「これ人間が書いた方がマシじゃね?」って思ってたけど、データプライバシー守りつつ精度高くて、営業マン泣いて喜ぶだろこれ! xGen-Codeは開発者モード全開で、コード補完が速くて正確。xGen-CodeをAgentforceで動かしたら、「もう自分でコード書かなくていいんじゃね?」って思うレベル。

オープンソース部分多めで遊べるし、Salesforceユーザーなら必須級と言える!

地味とか言ってごめん、XGen! お前は隠れた最強候補だよ本当に!! 触ってみてほしい、絶対ハマるから。

author avatar
ITTI
AIの可能性に魅了され、AI副運営長を開発するために公務員を退職。現在はDXとプログラミングとインフラと3D制作を学び続けながら、推進を目指す企業へ向けて「徹底的にわかりやすい情報」を提供しています。 ITTI局での執筆記事は、すでに300記事を突破。
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

ITTIのアバター ITTI 運営長

AIの可能性に魅了され、AI副運営長を開発するために公務員を退職。現在はDXとプログラミングとインフラと3D制作を学び続けながら、推進を目指す企業へ向けて「徹底的にわかりやすい情報」を提供しています。
ITTI局での執筆記事は、すでに300記事を突破。

IT企業のAIイラスト #1

IT企業のAIイラスト #2

IT企業のAIイラスト #3

コメント

コメントする

CAPTCHA


目次