理光通过模型融合开发了与GPT-4相当高性能的日语LLM（700亿参数）

理光集团 · 09/29 11:00

株式会社リコー（社長執行役員：大山晃)は、米Meta Platforms社が提供する「Meta-Llama-3-70B」の日本語性能を向上させた「Llama-3-Swallow-70B＊1」をベースモデルに、同社のInstructモデルからベクトル抽出したChat Vector＊2とリコー製のChat Vector＊3をリコー独自のノウハウでマージすることで、高性能な日本語大規模言語モデル（LLM＊4）を新たに開発しました。これにより、リコーが開発・提供するLLMのラインナップに、米OpenAIが開発したGPT-4と同等レベルの高性能モデルが追加されました。

生成AIの広がりにより、企業が業務で活用できる高性能なLLMのニーズが高まっています。しかし、LLMの追加学習は、コストが高く、時間もかかるという課題があります。その課題に対して、複数のモデルを組み合わせて、より高性能なモデルをつくる「モデルマージ＊5」は効率的な開発手法として注目されています。

リコーは、モデルマージのノウハウと、LLM開発の知見に基づき、今回、新たなLLMを開発しました。本技術は、企業独自のプライベートLLMや特定業務向けの高性能なLLMの開発の効率化につながるものです。

リコーは、自社製LLMの開発だけではなく、お客様の用途や環境に合わせて、最適なLLMを低コスト・短納期でご提供するために、多様で効率的な手法・技術の研究開発を推進してまいります。

評価結果＊6（ELYZA-tasks-100）

複雑な指示・タスクを含む代表的な日本語のベンチマーク「ELYZA-tasks-100」において、今回リコーがモデルマージの手法で開発したLLMはGPT-4と同等レベルの高いスコアを示しました。また、比較した他のLLMはタスクによって英語で回答するケースが見られましたが、全てのタスクに対して日本語で回答して高い安定性を示しました。

ベンチマークツール（ELYZA-tasks-100）における他モデルとの比較結果（リコーは最下段）

リコーのLLM開発の背景

労働人口減少や高齢化を背景に、AIを活用した生産性向上や付加価値の高い働き方が企業成長の課題となっており、その課題解決の手段として、多くの企業がAIの業務活用に注目しています。しかし、AIを実際の業務に適用するためには、企業固有の用語や言い回しなどを含む大量のテキストデータをLLMに学習させ、その企業独自のAIモデル（プライベートLLM）を作成する必要があります。

リコーは国内でもトップクラスのLLMの開発・学習技術をベースに、企業向けプライベートLLMの提供や、社内文書の活用を後押しするRAGの導入支援等、様々なAIソリューションの提案が可能です。

＊1Llama-3-Swallow-70B：東京工業大学情報理工学院情報工学系の岡崎直観教授と横田理央教授らの研究チームと国立研究開発法人産業技術総合研究所によって開発された日本語LLMモデル。＊2Chat Vector：指示追従能力を持つモデルからベースモデルのウェイトを差し引き、指示追従能力のみを抽出したベクトル。＊3リコー製のChat Vector：Meta社のベースモデル「Meta-Llama-3-70B」に対し、リコー独自開発を含む約1万6千件のインストラクションチューニングデータで追加学習したInstructモデルから抽出したChat Vector。＊4Large Language Model（大規模言語モデル）：人間が話したり書いたりする言葉（自然言語）に存在する曖昧性やゆらぎを、文章の中で離れた単語間の関係までを把握し「文脈」を考慮した処理を可能にしているのが特徴。「自然文の質問への回答」や「文書の要約」といった処理を人間並みの精度で実行でき、学習も容易にできる技術。＊5モデルマージ：複数の学習済みのLLMモデルを組み合わせて、より性能の高いモデルを作る新たな方法のこと。GPUのような大規模な計算リソースが不要で、より手軽にモデル開発ができるとして、近年注目されています。＊62024年9月24日時点の評価結果。「スコア」の算出に際して、生成文の評価には「GPT-4」（gpt-4-0613）と「GPT-4o」（gpt-4o-2024-05-13）を使用し、英語での回答による減点は行っていない。「英語で回答されたタスクの割合」は100タスクのうち英語で回答されたものの割合。

このニュースリリースはPDFファイルでもご覧いただけます

リコー、モデルマージによってGPT-4と同等の高性能な日本語LLM（700億パラメータ）を開発（224KB・全2ページ構成）

※社名、製品名は、各社の商標または登録商標です。

理光公司（社长执行役员：大山晃）基于美国Meta Platforms公司提供的「Meta-Llama-3-70B」，改进了其日本性能，推出了基于「Llama-3-Swallow-70B＊1」的基础型号，通过合并公司的Instruct模型中的Chat Vector＊2和理光制造的Chat Vector＊3，结合理光独有的技术，开发了高性能的日本大型语言模型（LLM＊4）。这样一来，理光开发和提供的LLM系列中增加了与美国OpenAI开发的GPT-4相当的高性能模型。

随着生成AI的普及，企业对可用于业务的高性能LLM的需求日益增加。然而，LLM的追加学习存在高成本和时间耗费的挑战。针对这一问题，将多个模型结合以创建更高性能模型的"模型融合＊5"技术备受关注，被视为一种高效的开发方法。

理光公司基于模型融合的技术与LLM开发的经验，开发了新的LLM。这项技术有助于提高企业内部私有LLM以及特定业务用途的高性能LLM的开发效率。

除了开发公司自家的LLM外，为了在客户的用例和环境下提供最适合的LLM且成本低、交付快，理光将推动各种多样且高效的方法和技术的研究与开发。

评估结果＊6（ELYZA-tasks-100）

在包含复杂指示和任务的代表性日本语基准测试「ELYZA-tasks-100」中，理光通过模型融合方法开发的LLM展示出与GPT-4相当水平的高分。此外，与其他LLM相比，它展现出针对所有任务都用日语回答且表现出高度稳定性，而其他模型在某些任务中以英语回答。

基准工具（ELYZA-tasks-100）中与其他模型的比较结果（理光位于最下方）

Ricoh的LLM开发背景

在劳动力减少和人口老龄化的背景下，提高生产力和提供高附加值的工作方式成为企业增长的难题，为解决此问题，许多企业开始注意使用AI进行业务活用。然而，要将AI应用到实际的应用中，就需要将包含企业专有术语和语句的大量文本数据学习到LLM中，并创建企业独有的AI模型（专用LLM）。

以国内顶尖的LLM开发/学习技术为基础，Ricoh可以提供企业专用LLM的服务，以及推广使用内部文档的RAG等各种AI解决方案的建议。

*1Llama-3-Swallow-70B: 由东京工业大学信息工程学院的岡崎直观教授和横田理央教授等研究团队与国立研究开发法人产业技术综合研究所共同开发的日本语LLM模型。*2Chat Vector: 从具有指令遵循能力的模型中减去基础模型的权重，提取出指令遵循能力的向量。*3由理光制造的Chat Vector: 从包含约1.6万条指令调整数据的Instruct模型经过附加学习后提取的Chat Vector ，该模型是对Meta公司的基础模型“Meta-Llama-3-70B”进行了个性化开发。*4大规模语言模型: 特点在于可以理解跨越文本中不同单词之间关系的“语境”，从而处理存在于人类所说或写的自然语言中的歧义或波动。可以以人类级别的准确性执行诸如“对自然文的问题回答”和“文档摘要”之类的处理，并且这种技术能够轻松学习。*5模型合并: 是一种结合多个预训练LLM模型以创建性能更高模型的新方法。不需要像GPU这样大规模的计算资源，因此更容易开发模型，近年来备受关注。*62024年9月24日时点的评估结果。在计算“分数”时，使用了“GPT-4”（gpt-4-0613）和“GPT-4o”（gpt-4o-2024-05-13）以评估生成文，在英语回答中没有扣分。英语回答任务的比例是回答为英语的任务占100个任务的比例。

您可以在PDF文件中查看此新闻稿

理光通过模型融合开发了等同于GPT-4的高性能日语LLM（700亿参数），总共224KB，分为2页。

※公司名称和产品名称均为各自公司的商标或注册商标。

声明：本内容仅用作提供资讯及教育之目的，不构成对任何特定投资或投资策略的推荐或认可。更多信息

リコー、モデルマージによってGPT-4と同等の高性能な日本語LLM（700億パラメータ）を開発

理光通过模型融合开发了与GPT-4相当高性能的日语LLM（700亿参数）

評価結果＊6（ELYZA-tasks-100）

リコーのLLM開発の背景

関連ニュース

このニュースリリースはPDFファイルでもご覧いただけます

评估结果＊6（ELYZA-tasks-100）

Ricoh的LLM开发背景

相关股票新闻

您可以在PDF文件中查看此新闻稿

リコー、モデルマージによってGPT-4と同等の高性能な日本語LLM（700億パラメータ）を開発

理光通过模型融合开发了与GPT-4相当高性能的日语LLM（700亿参数）

評価結果＊6（ELYZA-tasks-100）

リコーのLLM開発の背景

関連ニュース

このニュースリリースはPDFファイルでもご覧いただけます

评估结果＊6（ELYZA-tasks-100）

Ricoh的LLM开发背景

相关股票新闻

您可以在PDF文件中查看此新闻稿

风险及免责提示

声明