Vポイントマーケティング|TECH LABの Tech Blog

TECH LABのエンジニアが技術情報を発信しています

ブログタイトル

LLM

論文紹介 "iAgent: LLM Agent as a Shield between User and Recommender Systems"

こんにちは。データサイエンスグループの木下です。 今回は、レコメンド×AIエージェントに関する論文である、 iAgent: LLM Agent as a Shield between User and Recommender Systemsという論文を紹介したいと思います。 1.Instruction 背景と課題 現在の推薦…

CCC社内で運用中のチャットボットのご紹介

CCCでは全社で利用される単機能のAIチャットボットと、 その他各種ドキュメント参照機能のついたRAG(Retrieval-Augmented Generation)機能を持った チャットボットを絶賛運用中です。

SnowflakeのCortex AISQLを一通り使ってみました!

こんにちは、CCCMKホールディングスAIエンジニアの三浦です。 先日サンフランシスコで開催されたSnowflakeの年次サミット"SNOWFLAKE SUMMIT25"のキーノートセッションの動画がアップされていて、最近そちらを閲覧しました。面白いアップデートが紹介されてい…

DatabricksでVLM(Vision Language Model)の推論と評価を試してみました。

こんにちは、CCCMKホールディングスAIエンジニアの三浦です。 今週、アメリカサンフランシスコで開催されるDatabricksのイベントに現地参加します。どんなアップデートが聞けるかとても楽しみです。 現地は気温が東京に比べて低めなので、風邪を引かないよう…

Snowflake Cortex Searchでセマンティック検索!

こんにちは、CCCMKホールディングス AIエンジニアの三浦です。気温が急に高くなって、まるで夏が来たみたいです。朝と夜はまだ涼しいので、出かける時に何を着ていくのか悩んでしまいます。 Cortex Search コードの実行環境と検証に使用したデータ ライブラ…

LLMに潜在空間で思考させる"Chain of Continuous Thought"についての論文を読みました。

こんにちは、CCCMKホールディングス AIエンジニアの三浦です。 先日海に行きました。景色もそうですが、海の近くでは普段の生活であまり感じない匂いなんかも感じられて新鮮な気持ちになりました。 はじめに LLMの推論精度を向上させる方法に"CoT(Chain of T…

OpenAIの新モデル「GPT-4.5」について調査してみました

こんにちは。AIエンジニアリングGの矢澤です。 先日、昔遊んでいたゲームに関する動画を見ました。 昔のゲームは、ハードウェアに関する制約がある中でメモリを効率化したりCPUの強さを調整するために、様々な工夫を行っていたという話を聞いたことがありま…

NeurIPS 2024に参加しました(オーラル編)

こんにちは。AIエンジニアリンググループの矢澤です。 NeurIPS 2024の参加報告として、これまでチュートリアルや招待講演についての一部を共有しました。 今回は、学会のメインイベントであるオーラルセッションについて、特に気になった発表を紹介したいと…

ExpertGenQAによる自動QA生成を試してみました(実装編)

こんにちは。AIエンジニアリンググループの矢澤です。よろしくお願いします。 前回の記事で、ExpertGenQAによる自動QA生成の概要や実験結果について話しました。 本記事では、実験で使用したスクリプトを共有し、処理の流れや論文との差異について説明します…

LangGraphでAzure DatabricksのTableに自然言語で問い合わせが出来るアプリを作ってみました!

はじめに やりたいこと 使用したデータ 利用したLLM データの準備 データセットのダウンロード Tableへの書き込み COMMENTの付与 アプリの構築 LLMとアプリのState rooting normal_chat create_sql execute_sql answer ビルド 動作確認 まとめ はじめに こん…

ExpertGenQAによる自動QA生成を試してみました(概要・実験編)

こんにちは。AIエンジニアリンググループの矢澤です。 先日、マーケティング関連の展示会に参加しました。 特に専門家の方の講演が興味深く、ユーザー視点での商品・サービス開発を目指す上で参考になるお話でした。 マーケティングの知識やセンスは奥が深く…

"DeepRAG: Thinking to Retrieval Step by Step for Large Language Models"という論文を読みました。

こんにちは、CCCMKホールディングスTECH LABの三浦です。 最近日本の歴史の漫画を読んでいました。子どもの頃は近代~現代の内容は難しい、と感じていたのですが、大人になってから改めて見ると学ぶことがとても多く、考えさせられることがたくさんあるんだ…

LLMの性能を測る指標をベンチマーク結果から取得する方法について、論文を読みました。

こんにちは、CCCMKホールディングス TECH LABの三浦です。 昨年参加したAI・機械学習カンファレンス"NeurIPS2024"のポスターセッションで発表されていた論文の中で、面白いアプローチだな、と印象に残っている論文がいくつかあります。 そのうちの1つがこち…

Contrastive Activation Addition(CAA)の振る舞いのベクトルを抽出して可視化してみる。

対象にした振る舞い 使用したデータセット 対象にするLLM モデルのどこに注目するのか 可視化方法 PyTorchで中間表現を取得する方法 実行コードの一部の紹介 いくつかの散布図を描画 なぜAとBで傾向が違うのか・・・ まとめ こんにちは、CCCMKホールディング…

Azure OpenAIによるコードレビューを試してみました

こんにちは、AIエンジニアリンググループの矢澤です。 最近テストの採点や添削指導について考える機会がありました。 選択式の問題や数学の定理のような答えが一つに決まっている問題はともかく、自由記述形式の問題などでは正確な採点が難しいこともあるの…

LLMの振る舞いを調整するContrastive Activation Addition(CAA)について、論文を読んで手法を調べてみました。

こんにちは、CCCMKホールディングス TECH LABの三浦です。 成人式の休日も終わり、そろそろ2025年も本格スタート、という気持ちになってきました。今年は"整理整頓"をもっとうまく出来るようになりたいな・・・と考えています。身の回りもそうですが、自分の…

DPO(Direct Preference Optimization)を使ってLLMの回答を調整する方法を試してみました。

こんにちは、CCCMKホールディングス TECH LABの三浦です。 あけましておめでとうございます。2025年がはじまりました。今年もまた、色々なことを試していきたいなと思います! 昨年末にNeurIPS 2024に参加してから、LLMの"Post Training"というアプローチに…

2024年も終わりなので、来年の目標達成のための計画を作ってくれるMulti-Agentの仕組みを作ってみました。

こんにちは、CCCMKホールディングスTECH LABの三浦です。 今年ももう終わりですね。この時期は「今年こんなことあったなぁ」と振り返りつつ、「来年こんなことが出来るようになりたいなぁ」と考える時期だと思います。今年、AI領域ではLLMの活用として"Agent…

LLMの評価の観点について、調べてみました。

こんにちは、CCCMKホールディングスTECH LABの三浦です。 今日はクリスマスイブですね。クリスマスが過ぎるとあっという間にお正月で、毎年この時期には独特な雰囲気があるなぁと感じています。 参考資料 LLMの評価 汎用的言語性能 ドメイン特化性能 安全性…

事前学習におけるトークンの選択の重要性についての論文"RHO-1:Not All Tokens Are What You Need"を読みました。

こんにちは、CCCMKホールディングスTECH LABの三浦です。 今年もあと1か月ですね。振り返ってみると色々とあった1年ですが、個人的には夏の厳しい暑さが印象に残っています。残りわずかですが、2024年の最後まで頑張ろうと思います。 学習中のトークンごとの…

Chatアプリケーションが開発出来る"Chainlit"をPostgreSQLと接続して会話データの永続化を実現してみました。

こんにちは、CCCMKホールディングスTECH LABの三浦です。 あっという間に11月も終わりですね!クリスマスまであと1か月なので、ブログのサムネイルもクリスマス仕様になりました! はじめに Chainlitのデータ永続化の仕組み 今回試した構成 プロジェクトの構…

DatabricksでOllamaを使ったLLMアプリの実験と検証をやってみました!

こんにちは、CCCMKホールディングスTECH LABの三浦です。 だいぶ気温が下がって、空気が乾燥してきたように感じます。すぐに手がしもやけになってしまうので、外に出る時は手袋をするようにしないと・・・と思います。 はじめに 先日Databricksの年次のイベ…

LangGraphでMap-reduce型のテキスト参照処理を作ってみました。

はじめに 参照するドキュメント Graphの構造 実装 ライブラリのインストール GraphのState ルーティング機能の実装 Nodeの実装 並列処理の実行部分 Graphの構築 実行する 課題 まとめ こんにちは、CCCMKホールディングスTECH LABの三浦です。 最近寒いですね…

人格設定されたLLMはどんな文章を生成する?論文を読んでまとめてみました。

Big Five personality traits LIWC-22 論文における問題設定 実験の設定 LLM personaの構築 ストーリーライティング 評価のステップ BFIテスト LIWC-22による分析 ストーリーの評価 ストーリーからの人格特性の推計 結果 RQ1: LLM personaがBFIテストで自身…

Azure DatabricksでRAG AgentのModel Servingへのデプロイ・モニタリングまでを実装してみる!

テストからPoCへ RAG Agentの概要 PlaygroundからExportする Vector Indexにクエリ実行するFunctionが動かない・・・ agent Notebookの変更箇所 追加パッケージのインストール configの記述と出力 LLMとToolの定義 driverの変更箇所 追加パッケージのインス…

GraphRAGを使ったKnowledge-Graphの構築にチャレンジ!

はじめに GraphRAG GraphRAGのKnowledge Graph構築フロー Phase1. Documentの分割 Phase2. Graph情報の生成 Phase3. Graph情報の強化 Community Graph Embedding Phase4. Community情報の要約 Phase5. Documentの処理 Phase6. Graphの可視化 Knowledge Graph…

LLMアプリケーション開発フレームワーク"Haystack"を試してみる。

こんにちは、CCCMKホールディングスTECH LABの三浦です。 最近は手書きのメッセージを送ることが少なくなりましたが、1年に2回、今でも手書きのメッセージを書くのが年末年始の年賀状と敬老の日です。先日久しぶりに手紙を書いたのですが、「頭で書きたい」…

LLMが物事を判断する時どのように事前知識を利用しているのかを可視化する手法に関する論文を読みました。

こんにちは、CCCMKホールディングスTECH LABの三浦です。 この前初めて訪れた街を朝早起きしてジョギングしたのですが、普段見られない景色や雰囲気を感じられてとても楽しかったです。いつか色々なところを旅して朝走ることを趣味に出来たらいいな、と思い…

Agentに関する論文"A Survey on Large Language Model based Autonomous Agents"を読んでAgentシステムの構成についてまとめてみました。

こんにちは、CCCMKホールディングス TECH LAB三浦です。 8月ももうすぐ終わりですね。日中はまだまだ暑いですが、夜に洗濯物を取り込んでいたら虫の鳴き声が聞こえてきて、夏の終わりだなぁとしみじみとしてしまいました。 "Autonomous Agent(自律型エージェ…

llama.cpp各種モデル18パターンの速度比較(Llama 3.1/Gemma 2/Phi-3…, GPU/x86_64/arm64)※おすすめモデル有り

はじめに こんにちは。テックラボの高橋です。 本記事ではllama.cppで実行可能なモデルを片っ端から実行して良さげなモデルを探していきます。 なお、llama.cppの詳細やパラメータ設定については以下の記事をご参照ください。 techblog.cccmkhd.co.jp モデル…