dbt年次イベント Coalesce on the road Tokyoに参加してきました!
IT技術

はじめに
今回は2025-12-11に行われたCoalesce on the road Tokyoの参加レポートです。
dbtのCoalesceといえばラスベガスで開催されるイベントですが、そのワールドツアーの1日イベントが東京で初開催!コア開発者やプロダクトマネージャーが実際に日本へ来て話をするとても熱いイベントです。
英語の発表も多いですが、ニアリアルタイムな翻訳の仕組みがあるので安心です。
印象に残ったセッションと感想をまとめてみました!
Keynote: Rewrite
dbt LabsのVP of Product Marketing、Clarke Pattersonのセッションです。
今回のKeynoteでは「Rewrite」をテーマに、ポイントを3つに整理して紹介していました。

Rewrite with open standards
独自の閉じた仕様に縛られるのでなく、オープンなルールでデータインフラを考えよう、というメッセージ。
dbtはOpen Compute(BigQueryでもSnowflakeでもDatabricksでも共通のモデルで動く)という思想を持っていて、さらに Semantic Layer や BIツール、AI Agentとも自由に組み合わせられる開かれたエコシステム を志向しています。

Rewrite the rules
dbt Fusionエンジンで開発者体験の向上、コスト最適化、AIのためのコンテキストに適したデータ提供など。
これまでの開発の常識を書き換えるべき変化が起きつつあります。自動化を進めましょう。
Rewrite with AI
AIを利用して分析開発ライフサイクル全体をさらに自動化し、生産性を飛躍的に高めましょう。
次の発表につながるのですが個人的にはdbt Fusionがもたらす中心的なものは開発者体験だ、と言っていたのが印象的でした。
dbt Fusionエンジンによる次世代のデータ開発
dbt Labsのプロダクトマネージャー、Elias DeFaria氏のセッションです。
Elias氏による実際にdbt Fusionの機能を使いながら解説するデモがとてもわかりやすく刺激的なセッションでした。
dbt Fusionについて、外側はSQL、YAML、seedなどこれまで利用してきた表層の記述はそのままに、Jinjaレンダリングや依存関係構築をしているEngine部分をSDFでの技術を利用して完全に置き換えた、と説明していました。(ジャム入りのドーナツのジャム部分を入れ替えたようなもの、と例えていました)


dbt Coreよりも30倍高速
5,000〜20,000モデルになっても大丈夫です(実際筆者の現場でコンパイルに数分かかっていて苦労しています)
カラムベースのlineage
テーブルの依存関係だけでなく、カラムベースのリネージを確認できます。
さらに依存関係がわかるだけでなく何をやっているか(rename, passthrough、transformation)まで教えてくれます。(現状クエリを順番に追うことがある...)
CTEプレビュー
定義を表示できるだけでなくクリックするだけでその中身をプレビューできて大変便利そうです。(現状手動で調べている...)
リアルタイムなエラー検出
クエリ実行するとエラーになる記述がある場合すぐに表示されるので実際に実行するよりも早く気づくことができます。(無駄な実行をしていることがある...)
インパクト分析・カラムのリネーム伝搬
カラムをリネームしたときに下流のモデルへの影響を表示し、カラム名書き換えも自動でできます。
Compare changes
クエリ変更をしたことでデータがどのように変わるかをレポートしてくれます!!(自分で調べている...)

Keynoteでdbt Fusionは開発者体験をもたらすといっていましたがまさにその通りと感じました。
普段自分で調べていることを苦労なくちょっとしたアクションでできる機能が多いです。
早く本番環境で使いたいですね。
費用対効果の高いデータ運用
dbt LabsプロダクトマネージャーのReuben McCreanor氏のセッションです。
dbt Fusionのstate-aware orchestrationを中心としたコスト改善の話です。
dbtがState Aware(状態認識)していることによってコードやデータに変更があった箇所だけを実行することで、無駄なジョブ実行を減らせます(Build only what's needed)
さらにモデルのfreshnessの設定やテストの効率化などで29%のコスト削減ができるという話をした時は会場から拍手が上がっていました。
それによって経理と仲良くなれるとも言っていました。
コスト最適化の新機能はまだこれからも出てくるそうです。

state-aware orchestrationについてはdbt Labsのこちらの記事にも詳しく書かれています。
https://www.getdbt.com/blog/announcing-state-aware-orchestration
dbt platform導入前の不安を解消する - リアルな一ヶ月検証記
freee社の小越氏のセッションです。
dbt platform(dbt Cloud)の導入はコスト・経理の懸念、稟議が通らないと言った話はたまに聞きますが、緻密でとても参考にできそうな検証内容で、これからdbt platformを導入する企業はベースにできそうなくらいです。
また、非エンジニアには何をどのように導入するか、といったようなさらに具体的な内容もあり参考になりました。


検証についてはブログ記事にも詳しく書かれています。
Recruitの大規模データ基盤を支えるAEの進化
リクルート社の森田氏のセッションです。
大量のクエリが実行される大規模データ分析基盤についての話です。以下のようなトピックが話されました。
- プロダクトのグロース視点・新規事業視点・経費視点など様々な目的で見られるデータは複雑な要件が多くディメンショナルモデルに落とし込むことが難しいためドメインごとに区切ってマートをつくる
- モニタリング分析ではバッチで前日分のデータを見ればいいが、レコメンドシステムに利用するにはニアリアルタイムの鮮度が必要でいかに素早くマートにするかの戦いをしている(そのなかでincremental, freshness, data_testなどの機能が活躍)
- AIエージェントは目的別に構築してプロンプトをルーティングする
- エージェント利用にはコンテキスト・ガードレールが必要でそれをうまく蓄積していく必要がある


とても実践的な話が展開されていました。
dbt on dbt
dbt Labsのソリューションアーキテクトの伊藤氏のセッションです。
dbt MCP Serverを利用した2つのデモが発表されました。
デモ1
ビジネスユーザーがチャット形式で分析するようなシナリオです。
Claude Desktopなど誰でも利用しやすいインターフェースから、チャットで分析・集計のリクエストを送ってdwhからデータを集計してもらうことができていました。可視化や短い考察も入れてくれています。
セマンティックレイヤーで売上などの定義を標準化できます。


デモ2
データパイプラインのトラブル(日次レポートで新規の売上が急に減った)を調査・解決するようなシナリオです。
GitHubのMCPでIssueを読み取り所から始まり、問題が発生しているレイヤーの切り分け、調査して原因(ステータスのロジックの不具合)にたどり着いていました。
周辺情報をdbtに集結させることでdbt MCP Server、AIエージェントによる自動化がとても捗りそうです。

まとめ
新しい情報や実践的な知見を知ることができたり、参加者の方とデータ業務や技術の情報交換をしたり、様々な刺激と学びが得られた1日でした!
今回得られた知見を今後に活かしていきたいと思います。
おまけ
おしゃれな軽食にギターの生演奏があったり、「少し休憩に入ります、15分後にUNION ALLしましょう!(=集まりましょう)」というユーモアの効いたアナウンスがあったり、クイズの正解者にjaffle君(チュートリアルのデータセットでお馴染み)の人形が配られたり遊び心も多く楽しかったです!


ライトコードでは、エンジニアを積極採用中!
ライトコードでは、エンジニアを積極採用しています!カジュアル面談等もございますので、くわしくは採用情報をご確認ください。
採用情報へ
競馬が好きです。





