ニュースリリース概要
日立と東大、ビッグデータ検索を最大135倍高速化する「動的プルーニング技術」を開発
製造業のトレーサビリティや医療・金融分野のデータ利活用を支援し、社会課題解決に貢献
株式会社日立製作所
国立大学法人東京大学

株式会社日立製作所(以下、日立)と国立大学法人東京大学(以下、東大)は、ビッグデータ分析の高速化に向けて、相互に複雑なつながりを持つデータ(以下、グラフ構造データ*1)の検索速度を大幅に向上する「動的プルーニング*2技術」を開発しました。従来、データベース内でデータ分析を行う際のグラフ構造データを順次たどる処理は、再帰問合せ処理*3と呼ばれる手続きで行われ、不要なデータを繰り返し読み取る必要があり、検索速度が低下するという課題がありました。本技術では、再帰問合せ処理中に得られる情報をもとに、次に読み取るデータの範囲をリアルタイムかつ正確に特定することによって不要なデータ読み取りを削減し、検索速度を大幅に向上させます。今回、製造業の製品出荷判定を対象にした検証では、データ検索速度を従来比で最大135倍*4向上できることを確認しました。これにより、製品の設計から製造、流通、保守までの工程や部品の追跡などのグラフ構造データの分析業務を迅速化し、トレーサビリティ*5の品質向上に貢献します(図1)。
今後、日立と東大は、製造業のほか、社会保障での診療パターンの分析による疾病リスクの予測や金融分野での不正アクセスの検出などへの本技術の適用をめざすとともに、社会課題の解決に向けた技術革新を推進していきます。
なお、本成果の一部は、2025年6月22日から27日にドイツのベルリンで開催されるデータベース分野の国際会議2025 ACM SIGMOD/PODS International Conference on Management of Dataで発表予定です*6。
*1 グラフ構造データ: ノード(頂点)とエッジ(辺)を用いてデータを表現する構造。ノードはデータの対象物を表し、エッジはノード間の関係性やつながりを表す。
*2 プルーニング: 問合せの実行時に、問合せに不要なデータの読み取りをスキップすることで問合せを高速化する手法。
*3 再帰問合せ処理: データベースやプログラムにおいて、問題を小さな部分に分割し、それを繰り返し解決することで全体の問題を解決する方法。グラフ構造のデータを辿る手法であり、特に親子関係や階層構造を持つデータを取得するために用いられる。
*4 自社従来技術との比較。
*5トレーサビリティ: 製品の原材料や部品の調達から生産、流通、販売、保守までの各工程で製造者、仕入先、販売元などを記録し、履歴を追跡可能な状態にしておくこと。
*6 Norifumi Nishikawa, Akira Shimizu, Akira Ito, Shinji Fujiwara, Yuto Hayamizu, Masaru Kitsuregawa, and Kazuo Goda. 2025. Dynamic Pruning for Recursive Joins. In Companion of the 2025 International Conference on Management of Data (SIGMOD-Companion ’25), June 22–27, 2025, Berlin, Germany. ACM, 15 pages.