放射光実験の大容量データの即時圧縮技術を開発 -SPring-8のデータを8,600分の1に圧縮-(プレスリリース)
- 公開日
- 2026年04月03日
- BL35XU(非弾性・核共鳴散乱)
2026年4月3日
理化学研究所
公益財団法人高輝度光科学研究センター
国立大学法人東北大学
理化学研究所(理研)放射光科学研究センター制御情報・データ創出基盤グループの初井宇記グループディレクター、高輝度光科学研究センター研究 DX 推進室の西野玄記主幹研究員(理研放射光科学研究センター客員研究員)、城地保昌室長(理研放射光科学研究センタービームライン制御解析チームチームリーダー)、東北大学大学院理学研究科の齋藤真器名准教授(理研放射光科学研究センター客員研究員(研究当時))らの共同研究グループは、放射光実験におけるX線画像検出器から出力される大容量データを即時圧縮するデータ処理基盤を開発し、大型放射光施設「SPring-8」[1](BL35XU)において構築し、運用を始めました。 論文情報 |
FPGAデータ処理基板を収めた計算機
背景
大型放射光施設では、物質中の原子や分子の構造や運動を高精度に観測するため、検出器の高速化・高精細化が急速に進んでいます。時間変化を捉える測定では、1秒間に数万枚の画像を取得する必要があり、1回の実験で生成されるデータ量は飛躍的に増大しています。
本研究で対象としたQEGS実験では、84万画素の検出器を17.4kHzで動作させることで、ナノ秒(10億分の1秒)スケールの原子・分子の動きを観測します。その結果、1週間当たり19PBもの大容量データが発生します。
従来のビームライン計算機環境では、このようなデータをそのまま保存・転送・解析することは現実的に難しく、解析には数日以上を要することもありました。そのため、実験中に結果を確認して測定条件を最適化することが困難でした。
さらに、SPring-8-IIでは光源の高輝度化に伴ってデータ量はさらに増加し、EB級に達すると見積もられています。このため、取得後にまとめて処理する従来の運用から、取得と同時に処理して結果を返すデータ処理基盤への転換が不可欠です。
研究手法と成果
本研究では、検出器から出力される毎秒27GBのデータをそのまま保存するのではなく、データ生成直後に前処理と可逆圧縮を行う新しいアプローチを採用しました。具体的には、FPGAデータ処理基板に搭載したFPGA(書き換え可能な半導体回路)上で、画素ごとの背景信号を補正し、ノイズを除去するしきい値処理、短時間に連続して得られる画像を統合する処理を実行するようにしました。これらの処理により、科学的に意味のある信号を保ちながら、重複した情報や信号以外の成分を減らしました。その結果、データの情報量(エントロピー)を低減でき、後段の可逆圧縮の効率が大きく向上しました。
FPGAで前処理されたデータは、ビームラインの計算機において可逆圧縮を施しました。その結果、平均約8,600分の1という高い圧縮率を達成し、実際の1週間の実験では約19PBの元データを約2.2TBまで削減しました。圧縮後のデータはSPring-8内のデータセンターへ自動転送され、取得から2〜3分以内に保存されます。この可逆圧縮処理により、転送に必要なネットワーク帯域も大幅に削減されました。
データセンターでは、高性能計算機(HPC)を用いた並列解析を行います。SPring-8データセンターではHPC利用基盤としてOpen OnDemand[6]が導入されており、本研究ではその既存基盤の上に、QEGS実験専用の解析アプリケーション群を構築しました。これにより、専門的なコマンド操作を必要としないウェブブラウザベースの解析環境を実現しました。
本研究の成果は、高効率な圧縮技術の実現にとどまらず、検出器によるデータ生成から、FPGAによる前処理、可逆圧縮、転送、高性能計算機による並列解析、さらにウェブブラウザから利用可能な解析環境までを一体化した統合データ処理基盤(図1)を、実際のユーザー実験で運用し、その有効性を実証した点にあります。
図1 本研究で構築した検出器データ処理基盤の概念図
測定データの前処理、圧縮、転送、解析に至るまでのデータの流れを左から右へ示している。左から順に、① 毎秒27GBのデータを生成するX線画像検出器、② FPGAデータ処理基板を収めた計算機、③ SPring-8施設内のデータセンター、④ 高性能計算機上で動作する解析アプリケーションの結果表示画面を示す。
今後の期待
本研究で構築したデータ処理基盤は、放射光科学における「測定後に解析する」運用から「測定しながら解析する」運用への転換を可能にしました。これにより、実験中に結果を確認しながら測定条件を最適化できるようになり、研究効率の向上が期待されます。
SPring-8-IIではEB級データが見込まれており、本研究の統合データ処理基盤はその中核基盤技術となります。
さらに共同研究グループは、1日当たり約30PBのデータ生成が見込まれる半導体向けX線タイコグラフィー顕微鏡[7]への応用にも取り組んでいます。タイコグラフィーでは、ナノメートルレベル(nm、1nmは10億分の1メートル)の分解能で3次元再構成を行うため、QEGSを上回る大容量データが発生します。本研究の即時圧縮・転送・並列解析の技術は、こうした次世代X線計測の実現に不可欠な基盤となります。
本研究のデータ処理技術は、放射光施設やX線自由電子レーザー(XFEL)[8]に特有のものではなく、高速かつ高解像度な検出器から大量の画像データが出力される計測装置に広く応用できる可能性があります。大容量データの処理は多くの先端計測分野に共通する課題であり、本技術はその解決を支える基盤技術として期待されます。
共同研究グループ
理化学研究所 放射光科学研究センター
制御情報・データ創出基盤グループ
グループディレクター 初井宇記 (ハツイ・タカキ)
特別研究員(研究当時) 平木俊幸 (ヒラキ・トシユキ)
エンジニアリング部門 エンジニアリングチーム
テクニカルスタッフⅠ 尾﨑恭介 (オザキ・キョウスケ)
テクニカルスタッフⅠ 本城嘉章 (ホンジョウ・ヨシアキ)
高輝度光科学研究センター
研究DX推進室
主幹研究員 西野玄記 (ニシノ・ハルキ)
(理研 放射光科学研究センター 客員研究員)
室長 城地保昌 (ジョウチ・ヤスマサ)
(理研 放射光科学研究センター ビームライン制御解析チーム
チームリーダー)
加速器部門 加速器制御グループ 機器制御チーム
チームリーダー 山鹿光裕 (ヤマガ・ミツヒロ)
(理研 放射光科学研究センター 客員研究員)
分光・イメージング推進室 精密分光チーム
特任研究員 依田芳卓 (ヨダ・ヨシタカ)
(理研 放射光科学研究センター 客員研究員)
研究員 永澤延元 (ナガサワ・ノブモト)
(理研 放射光科学研究センター 客員研究員)
東北大学 大学院理学研究科 物理学専攻
准教授 齋藤真器名(サイトウ・マキナ)
(理研 放射光科学研究センター 客員研究員(研究当時))
大学院生(研究当時) 小林 正 (コバヤシ・マサシ)
(理研 放射光科学研究センター 研修生(研究当時))
研究支援
本研究は、理化学研究所放射光科学研究センターSACLA/SPring-8基盤開発プログラム2022-2023によるサポートを受けて実施され、日本学術振興会(JSPS)科学研究費助成事業基盤研究(B)「ガラスの力学特性を支配するJohari-Goldstein緩和過程の普遍的機構の解明(研究代表者:齋藤真器名、JP24K00592)」、科学技術振興機構(JST)戦略的創造研究推進事業CREST「階層的時空構造と動的不均一性から紡ぐナノ力学機構の理解と制御(研究代表者:山本潤、JPMJCR2095)」の助成を受けて行われました。
本研究で用いたFPGAデータ処理基板は、理化学研究所と東京エレクトロン デバイス株式会社が共同で開発しました。
また、本研究におけるデータ処理基盤の構築は、グローリーテクニカルソリューションズ株式会社および日東コンピューターサービス株式会社の協力を得て実施しました。
【補足解説】
[1] 大型放射光施設「SPring-8」
理化学研究所が所有する兵庫県の播磨科学公園都市にある世界最高性能の放射光を生み出す大型放射光施設で、利用者支援などは高輝度光科学研究センター(JASRI)が行っている。SPring-8(スプリングエイト)の名前はSuper Photon ring-8 GeVに由来する。SPring-8では、放射光を用いてナノテクノロジー、バイオテクノロジーや産業利用まで幅広い研究が行われている。
[2] SPring-8-II
SPring-8の大幅な性能向上を目指した次期計画の名称。詳しくは、2024年10月24日プレスリリース「 SPring-8光源大改修の設計指針を公表」を参照。
[3] ガンマ線準弾性散乱(QEGS)実験
放射光を用いて、物質中の原子・分子の動きを100ピコ秒(1ピコ秒は1兆分の1秒)〜100ナノ秒(1ナノ秒は10億分の1秒)の時間領域で調べる測定手法。散乱されたX線のわずかなエネルギー変化を解析することで、材料や生体関連試料などの微視的な動的挙動を評価できる。詳しくは、2024年6月18日プレスリリース「10億分の1秒の原子運動を見る放射光技術を開発」を参照。
[4] CITIUS検出器
理化学研究所が開発した、画素サイズ72.6マイクロメートル(µm)、フレームレート17.4kHzで動作するX線画像検出器。本研究で用いたシステムでは、3枚のセンサーを組み合わせて合計84万画素の検出器として運用されている。
[5] FPGA
製造後でも回路構成を変更できる集積回路。並列処理や入出力制御を柔軟に実装できるため、計測装置などでデータ処理や制御を組み込む用途に用いられる。FPGAはField Programmable Gate Arrayの略。
[6] Open OnDemand
高性能計算機(HPC)を、ウェブブラウザ上の画面から利用できるようにする仕組み。コマンド操作に頼らずに、計算の実行、ファイルの管理、利用状況の確認などを行える。
[7] X線タイコグラフィー顕微鏡
試料にX線を当てる位置を少しずつ変えながら多数のデータを取得し、そのデータを計算機で再構成することで、試料内部の構造を高い分解能で可視化する顕微鏡。厚みのある試料にも適用でき、半導体デバイスなどの内部構造を非破壊で観察する技術として期待されている。
[8] X線自由電子レーザー(XFEL)
X線領域におけるレーザーのこと。従来の半導体や気体を発振媒体とするレーザーとは異なり、真空中を高速で移動する電子ビーム(自由電子)を媒体とするため、原理的な波長の制限はない。また、数フェムト秒(1フェムト秒は1,000兆分の1秒)の超短パルスを出力する。XFELはX-ray Free Electron Laserの略。
発表者・機関窓口 |
- 現在の記事
- 放射光実験の大容量データの即時圧縮技術を開発 -SPring-8のデータを8,600分の1に圧縮-(プレスリリース)
ml.riken.jp