グラフ匿名化による大規模個人ゲノムデータベースの安全で効率的な検索技術の開拓
【研究キーワード】
アルゴリズム理論 / 個人ゲノム / プライバシー / 検索技術 / グラフ理論
【研究成果の概要】
ゲノム研究は善意の提供者個人の究極の個人データを用いて行う研究であるが、多くのデータ提供者は提供データを最大限活用して最大限の成果を上げることを希望している。本研究の目的は大規模個人ゲノムデータに対し、究極の個人情報ともいわれるゲノムデータの倫理的特性に合致した安全かつ効率的な検索・解析手法を実現することである。その実現のために、様々なデータを複雑に表現できるグラフ構造を活用し、必要なデータを保持しつつ匿名化を行うグラフ匿名化とよぶ手法の確立をめざしている。特に複数ゲノムをコンパクトに表現する技術として、ゲノムグラフとよばれる技術があり、このゲノムグラフを拡張することによってこれらを実現するとともに、匿名化データに対する検索・解析技術の開発も行っていくことをめざしている。本年度は、前年度に引き続き、、ゲノムグラフの新たな効率的表現をグラフ理論を活用して圧縮表現する技術の研究を行い、新たな技術開発に成功した。また、データベース公開の際のプライバシー保護技術として、χ2統計量やコクラン・アーミテージ統計量などゲノムワイド関連解析における多くの基盤的統計値に対し差分プライバシーを活用したゲノム統計値公開手法を開発することに成功した。またTDT統計量の公開を高速に計算する手法の開発にも成功した。また、それらの統計値から上位のものを公開する際のより高精度な公開手法の開発にも成功した。また、医療情報からグラフ情報を抽出する技術として重要な支援言語技術の開発も進めた。今後はこれらの技術を統合し、実際のグラフ匿名化技術の開発に向けてさらに研究を進めていく。
【研究代表者】
【研究種目】挑戦的研究(萌芽)
【研究期間】2020-07-30 - 2023-03-31
【配分額】6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)