|
早稲田大学
山名 早人
教授
機関別共同研究
Discovery Saga
論文分野別Discovery Saga
研究テーマDiscovery Saga
協賛企業
共同研究先:Mitsui & Co., Ltd.
Corporate
共同研究数 1
Conference Paper
2013
IEEE : Institute of Electrical and Electronics Engineers
IC-BIDE:Intensity constraint-based closed sequential pattern mining for coding pattern extraction
(Last author)
IC-BIDE:符号化パターン抽出のための強度制約に基づく閉じた逐次パターンマイニング
Hiromasa Takei, Hayato Yamana
【抄録】
We propose intensity constraint-based closed sequential pattern mining algorithm, called IC-BIDE, for a coding pattern extraction. Source code often contains frequent patterns of function calls or control flows, i.e., "coding patterns." Previous studies used sequential pattern mining to extract coding pattern; however, these algorithms have not been optimized for coding pattern extraction, which results in useless patterns as well as long execution times. We propose a new constraint, called "intensity constraint," in order to enhance closed sequential pattern mining and efficiently extract coding patterns. Our proposed algorithm is based on BI-Directional Execution (BIDE), an algorithm proposed expressly for closed sequential pattern mining. BIDE algorithm is not able to adapt to constraint-based closed sequential pattern mining. We extend BIDE algorithm and prove that our extended algorithm is able to adapt to intensity constraint-based closed sequential pattern mining. Our contributions are as follow; 1) We propose a new constraint, which we call "intensity"; 2) We propose intensity constraint-based closed sequential pattern mining algorithm, which we call "IC-BIDE" algorithm. Experimental results with open source software (Bullet Physics, MySQL, and OpenCV) show that IC-BIDE algorithm successfully excludes useless pattern effectively. Moreover, our proposed method is able to accelerate the extraction by a factor of 8.9 in comparison with the BIDE algorithm. © 2013 IEEE.
【抄録日本語訳】
我々は、コーディングパターン抽出のための強度制約に基づく閉じた逐次パターンマイニングのアルゴリズム、IC-BIDEを提案する。ソースコードには、関数呼び出しや制御フローの頻出パターン、すなわち "コーディングパターン "が含まれていることが多い。先行研究では、コーディングパターンの抽出に逐次パターンマイニングを用いているが、これらのアルゴリズムはコーディングパターン抽出に最適化されていないため、無駄なパターンが発生するだけでなく、実行時間が長くなってしまう。我々は、閉じた逐次パターンマイニングを強化し、効率的に符号化パターンを抽出するために、「強度制約」という新しい制約を提案する。提案アルゴリズムは、閉じた逐次パターンマイニングのために特別に提案されたBI-Directional Execution (BIDE)をベースとしている。BIDEアルゴリズムは、制約に基づく閉じた逐次パターンマイニングに適応することができない。我々は、BIDEアルゴリズムを拡張し、我々の拡張アルゴリズムが強度制約に基づく閉じた逐次パターン採掘に適応できることを証明する。1) 強度制約と呼ばれる新しい制約を提案する。2) 強度制約に基づく閉じた逐次パターン採掘アルゴリズム(IC-BIDEアルゴリズムと呼ぶ)を提案する。オープンソースソフトウェア(Bullet Physics, MySQL, OpenCV)を用いた実験の結果、IC-BIDEアルゴリズムが無駄なパターンを効果的に排除できることが示された。さらに、提案手法は、BIDEアルゴリズムと比較して、抽出を8.9倍に高速化することができる。© 2013 IEEE.