|
早稲田大学
山名 早人
教授
機関別共同研究
Discovery Saga
論文分野別Discovery Saga
研究テーマDiscovery Saga
協賛企業
共同研究先:Fujitsu
Corporate
共同研究数 1
Conference Paper
2005
Springer
PlusDBG: Web community extraction scheme improving both precision and pseudo-recall
(Last author)
PlusDBG: 精度と擬似想起の両方を向上させるウェブコミュニティ抽出スキーム
Naoyuki Saida, Akira Umezawa, Hayato Yamana
Lecture Notes in Computer Science
【抄録】
This paper proposes PlusDBG to improve both precision and pseudo-recall by extending the conventional Web community extraction scheme. Precision is defined as the percentage of relevant Web pages extracted as members of Web communities and pseudo-recall is defined as the sum of the number of relevant Web pages extracted as members of Web communities. The proposed scheme adopts the new distance parameter defined by the relevance between a Web page and a Web community, and extracts the Web community with higher precision and pseudo-recall. Moreover, we have implemented and evaluated the proposed scheme. Our results confirm that the proposed scheme is able to extract about 3.2-fold larger numbers of members of Web communities than the conventional scheme, while maintaining equivalent precision. © Springer-Verlag Berlin Heidelberg 2005.
【抄録日本語訳】
本論文では、従来のWebコミュニティ抽出方式を拡張し、精度と擬似想起の両方を向上させるPlusDBGを提案する。精度はWebコミュニティのメンバーとして抽出された関連Webページの割合,擬似再現性はWebコミュニティのメンバーとして抽出された関連Webページの数の和として定義される.提案方式では,Web ページとWeb コミュニティ間の関連性によって定義される新しい距離パラメータを採用し,より高い精度と擬似再現率を持つWeb コミュニティを抽出する.さらに,提案方式を実装し,評価を行った.その結果,提案方式は従来方式と同等の精度を保ちながら,約3.2倍の数のウェブコミュニティメンバーを抽出できることが確認された.© Springer-Verlag Berlin Heidelberg 2005.