|
早稲田大学
山名 早人
教授
機関別共同研究
Discovery Saga
論文分野別Discovery Saga
研究テーマDiscovery Saga
協賛企業
共同研究先:Research Organization of Information and Systems, National Institute of Informatics
Academic
共同研究数 3
Conference Paper
2014
IEEE : Institute of Electrical and Electronics Engineers
Image annotation fusing content-based and tag-based technique using support vector machine and vector space model
サポートベクターマシンとベクトル空間モデルを用いたコンテンツベースとタグベースの融合による画像アノテーション
Shan Bin Chan, Hayato Yamana, Duy Dinh Le, Shinichi Satoh
【抄録】
In this paper, we propose a new image annotation method by combining content-based image annotation and tag-based image annotation techniques. Content-based image annotation technique is adopted to extract 'loosely defined concepts' by analyzing pre-given images' features such as color moment (CM), edge orientation histogram (EOH), and local binary pattern (LBP), followed by constructing a set of SVMs for 100 loosely defined concepts. A base-vector for each concept, similar to tag-based image annotation technique, is then constructed by using SVMs' predicted probabilistic results for sample-images whose main concepts are known. Finally cosine similarity between a query-image vector and the base vector is calculated for each concept. Experimental results show that our proposed method outperforms content-based image annotation technique by about 23% in accuracy. © 2014 IEEE.
【抄録日本語訳】
本論文では、コンテンツベースの画像アノテーションとタグベースの画像アノテーションの技術を組み合わせた新しい画像アノテーション手法を提案する。コンテンツベースの画像アノテーションでは、カラーモーメント(CM)、エッジ方向ヒストグラム(EOH)、ローカルバイナリパターン(LBP)などのあらかじめ与えられた画像の特徴を分析し、「疎な概念」を抽出した後、100個の疎な概念に対してSVMのセットを構築する手法を採用する。次に、主概念が既知のサンプル画像に対してSVMが予測した確率的な結果を用いて、タグベースの画像アノテーション手法と同様に、各概念のベースベクトルを構築する。最後に、クエリ画像ベクトルとベースベクトルのコサイン類似度を概念ごとに計算する。実験の結果、提案手法はコンテンツベースの画像アノテーション手法を約23%の精度で上回ることが示された。© 2014 IEEE.
Conference Paper
2013
IEEE : Institute of Electrical and Electronics Engineers
A negative sample image selection method referring to semantic hierarchical structure for image annotation
画像アノテーションのための意味的階層構造を参照したネガティブサンプル画像選択法
Shan Bin Chan, Hayato Yamana, Shin'Ichi Satoh
【抄録】
When SVM is adopted for image annotation, we know that high quality sample images will improve image recognition accuracy. Images with the same visual/semantic features are adopted as positive sample images, and images with different visual/semantic features are adopted as negative sample images. But it is labor intensive in high quality sample images selection, especially when collecting by visual features. Most researchers randomly choose positive and negative sample images for classifier training. In many applications, adopting different negative sample image datasets will vary annotation accuracy. In this research, we will discuss the accuracy between different negative sample images dataset collected by semantic features. We adopted Image Net as image dataset in this study, and we adopted Word Net for building semantic hierarchical tree. Semantic hierarchical structure tree is adopted to calculate the distance between each node. Then we adopt this distance relationship to prepare positive and negative sample images. We prepare one baseline method and suggest six different negative sample images selection methods for experiment. The binary SVM classifier training and prediction is implemented to compare the accuracy and Mean Reciprocal Rank (MRR) between baseline and each proposed method. Our results show that if we select uniform amount of negative sample images in each distance in the semantic hierarchical tree, we will achieve highest accuracy. © 2013 IEEE.
【抄録日本語訳】
SVMを画像アノテーションに採用する場合、サンプル画像の品質が高ければ画像認識精度が向上することが分かっています。視覚的・意味的特徴が同じ画像はポジティブサンプル画像として採用され、視覚的・意味的特徴が異なる画像はネガティブサンプル画像として採用されます。しかし、特に視覚的特徴で収集する場合、高品質なサンプル画像の選定には手間がかかる。多くの研究者は、分類器の学習用に正と負のサンプル画像をランダムに選択しています。多くのアプリケーションでは、異なるネガティブサンプル画像のデータセットを採用することで、アノテーションの精度に差が生じる。本研究では、意味的特徴によって収集された異なる陰性サンプル画像のデータセット間の精度を議論する。本研究では、画像データセットとしてImage Netを採用し、意味階層木の構築にはWord Netを採用した。意味階層構造木は、各ノード間の距離を計算するために採用した。そして、この距離関係を利用して、正と負のサンプル画像を用意する。ベースラインとして1つの方法を用意し、実験用に6つの異なるネガティブサンプル画像の選択方法を提案する。そして、2値SVM分類器の学習と予測を行い、ベースラインと各提案手法の精度とMRR(Mean Reciprocal Rank)を比較する。その結果、意味階層木の各距離において一定量のネガティブサンプル画像を選択すれば、最も高い精度を達成できることがわかった。© 2013 IEEE.
Article
2006 9 7
National Institute of Informatics (NII)
Building a terabyte-scale web data collection "NW1000G-04" in the NTCIR-5 WEB task
NTCIR-5 WEB タスクにおけるテラバイト規模の WEB データ集「NW1000G-04」の構築
Masao Takaku, Keizo Oyama, Akiko Aizawa, Haruko Ishikawa, Kengo Minamide, Shin Kato, Hayato Yamana, Junya Hayashi
NII Technical Reports
【抄録】
We built a terabyte-scale web data collection, NW1000G-04, which was used in the NTCIR-5 WEB task. This report describes the process of building the collection and some statistics of it in detail.
【抄録日本語訳】
NTCIR-5 WEBタスクで使用されたテラバイト規模のWEBデータ集NW1000G-04を構築した。本報告では、このデータ集の構築過程といくつかの統計情報を詳細に記述する。