研究者を探す
北 研二
2024年11月15日更新
- 職名
- 名誉教授 (2023.4)
- 電話
- 研究者総覧に該当データはありませんでした。
- 電子メール
- 研究者総覧に該当データはありませんでした。
- 学歴
- 1981/3: 早稲田大学 理工学部 数学科卒業
1992/10: 早稲田大学 博士(工学) - 学位
- 博士(工学) (早稲田大学) (1992年10月)
- 職歴・経歴
- 1983/4: 沖電気工業株式会社入社
1987/9: 株式会社ATR自動翻訳電話研究所出向
1989/7: 米国カーネギーメロン大学機械翻訳研究所客員研究員
1991/4: ATR自動翻訳電話研究所主任研究員
1992/8: 沖電気工業株式会社退社
1992/9: 徳島大学大学院工学研究科担当
1992/9: 徳島大学工学部講師
1993/5: 徳島大学工学部助教授
1999/8: 徳島大学大学院工学研究科博士後期課程情報システム工学専攻(応用知識システム設計論,特別演習,特別研究)D○合判定
2000/4: 徳島大学工学部教授
2002/4: 徳島大学高度情報化基盤センター教授
2008/4: 徳島大学高度情報化基盤センター・センター長
2010/4: 徳島大学大学院ソシオテクノサイエンス研究部教授
- 専門分野・研究分野
- 計算機科学 (Computer Science)
情報工学 (Information Engineering)
情報検索 (Information Retrieval)
自然言語処理 (Natural Language Processing)
音声言語処理
メディア情報学
2024年11月15日更新
- 専門分野・研究分野
- 計算機科学 (Computer Science)
情報工学 (Information Engineering)
情報検索 (Information Retrieval)
自然言語処理 (Natural Language Processing)
音声言語処理
メディア情報学 - 担当経験のある授業科目
- 研究者総覧に該当データはありませんでした。
- 指導経験
- 研究者総覧に該当データはありませんでした。
2024年11月15日更新
- 専門分野・研究分野
- 計算機科学 (Computer Science)
情報工学 (Information Engineering)
情報検索 (Information Retrieval)
自然言語処理 (Natural Language Processing)
音声言語処理
メディア情報学
- 研究テーマ
- ベクトル空間情報検索モデル, 確率的言語モデル, マルチメディア情報検索, クロスメディア情報検索, オーディオ指紋に基づく音楽同定, 脳波による感性情報処理, 医用画像処理, 医療AI, AI歯科診断支援 (情報検索 (information retrieval), 自然言語処理 (natural language processing), 計算言語学 (computational linguistics), コーパス (corpus), 潜在的意味解析, 多次元検索 (multidimensional search), ハミング空間検索, オーディオ指紋 (audio fingerprint), 音楽検索 (music retrieval), 画像検索 (image retrieval))
- 著書
- 北 研二, 松本 和幸, 吉田 稔, 獅々堀 正幹, 大野 将樹 :
AI・機械学習のためのデータ前処理 [実践編], --- Pythonでデータサイエンス ---,
科学情報出版, 東京, 2021年8月.- (要約)
- 人工知能(AI)の研究自体は,計算機の黎明期のころから行われてきた.1950年代後半から60年代にかけての「第1次人工知能ブーム」,1980年代から90年代にかけての「第2次人工知能ブーム」とよばれる時期を経て,現在は「第3次人工知能ブーム」の真っただ中である.今回の第3次ブームが,従来の第1次および第2次のブームと大きく違うところは,多くの分野で,人間の能力に迫る知的情報処理システムが出現しているところにある.この背景には,さまざまなことが考えられるが,最も大きな要因は,各種のビッグデータの蓄積とそのビッグデータを利用可能とするIT技術の加速度的な進展,深層学習を始めとする新しい機械学習パラダイムの出現であろう.さて,AIシステムや機械学習システムを成功に導く鍵の1つがデータの前処理である.機械学習の本質は,大量のデータの背後に潜む構造や規則性あるいは普遍性を学習することにより,未知のデータに対する予測や推論を正しく行うところにある.しかし,学習の元となるデータの品質が悪いと,正しく学習することができず,その結果として得られるシステムの精度も芳しくなくなる.高精度なシステムを構築するためには,粗悪なデータを排除するとともに,データを加工し学習しやすい形に変換するという工程が重要となる.これこそがまさしく前処理が担っている部分である.極論すると,前処理の成否が機械学習システム全体の品質を担保しているとさえいえる.一説によると,AIや機械学習システム構築の現場では,エンジニアが作業に携わる時間の6割∼8割はデータの収集と前処理に費やされているといわれている.効率的なシステム開発のためには,前処理技術の習得が必須である.本書は,従来の機械学習やデータサイエンスの書籍では十分に扱われていなかった前処理技術に特に焦点をあて,技術の単なる解説だけではなく,実際に動くプログラムを通して,読者が理解できるような実践的な書を目指した.本書の姉妹編である『基礎編』では,基本的な前処理技術について紹介しているが,本書『応用編』では,さらに高度な前処理技術と,テキスト・画像・音響・音楽等のメディアデータに対する前処理技術について解説した.
- (キーワード)
- 人工知能 (artificial intelligence) / 機械学習 (machine learning) / Python / 前処理 / データ解析 (data analysis) / データマイニング (data mining) / Google Colab / ビッグデータ / 特徴選択 / 次元削減 / NumPy / pandas / scikit-learn / matplotlib / TensorFlow / Keras / データクリーニング / 特徴抽出 / スケーリング / 標準化 / ノーマライゼーション (normalization) / 正規化 / データクレンジング / データ拡張 / ビニング / 離散化 / カテゴリカルデータ / カテゴリ特徴量 / One-hotエンコーディング / One-hotベクトル / ラベルエンコーディング / 頻度エンコーディング / カウントエンコーディング / 順位エンコーディング / ラベルカウントエンコーディング / 特徴量ハッシング / 大局的ハッシュ空間 / 列ごとのハッシュ空間 / MurmurHash3 / エンティティ埋め込み / 分散表現 / 埋め込み / Table2Vec / 不均衡データ / リサンプリング / アンダーサンプリング / ダウンサンプリング / オーバーサンプリング / アップサンプリング / ランダム・オーバーサンプリング / ランダム・アンダーサンプリング / ENN / SMOTE / ADASYN / 時系列データ / 点過程 / 窓付き統計値 / 青空文庫 / 分かち書き / 形態素解析 (morphological analysis) / MeCab / バイグラム / トライグラム / Nグラム / SentencePiece / ストップワード / ストップワードリスト / ベクトル空間モデル (vector space model) / Bag-of-Words / tf-idf / gensim / トピックモデル / 潜在ディリクレ配分法 / ギブスサンプリング / word2vec / スキップグラム / 連続Bag-of-Words / ネガティブサンプリング / 階層ソフトマックス法 / 畳み込みニューラルネットワーク / 順伝搬 / 活性化関数 / 逆誤差伝搬 / 2乗和誤差 / 交差エントロピー / エポック / 勾配降下法 / バッチ学習 / オンライン学習 / ミニバッチ学習 / 反復 (iteration) / 畳み込み層 / プーリング層 / 全結合層 / 特徴マップ / ゼロパディング / 最大プーリング / 平均プーリング / ドロップアウト層 / 確率的勾配降下法 / シアー変換 / ファインチューニング / VGG16 / サンプリング周波数 / 量子化ビット数 / カクテルパーティー効果 / スペクトルサブトラクション / 調波打楽器音分離 / 短時間フーリエ変換 / 逆短時間フーリエ変換 / ウィナーフィルタ / 音源分離
Mining Numbers in Text: A Survey,
IntechOpen, Jul. 2021.- (出版サイトへのリンク)
- ● Publication site (DOI): 10.5772/intechopen.98540
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.5772/intechopen.98540
(DOI: 10.5772/intechopen.98540) 北 研二, 西村 良太, 松本 和幸 :
AI・機械学習のためのデータ前処理 [入門編], --- Pythonでゼロからはじめる ---,
科学情報出版, 東京, 2021年6月.- (要約)
- 2010年ごろを境に,ビッグデータという言葉が,わたしたちの身の回りに急速に浸透し始めた.同時に,ビッグデータから機械学習に基づき知的なAI システムを構築することが昨今のブームとさえなってきている.本書は,これらの機械学習システムを構築するうえで避けては通れない,データの前処理の部分を中心に解説している.AI などの機械学習システムを第一に想定しているが,本書で説明する各種の技術は,ビッグデータから有用な知識を獲得するデータマイニングやデータ分析などにも有効に用いることができる. さて,ビッグデータという言葉は耳に心地よく,なんとなく宝の山のように感じるかもしれないが,実はビッグデータは玉石混交であり,宝とゴミが入り混じっている.さらには,データの規模が大きくなればなるほどゴミも増え,その中から宝を取り出すのがますます困難になってくる.コンピュータサイエンスの分野では,``Garbage In, Garbage Out" (略してGIGO) という警句がある.文字通り,「ゴミからはゴミしか得られない」 「ゴミを入れればゴミが出てくる」 ことを意味しているが,この警句はまさに機械学習の一面を言い当てている.よい機械学習システムを構築するためには,データからゴミを排除し,データを学習しやすい形に加工するという作業が重要となってくるが,これこそがまさしく前処理の真髄である. 最近は,TensorFlow やKeras をはじめとする数多くの機械学習用のフレームワークやライブラリが無償で利用可能であり,これらのフレームワークやライブラリを利用することで,一見,プログラミングの敷居は低くなってきているようにみえる.公開されている機械学習用のデータセットを利用して,誰もが簡単にAI システムを作ることができる.しかし,独自のデータセットを用いて,独自のシステムを構築する場合には,大きな問題が立ちはだかっている.よくいわれていることであるが,現実のデータは汚い.データをそのまま使えば,それこそ ``Garbage In, Garbage Out" の事態に陥る.現実のデータから,有用なAI システムを構築できるかどうかは前処理の成否にかかっているとさえいえる.また,一説によると,実際のAI や機械学習システム構築の現場では,エンジニアが作業に携わる時間の6 割~ 8 割はデータの収集と前処理に費やされているともいわれている. 本書では,従来の機械学習の書籍では十分に扱われていなかった前処理技術に焦点をあて,技術の単なる解説だけではなく,実際に動くプログラムを通して,読者が理解できるような実践的な書を目指した.本書には姉妹編として 『実践編』 も出版が計画されているが,『実践編』ではより高度な前処理技術と,テキスト・画像・音響・音楽等のメディアデータに対する前処理技術について解説した.本書『 入門編』 とあわせてご活用いただきたい.
- (キーワード)
- 人工知能 (artificial intelligence) / 機械学習 (machine learning) / Python / 前処理 / データ解析 (data analysis) / データマイニング (data mining) / Google Colab / ビッグデータ / 特徴選択 / 次元削減 / NumPy / pandas / scikit-learn / matplotlib / TensorFlow / Keras / データクリーニング / 特徴抽出 / スケーリング / 標準化 / ノーマライゼーション (normalization) / 正規化 / データクレンジング / データ拡張 / ビニング / 離散化 / 外れ値 / 四分位範囲 / 箱ひげ図 / スミルノフ・グラブス検定 / 欠損値 / リストワイズ除去 / ペアワイズ除去 / 単一代入法 / 多重代入法 / フィルタ法 / カイ二乗検定 / 分散分析 (analysis of variance) / ピアソン相関係数 / 主成分分析 / 非負値行列因子分解 / 正準相関分析 / 線形判別分析 / カーネル主成分分析 / t-SNE / UMAP / 多次元尺度構成法 / 自己組織化写像 (self-organizing map) / 自己符号化器 / SMOTE
Analysis of Information Spreading by Social Media based on Emotion and Empathy,
InTechOpen, Sep. 2019.- (要約)
- The number of social media users has increased exponentially in recent times,and various types of social media platforms are being introduced. While socialmedia has become a convenient communication tool, its use has caused varioussocial problems. Some users who cannot imagine the emotions their posts mayinduce in readers cause what is termed as the flaming phenomenon. In somecases, users intentionally repeat strong remarks for self-advertisement. To identifythe cause of this phenomenon, it is necessary to analyze the posted contents or thepersonalities of the users who cause the flaming. However, it is difficult to reach ageneralized conclusion because each case varies depending on the circumstancesand individual. In this chapter, we study the phenomenon of information spreadingvia communication on social media by conducting a detailed analysis of replies andnumber of retweets in Japanese, and we reveal the relation between the feedback onsuch posts and the emotions or empathy they result in.
- (キーワード)
- social media / information diffusion / flaming / buzz / Twitter
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.5772/intechopen.88886
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.5772/intechopen.88886
(DOI: 10.5772/intechopen.88886) Kazuyuki Matsumoto, Hayato Shimizu, Minoru Yoshida and Kenji Kita :
Time-Series Analysis of Video Comments on Social Media,
Worlds largest Science, Technology & Medicine Open Access book publisher, Jul. 2017.- (要約)
- 本研究では,コメント数の時系列分析に着目し,コメントの多数の投稿による不正を検出する手法を提案する.多数のコメント投稿により不正にコメント数を稼ぐ動画のことを,本研究では不正動画と定義する.特に,我々の提案手法では,不正動画と人気動画のコメントの時系列分布の違いに着目する.評価結果として,我々の提案手法は,ベースライン手法よりも高い精度を得ることができた.
- (キーワード)
- video comments / shared videos / comment analysis, / time-series analysis
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.5772/intechopen.68636
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.5772/intechopen.68636
(DOI: 10.5772/intechopen.68636) Kazuyuki Matsumoto, Fuji Ren, Minoru Yoshida and Kenji Kita :
Refinement by Filtering Translation Candidates and Similarity Based Approach to Expand Emotion Tagged Corpus,
Jan. 2017.- (要約)
- テキストからの感情推定において,既存の日英の並列感情コーパスを用いて学習データを異なる言語に変換する方法を提案する.対訳辞書では,コーパスに含まれる各文の単語ごとに翻訳候補が抽出され,抽出された訳語候補を感情推定に大きく寄与する単語の集合に絞り込み,訓練データとして用いた.さらに,単語分散表現を用いて,タグ付けされていないテキストを利用してコーパス拡張を試みた.機械学習アルゴリズムを用いた評価実験の結果,拡張された感情コーパスの有効性を明らかにすることができた.
- (キーワード)
- 感情コーパス / 日英対訳コーパス / 感情推定
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-319-52758-1_15
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85011342735
(DOI: 10.1007/978-3-319-52758-1_15, Elsevier: Scopus) 邰 暁英, 北 研二 :
信息检索技术导论(情報検索技術入門),
科学出版社, 北京, 2006年9月.- (要約)
- 本书系统地介绍了信息检索的原理与技术.具体内容包括:基于向量空间模型的检索,全文信息检索的各种方法及实现算法,图像检索技术基于Web信息检索等.本书注重概念与实用性的统一,书中配有实例,每章后配有习题,以方便读者理解,复习,巩固所学知识. (本書は,情報検索の原理と技術を紹介している.ベクトル空間モデルや全文検索アルゴリズム,画像検索技術,Web情報検索などについて説明している.)
レポート作成指導ハンドブック, --- 徳島大学FD推進ハンドブック.第3号,第9巻 ---,
大学開放実践センター, 徳島, 2005年1月.- (要約)
- 入学初年次生のレポート作成指導をするための具体的な事例を示した指導書(p.1-p.30).本書の必要部分をコピーして学生に配布できるように,学生を読者にした記述スタイルを取っている.レポート作成手順を示し,学生が従来戸惑うことの多かった部分に具体的事例を示すとともに,最近問題となっている著作権などに関連する注釈や引用の具体例を明記した.またレポート作成の手助けとなるよう徳島大学付属図書館ホームページ利用法も示した.
Corpus Linguistics: Readings in a Widening Discipline, --- Automatically Extracting Collocations from Corpora for Language Learning ---,
Continuum International Publishing, London, Aug. 2004.- (要約)
- 連語表現(コロケーション)は,単語間の共起情報を与える言語学的に重要な知識源である.大規模言語データであるコーパスから,連語表現を自動抽出する方法,および連語表現の外国語学習における重要性について述べた.
応用言語学事典, --- 一部項目執筆 ---,
研究社, 東京, 2003年4月.- (要約)
- 応用言語学事典の1項目である「隠れマルコフモデル(Hidden Markov Model)」について説明した.
情報検索アルゴリズム,
共立出版株式会社, 東京, 2002年1月.- (要約)
- 前半部分では,情報検索の概要,情報検索の適用分野や関連分野,情報検索システムの性能評価など,情報検索全般に関わる基礎事項について説明した.また,後半部分では,情報検索の具体的な例として,ベクトル空間モデルに基づく類似文書検索手法,文字列照合に基づく全文検索手法,索引を用いた全文検索手法などについて説明した.
確率的言語モデル,
東京大学出版会, 東京, 1999年11月.- (要約)
- 言語データ(コーパス)に基づいた自然言語処理の中核的技術である確率的言語モデルのうち,代表的なモデルであるNグラムモデル,隠れマルコフモデル,確率文法,最大エントロピーモデルについて詳細に説明した.また,確率的言語モデルの応用例として,形態素解析および品詞付け,単語のクラスタリング,構文的愛昧性の解消,言語の識別と分類などについて説明した.
Terminology and Knowledge Engineering, --- JCKE Multilingual Corpus of Major Asian Languages ---,
TermNet, Vienna, Aug. 1999.- (要約)
- 主要なアジア系言語である日本語,中国語,韓国語と英語から成る多言語コーパスの開発について述べた.我々の開発した多言語コーパスは,多言語に対する同じ内容の文が収録されているばかりではなく,言語間での文の対応付けがなされており,コンピュータ処理が容易になっているという利点を持っている.
- (キーワード)
- corpus
音声言語処理,
森北出版, 東京, 1996年11月.- (要約)
- コーパスに基づいた音声言語処理の中核をなす音声言語の確率モデルとして,N-gramモデル,隠れマルコフモデル,確率文脈自由文法について述べるとともに,これらのモデルの音声認識や自然言語処理への応用について述べた.
自動翻訳電話,
株式会社 オーム社, 東京, 1994年1月.- (要約)
- 自動翻訳電話及びそれに関連する音声言語処理技術(音声認識技術,言語翻訳技術,音声合成技術,データベース技術)についての書であり,担当セクションでは,隠れマルコフモデル(HMM)と文脈自由文法を用いた連続音声認識の手法と評価実験結果について述べた.
Generalized LR Parsing, --- GLR Parsing in Hidden Markov Model ---,
Kluwer Academic Publishers, Boston, USA, Oct. 1991.- (要約)
- GLR(Generalized LR)解析法を用いた音声認識の探索範囲の縮小法について述べ,GLR と HMM を組み合わせることにより,効率的な連続音声認識系が実現できることを説明した.本書で提案したHMM-LR法では,GLRは単語や音韻の予測・生成モデルとして用いられる.
Readings in Speech Recognition, --- ATR HMM-LR Continuous Speech Recognition System ---,
Morgan Kaufmann Publishers, California, USA, Oct. 1990.- (要約)
- 高精度の連続音声認識を達成するためには,音響的な情報に加え,言語的な情報の利用が必要不可欠である.本書では,HMM音韻認識と拡張LR構文解析法を統合化した HMM-LR 連続音声認識システムのシステム構成と評価について述べた.HMM-LR連続音声認識システムは,自然言語の文法から得られる予測的な情報を用いて探索空間を縮小することにより,効率的に音声認識を実行することができる.
- 論文
- Zipaer Mayinuer, Minoru Yoshida, Kazuyuki Matsumoto and Kenji Kita :
Using Machine Learning to Classify Information Related to Child Rearing of Infants from Twitter,
Advances in Machine Learning & Artificial Intelligence, Vol.4, No.2, 32-40, 2023. Motonobu Yoshida, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
System to Correct Toxic Expression with BERT and to Determine the Effect of the Attention Value,
Communications in Computer and Information Science, Vol.1842, 239-253, 2023.- (要約)
- This paper describes an extended experiment on a system that converts sentences with toxic expressions into safe sentences, along with the evaluation and influence of the system. In recent years, toxicity on social media has created many problems. We evaluated the effectiveness of the proposed system for identifying toxic sentences using a prediction model based on Bidirectional Encoder Representations from Transformers (BERT) and then converting them into safe sentences using attention values and a score that indicates whether the sentences are appropriate after the predictive conversion. Six patterns of methods were tested, with Pattern 6 being the most effective for mitigating toxicity. This pattern is a technique that changes the way to take the top sentences of a beam search for each number of treatments, in addition to converting words with an attention value above a threshold and their adjacent words and phrases and words registered in the toxic dictionary. We used multiple indicators to judge the effectiveness of this method and evaluated its ability to make the text safe while preserving its meaning.
- (キーワード)
- Toxic expression / BERT / 分類 (classification) / Text correction / Attention value
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-031-43471-6_11
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85174230206
(DOI: 10.1007/978-3-031-43471-6_11, Elsevier: Scopus) Hidetoshi Nakao, Msakazu Imaoka, Mitsumasa Hida, Ryota Imai, Misa Nakamura, Kazuyuki Matsumoto and Kenji Kita :
Determination of individual factors associated with hallux valgus using SVM-RFE,
BMC Musculoskeletal Disorders, Vol.24, No.1, 534, 2023.- (要約)
- Introduction This cross-sectional study aimed to determine the factors related to hallux valgus (HV) and their importance using support vector machine-recursive feature elimination (SVM-RFE). Methods A total of 864 participants aged 18 years were enrolled. The Manchester scale was used to determine the presence of HV (summed scores for both feet 4). The questionnaire included items such as age, sex, height, weight, and foot measurements. These internal factors were analyzed to determine if they are related to HV using SVM-RFE. Results The results of tenfold cross-validation using SVM-RFE revealed that the numbers of feature selections were 10, 10, and 9 for age, sex, and body weight, respectively, and these factors were shown to be related to HV. HV was found to be more common in women than in men (women, 24.9%; men, 7.6%), but the sex difference was not significant in older people. Conclusion Age and sex were found to be important factors associated with HV identified via feature selection using SVM-RFE.
- (キーワード)
- feature selection / Hallux Valgus / Manchester Scale / SVM-RFE
- (徳島大学機関リポジトリ)
- ● Metadata: 118876
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1186/s12891-023-06303-2
- (文献検索サイトへのリンク)
- ● PubMed @ National Institutes of Health, US National Library of Medicine (PMID): 37386376
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85163790710
(徳島大学機関リポジトリ: 118876, DOI: 10.1186/s12891-023-06303-2, PubMed: 37386376, Elsevier: Scopus) Kazuyuki Matsumoto, Reishi Amitani, Minoru Yoshida and Kenji Kita :
Trend Prediction Based on Multi-Modal Affective Analysis from Social Networking Posts,
Electronics, Vol.11, No.21, 2022.- (要約)
- 本論文では,SNS上の投稿テキストや添付画像などのマルチモーダル情報を対象に,投稿内容から感情情報を分析し,バズや流行の発生のレベルを予測する手法を提案する.提案手法は,事前予測に用いる場合は投稿時の情報のみを用い,事後分析に用いる場合は時間誤差の情報を用いて,様々な角度から拡散スケールを分析することが可能である.具体的には,事前に学習させた汎用言語モデルBERTを用いてツイートと返信ツイートをベクトル化し,添付画像を学習させた画像認識用ニューラルネットワークモデルを用いて特徴ベクトルに変換する.また,投稿内容の感情情報を解析するために,独自の感情解析モデルを用いて,ツイート,返信ツイート,画像特徴から感情を推定し,感情特徴として入力に追加する.評価実験の結果,ツイートに言語特徴(BERTベクトル)と画像特徴を付加した提案手法は,単一特徴のみを用いた手法と比較して高い性能を達成することができた.感情特徴量の効果を明確に観測することはできなかったが,考察及び分析の結果,ツイートとその返信の一致する感情が多いほど,共感行動が発生し,いいねやRTの値が大きくなる傾向があり,結果的にツイートがバイラル化する可能性が高くなると考えられる.
- (キーワード)
- multi-modal buzz prediction / information diffusion / affective analysis
- (徳島大学機関リポジトリ)
- ● Metadata: 118006
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3390/electronics11213431
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.3390/electronics11213431
(徳島大学機関リポジトリ: 118006, DOI: 10.3390/electronics11213431) 宮下 翼, 松本 和幸, 吉田 稔, 西村 良太, 北 研二 :
糖尿病患者のブログに記述された生活習慣の抽出,
電気学会論文誌C (電子,情報,システム部門誌), Vol.142, No.10, 1144-1155, 2022年.- (要約)
- 本研究は難病患者の闘病活動における生活習慣の維持や管理を支援するシステムを構築するための一歩として,糖尿病患者の生活習慣(食事,睡眠,運動など)や病状(血圧,体調など)に関連したキーワードの抽出を目指す.糖尿病の闘病患者のブログデータを収集し,そこから双方向ゲート付きリカレントユニット(GRU)を用いて生活習慣や病状に関連したキーワードの自動抽出を行う.
- (キーワード)
- 闘病ブログ / 固有表現抽出 / 自然言語処理 (natural language processing)
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1541/ieejeiss.142.1144
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1390293633437552768
- ● Search Scopus @ Elsevier (DOI): 10.1541/ieejeiss.142.1144
(DOI: 10.1541/ieejeiss.142.1144, CiNii: 1390293633437552768) 鳥井 浩平, 誉田 栄一, 北 研二 :
AIを用いたパノラマX線画像からのカルテ入力支援システムの開発,
歯科放射線, Vol.62, No.1, 24-34, 2022年.- (要約)
- 我々は従来の診断支援に関する技術をカルテ入力支援に応用するために,詳細なアノテーションを付与した歯科データベースの構築と,パノラマ X 線画像を対象としたカルテ入力支援システムの研究開発を行ってきた.本システムは,歯検出ニューラルネットワーク,セグメンテーションニューラルネットワーク,状態診断ニューラルネットワークを用いて,パノラマ X 線画像から,歯の検出,歯式推定,歯の輪郭推定および歯の状態診断を行うことができる.本システムとパノラマ X 線画像ビューアおよび電子カルテ(レセコン)を連携することでカルテの自動入力を可能にするため,歯科医のカルテ作成に必要な労力を軽減し,診断全体 の効率化に貢献することができる.また歯科医の画像診断に AI の画像診断が加わることで画像診断における見落としを防ぐことも期待できる.ただし最終的なカルテの確定は歯科医が視診等を踏まえた診断のあとにカルテを修正して行うため,本システムは確定診断のために用いるものではなく,画像から明確に判断できうる情報を AI が事前に自動入力することを目的としている.本論文では本システムの有用性を検討するために,構築したデータベースとデータ作成のプロセスについて述べ,歯の状態診断に対する精度評価を行う.また AI システムと専門医の診断結果の比較を行う.
- (キーワード)
- パノラマX線画像 / 医用画像処理 (medical imaging) / 画像処理 (image processing) / 人工知能 (artificial intelligence) / 歯科支援システム
- (徳島大学機関リポジトリ)
- ● Metadata: 118606
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.11242/dentalradiology.62.24
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.11242/dentalradiology.62.24
(徳島大学機関リポジトリ: 118606, DOI: 10.11242/dentalradiology.62.24) Kazuyuki Matsumoto, Takumi Matsunaga, Minoru Yoshida and Kenji Kita :
Emotional Similarity Word Embedding Model for Sentiment Analysis,
Computacion y Sistemas, Vol.26, No.2, 875-886, 2022.- (要約)
- We propose a method for constructing a dictionary of emotional expressions, which is an indispensable language resource for sentiment analysis in the Japanese. Furthermore, we propose a method for constructing a language model that reproduces emotional similarity between words, which to date has yet not been considered in conventional dictionaries and language models. In the proposed method, we pretrained sentiment labels for the distributed representations of words. An intermediate feature vector was obtained from the pre-trained model. By learning an additional semantic label on this feature vector, we can construct an emotional semantic language model that embeds both emotion and semantics. To confirm the effectiveness of the proposed method, we conducted a simple experiment to retrieve similar emotional words using the constructed model. The results of this experiment showed that the proposed method can retrieve similar emotional words with higher accuracy than the conventional word-embedding model.
- (キーワード)
- Emotion recognition / emotional similarity / neural networks
- (徳島大学機関リポジトリ)
- ● Metadata: 117201
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.13053/CyS-26-2-4266
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.13053/CyS-26-2-4266
(徳島大学機関リポジトリ: 117201, DOI: 10.13053/CyS-26-2-4266) Kazuyuki Matsumoto, Manabu Sasayama, Minoru Yoshida, Kenji Kita and Fuji Ren :
Emotion Analysis and Dialogue Breakdown Detection in Dialogue of Chat Systems Based on Deep Neural Networks,
Electronics, Vol.11, No.5, 2022.- (要約)
- In dialogues between robots or computers and humans, dialogue breakdown analysis is an important tool for achieving better chat dialogues. Conventional dialogue breakdown detection methods focus on semantic variance. Although these methods can detect dialogue breakdowns based on semantic gaps, they cannot always detect emotional breakdowns in dialogues. In chat dialogue systems, emotions are sometimes included in the utterances of the system when responding to the speaker. In this study, we detect emotions from utterances, analyze emotional changes, and use them as the dialogue breakdown feature. The proposed method estimates emotions by utterance unit and generates features by calculating the similarity of the emotions of the utterance and the emotions that have appeared in prior utterances. We employ deep neural networks using sentence distributed representation vectors as the feature. In an evaluation of experimental results, the proposed method achieved a higher dialogue breakdown detection rate when compared to the method using a sentence distributed representation vectors.
- (キーワード)
- 自然言語処理 (natural language processing) / dialogue breakdown / human-computer dialogue system / sentiment analysis / emotion recognition
- (徳島大学機関リポジトリ)
- ● Metadata: 116757
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3390/electronics11050695
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.3390/electronics11050695
(徳島大学機関リポジトリ: 116757, DOI: 10.3390/electronics11050695) Akira Fujisawa, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Emotion Estimation Method Based on Emoticon Image Features and Distributed Representations of Sentences,
Applied Sciences, Vol.12, No.3, 2022.- (要約)
- This paper proposes an emotion recognition method for tweets containing emoticons using their emoticon image and language features. Some of the existing methods register emoticons and their facial expression categories in a dictionary and use them, while other methods recognize emoticon facial expressions based on the various elements of the emoticons. However, highly accurate emotion recognition cannot be performed unless the recognition is based on a combination of the features of sentences and emoticons. Therefore, we propose a model that recognizes emotions by extracting the shape features of emoticons from their image data and applying the feature vector input that combines the image features with features extracted from the text of the tweets. Based on evaluation experiments, the proposed method is confirmed to achieve high accuracy and shown to be more effective than methods that use text features only.
- (キーワード)
- emoticon / emotion estimation / multimodal information
- (徳島大学機関リポジトリ)
- ● Metadata: 116758
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3390/app12031256
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.3390/app12031256
(徳島大学機関リポジトリ: 116758, DOI: 10.3390/app12031256) Kazuyuki Matsumoto, Ryota Kishima, Seiji Tsuchiya, Tomoki Hirobayashi, Minoru Yoshida and Kenji Kita :
Relationship Between Personality Patterns and Harmfulness: Analysis and Prediction Based on Sentence Embedding,
International Journal of Information Technology and Web Engineering, Vol.17, No.1, 1-24, 2022.- (要約)
- This paper hypothesize that harmful utterances need to be judged in context of whole sentences, and extract features of harmful expressions using a general-purpose language model. Based on the extracted features, we propose a method to predict the presence or absence of harmful categories. In addition, the authors believe that it is possible to analyze users who incite others by combining this method with research on analyzing the personality of the speaker from statements on social networking sites. The results confirmed that the proposed method can judge the possibility of harmful comments with higher accuracy than simple dictionary-based models or models using a distributed representations of words. The relationship between personality patterns and harmful expressions was also confirmed by an analysis based on a harmful judgment model.
- (キーワード)
- Deep Neural Networks / Harmful Expression / Internet Flaming Detection / MBTI / Personality
- (徳島大学機関リポジトリ)
- ● Metadata: 116756
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.4018/IJITWE.298654
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050573243107020800
- ● Search Scopus @ Elsevier (DOI): 10.4018/IJITWE.298654
(徳島大学機関リポジトリ: 116756, DOI: 10.4018/IJITWE.298654, CiNii: 1050573243107020800) Kazuyuki Matsumoto, Seiji Tsuchiya, Minoru Yoshida and Kenji Kita :
Construction and Expansion of Dictionary of Idiomatic Emotional Expressions and Idiomatic Emotional Expression Corpus,
International Journal of Computer & Software Engineering, Vol.6, No.2, 2021.- (要約)
- Objective: In the study of sentiment estimation from language, methods focusing on words, phrases, sentence patterns, and sentence-final expressions have been proposed. However, it is difficult to deal with a wide variety of emotional expressions by only assigning emotions to words and phrases. In particular, it is difficult to analyze metaphorical expressions and idiomatic expressions on a word-by-word basis, and it is impossible to register all expressions in a dictionary because new expressions can be created byflexibly replacing words. However, it is difficult to determine the constraints on the words to be replaced, and not all expressions can be registered in the dictionary as sentence patterns.Methods: In this paper, we construct a dictionary of idiomatic sentiment expressions, which contains idioms expressing emotions. In this paper, we construct a pseudo-emotional corpus by collecting utterances containing emotional idioms from social media and automatically assigning emotions expressed by the idioms.Results: This corpus includes expressions other than idioms, and can be an effective resource for estimating emotions in sentences that do not contain idioms. In this study, we create an emotion estimation model for utterances based on the constructed corpus, and conduct evaluation experiments to explore the problems of the idiomatic emotion corpus. In addition, using the constructed sentimentcorpus, we investigate how to expand the dictionary of sentiment expressions in idiomatic phrases by using deep learning methods.Conclusion: Using the corpus of idiomatic sentiments constructed by the proposed method as training data, models with and without idioms were constructed by machine learning models. The results show that the F-values of all emotions with idioms exceed 0.8. On the other hand, when idioms were not included, the F-values tended to decrease overall. However, the F-values of emotions such as "shame"and "excitement" were around 0.7, indicating that the characteristics of emotional expressions other than idioms were expressed.
- (キーワード)
- emotion recognition / 慣用表現 (idiomatic expression) / idiomatic emotional expression / コーパス (corpus)
- (徳島大学機関リポジトリ)
- ● Metadata: 116606
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.15344/2456-4451/2021/174
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.15344/2456-4451/2021/174
(徳島大学機関リポジトリ: 116606, DOI: 10.15344/2456-4451/2021/174) Reishi Amitani, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Buzz Tweet Classification Based on Text and Image Features of Tweets Using Multi-Task Learning,
Applied Sciences, Vol.11, No.22, 2021.- (要約)
- This study investigates social media trends and proposes a buzz tweet classification method to explore the factors causing the buzz phenomenon on Twitter. It is difficult to identify the causes of the buzz phenomenon based solely on texts posted on Twitter. It is expected that by limiting the tweets to those with attached images and using the characteristics of the images and the relationships between the text and images, a more detailed analysis than that of with text-only tweets can be conducted. Therefore, an analysis method was devised based on a multi-task neural network that uses both the features extracted from the image and text as input and the buzz class (buzz/non-buzz) and the number of likes (favorites) and retweets (RTs) as output. The predictions made using a single feature of the text and image were compared with the predictions using a combination of multiple features. The differences between buzz and non-buzz features were analyzed based on the cosine similarity between the text and the image. The buzz class was correctly identified with a correctness rate of approximately 80% for all combinations of image and text features, with the combination of BERT and VGG16 providing the highest correctness rate
- (キーワード)
- multi-task learning / buzz classification / social media / trend analysis
- (徳島大学機関リポジトリ)
- ● Metadata: 116681
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3390/app112210567
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.3390/app112210567
(徳島大学機関リポジトリ: 116681, DOI: 10.3390/app112210567) Minoru Yoshida, Kojima Takumi, Kazuyuki Matsumoto and Kenji Kita :
Toward Analyzing Relations between Sleep Time and Social Networking Service Texts: Prediction of the Tweet Time Span Using the Last Tweet of the Day,
International Journal of Advanced Intelligence (IJAI), Vol.12, No.1, 1-9, 2021.- (要約)
- Sleeping habits are one of the major issues in today's healthcare. In this paper, we consider the problem of analyzing sleeping habits of people using social networking service (SNS) texts. As the first step toward predicting user's sleeping time using SNS texts, we assume that the time span between the user's last post in one day and the first post the next day can be used as a pseudo-indicator for the user's sleeping time if the user posts the text sufficiently frequently. We call such tweet time spans ``pseudo-sleeping time'' if the first tweet of the next day include ``Good morning'' or similar words. We try to predict such pseudo-sleeping time using the text (tweet) of the preceding tweet (i.e., the last tweet of the day). Preliminary experiments show that the tweet text contains some useful information to predict the user's pseudo-sleeping time.
- (キーワード)
- sleeping time / SNS / text mining
- (徳島大学機関リポジトリ)
- ● Metadata: 116122
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050570387105486080
(徳島大学機関リポジトリ: 116122, CiNii: 1050570387105486080) 佐久田 祐子, 津野邉 純一, 松本 和幸, 吉田 稔, 北 研二 :
Earth Mover's Distanceを用いた画像の印象推定,
日本感性工学会論文誌, Vol.19, No.1, 97-104, 2020年.- (要約)
- 本論文では,配色イメージスケールおよび言語イメージスケールを元に,画像イメージを簡便に評価できるシステムについて述べた.また,そのシステムによる評価結果と,人間の感性による評価結果の一致率を検討し,イメージスケール上のカテゴリーの再検討を行った.
- (キーワード)
- Earth Mover's Distance / EMD / 印象 / 画像処理 (image processing) / カラーイメージスケール / 感情 (emotion) / 感性マッピング / カラー画像
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.5057/jjske.TJSKE-D-19-00038
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1390002184878233472
- ● Search Scopus @ Elsevier (DOI): 10.5057/jjske.TJSKE-D-19-00038
(DOI: 10.5057/jjske.TJSKE-D-19-00038, CiNii: 1390002184878233472) Kazuyuki Matsumoto, Seiji Tsuchiya, Takumi Kojima, Hiroya Kondo, Minoru Yoshida and Kenji Kita :
Classification of Smartphone Application Reviews Using Small Corpus Based on Bidirectional LSTM Transformer,
International Journal of Machine Learning and Computing, Vol.10, No.1, 148-157, 2020.- (要約)
- This paper provides the classification of the review texts on a smartphone application posted on social media. We propose a high performance binary classification method (positive/negative) of review texts, which uses the bidirectional long short-term memory (biLSTM) self-attentional Transformer and is based on the distributed representations created by unsupervised learning of a manually labelled small review corpus, dictionary, and an unlabeled large review corpus. The proposed method obtained higher accuracy as compared to the existing methods, such as StarSpace or the Bidirectional Encoder Representations from Transformer (BERT).
- (キーワード)
- attention mechanism / review classification / small corpus / transformer
- (徳島大学機関リポジトリ)
- ● Metadata: 114311
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.18178/ijmlc.2020.10.1.912
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.18178/ijmlc.2020.10.1.912
(徳島大学機関リポジトリ: 114311, DOI: 10.18178/ijmlc.2020.10.1.912) 中尾 英俊, 今岡 真和, 岡 健司, 森藤 武, 橋本 雅至, 松本 和幸, 北 研二 :
SVM-RFEを用いた足部アーチ高比の低下を有する人の関連要因分析,
生体医工学, Vol.57, No.6, 190-197, 2019年.- (キーワード)
- SVM-RFE
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.11239/jsmbe.57.190
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1390002184878527360
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85081002741
(DOI: 10.11239/jsmbe.57.190, CiNii: 1390002184878527360, Elsevier: Scopus) 中尾 英俊, 今岡 真和, 岡 健司, 肥田 光正, 森藤 武, 橋本 雅至, 松本 和幸, 北 研二 :
健常者の足背高測定による足部アーチ評価とアーチ高に影響を及ぼす因子,
バイオメカニズム学会誌, Vol.43, No.4, 256-262, 2019年.- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3951/sobim.43.4_256
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1390001277380551168
- ● Search Scopus @ Elsevier (DOI): 10.3951/sobim.43.4_256
(DOI: 10.3951/sobim.43.4_256, CiNii: 1390001277380551168) Koji Bando, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Twitter User's Hobby Estimation Based on Sequential Statements Using Deep Neural Networks,
International Journal of Machine Learning and Computing, Vol.9, No.2, 108-114, 2019.- (要約)
- 近年,SNS上でのユーザー同士のコミュニケーションが増大している.TwitterやFaacebookを始める際,多くのユーザーが,同じ趣味の友達を探す.本研究では,Twitter上のツイートに基づいてユーザの興味(趣味)を推定する手法を提案する. 1つのツイートは,多くの情報を含んでいるわけではなく,また,ツイートの中にはユーザーの趣味に関係していないものもある.そこで,複数の連続したつぶやきから特徴を抽出し,信頼できる趣味推定法を提案する.提案手法では,時系列情報に対応できるリカレントニューラルネットワーク(RNN)を用いる.また,文脈情報を扱うことができる畳み込みニューラルネットワーク(CNN)も使用する.特徴量としては,単語分散表現の平均ベクトルを使用した.Long Short-Term Memory RNN (LSTM-RNN)に基づく提案された方法を使用して,機械学習アルゴリズムとしてランダムフォレスト(RF)回帰を使用するベースライン方法と比較して23.72%の改善を得た.
- (キーワード)
- Twitter / 趣味推定 / ニューラルネットワーク (neural network) / ランダムフォレスト / サポートベクトルマシン
- (徳島大学機関リポジトリ)
- ● Metadata: 113915
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.18178/ijmlc.2019.9.1.773
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85064990114
(徳島大学機関リポジトリ: 113915, DOI: 10.18178/ijmlc.2019.9.1.773, Elsevier: Scopus) Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Emotion Recognition for Japanese Short Sentences Including Slangs Based on Bag of Concepts Feature Trained by Large Web Text,
Current Analysis on Instrumentation and Control, Vol.2019, No.2, 9-18, 2019.- (要約)
- The growth of Internet communication sites such as weblogs and social networking sites brought younger people especially in teens and in their 20s to create new words and to use them very often. We prepared an emotion corpus by collecting weblog article texts including new words, analyzed the corpus statistically, and proposed a method to estimate emotions of the texts. Most slang words such as Youth Slang are too ambiguous in sense classification to be registered into the existing dictionaries such as thesaurus. To cope with these words, we created a large scale of Twitter corpus and calculated sense similarities between words. We proposed to convert unknown word to semantic class id so that we might be able to process the words that were not included in the learning data. For calculation similarities between words and converting the word into word cluster id, we used the word embedding algorithms such as word2vec, or GloVe. We defined this method as a method using Bag of Concepts as feature. As a result of the evaluation experiment using several classifiers, the proposed method was proved its robustness for unknown expressions.
- (キーワード)
- Youth Slang / Unknown Words / Bag of Concepts / Word Embedding / Unsupervised Clustering
- (徳島大学機関リポジトリ)
- ● Metadata: 113245
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050845763178553728
(徳島大学機関リポジトリ: 113245, CiNii: 1050845763178553728) Kazuyuki Matsumoto, Fuji Ren, Masaya Matsuoka, Minoru Yoshida and Kenji Kita :
Slang Feature Extraction by Analyzing Topic Change on Social Media,
CAAI Transactions on Intelligence Technology, 2019.- (要約)
- Recently, we often see words such as youth slang, neologism and Internet slang on social networking sites (SNSs) that are not registered on dictionaries. Because the documents posted to SNSs include a lot of fresh information, they are thought to be useful for collecting information. It is important to analyze these words (hereinafter referred to as slang) and capture their features for the improvement of the accuracy of automatic information collection. This paper aims to analyze what features can be observed in slang by focusing on the topic. We construct topic models from document groups including target slang on Twitter by Latent Dirichlet Allocation (LDA). With the models, we chronologically analyze change of topics during a certain period of time to find out the difference in the features between slang and general words. Then, we propose a slang classification method based on the change of features.
- (キーワード)
- Slang / Topic analysis / Latent Dirichlet Allocation / Social media, / Tweet representation
- (徳島大学機関リポジトリ)
- ● Metadata: 113246
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1049/trit.2018.1060
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1049/trit.2018.1060
(徳島大学機関リポジトリ: 113246, DOI: 10.1049/trit.2018.1060) Kazuyuki Matsumoto, Akira Fujisawa, Minoru Yoshida and Kenji Kita :
ASCII Art Classification based on Deep Neural Networks Using Image Feature of Characters,
Journal of Software, Vol.13, No.10, 559-572, 2018.- (要約)
- In recent years, a lot of non-verbal expressions have been used on social media. Ascii art (AA) is an expression using characters with visual technique. In this paper, we set up an experiment to classify AA pictures by using character features and image features. We try to clarify which feature is more effective for a method to classify AA pictures. We proposed four methods: 1) a method based on character frequency, 2) a method based on character importance value and 3) a method based on image features and 4) a method based on image features of characters. We trained neural networks by using these four features. In the experimental result, the best classification accuracy was obtained in the feed forward neural networks that used image features of characters.
- (キーワード)
- アスキーアート / 分類 (classification) / 深層ニューラルネットワーク / 文字特徴
- (徳島大学機関リポジトリ)
- ● Metadata: 113248
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.17706/jsw.13.10.559-572
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.17706/jsw.13.10.559-572
(徳島大学機関リポジトリ: 113248, DOI: 10.17706/jsw.13.10.559-572) Mei Chen, Qingmei Xiao, Kazuyuki Matsumoto, Minoru Yoshida, Kenji Kita and Xin Luo :
Similarity Analysis and Repeating Pattern Detection in Fingerprint Features,
Journal of Computational Methods in Sciences and Engineering, Vol.18, No.3, 553-562, 2018.- (キーワード)
- オーディオ指紋 (audio fingerprint) / similarity analysis / repeating pattern detection / music retrieval
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3233/JCM-180781
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85059945684
(DOI: 10.3233/JCM-180781, Elsevier: Scopus) 松本 和幸, 秋田 恭佑, 任 福継, 吉田 稔, 北 研二 :
演劇台本における登場人物間の親密度推定手法,
知能と情報, Vol.30, No.3, 591-604, 2018年.- (要約)
- 近年,音声アシスタント機能を搭載した携帯型端末が普及し,より使い手に配慮した対話システムが求められている. 従来型の対話システムの問題点として,雑談のような非タスク型対話への対応が未熟な点があげられる.非タスク型対話 においては,ユーザとの会話を円滑かつ柔軟にするための工夫が必要となる.たとえば,ユーザの現実世界での人間関係 を考慮することによって,ユーザと親しい人物に関する話題の提供を積極的に行ったり,ユーザと親しくない(仲が良く ない)人物に関する話題の提供を避けたりすることができると考える.本論文では,演劇台本を題材に,対話中の2 者間 の人間関係を「親密度」という尺度により表現する.親密度に関わると考えられる要素として,発話の応答回数や発話中 の態度などがある.本論文では,その中でも発話中の感情状態に着目することで,高精度な親密度推定の実現を試みる. 評価実験の結果,発話役割に基づく従来手法を上回る高精度な親密度推定を実現することが出来た.
- (キーワード)
- 親密度 / シナリオ対話 / 感情状態
- (徳島大学機関リポジトリ)
- ● Metadata: 113247
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3156/jsoft.30.3_591
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1390564237991620096
- ● Search Scopus @ Elsevier (DOI): 10.3156/jsoft.30.3_591
(徳島大学機関リポジトリ: 113247, DOI: 10.3156/jsoft.30.3_591, CiNii: 1390564237991620096) Fujino Naoya, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Emotion Estimation Adapted to Gender of User Based on Deep Neural Networks,
International Journal of Advanced Intelligence (IJAI), Vol.10, No.1, 121-133, 2018.- (要約)
- In this study, we focus on Twitter as a representative SNS and target emotion estima-tion from tweets posted on Twitter by male and female users. Specically, we constructgender-based emotion estimation models assuming that there are different word usage ten-dencies between genders. By analyzing gender-specic differences in the use of emotion-related slang and emoji, we propose a method to improve emotion estimation based onneural networks using a different distributed representation model for each gender. Ourevaluation experiments show that training with Deep Convolutional Neural Networks us-ing word's distributed representation as the feature produced higher estimation accuracythan training with Feed Forward Neural Networks.
- (キーワード)
- emotion estimation / user's gender, / deep neural networks
- (徳島大学機関リポジトリ)
- ● Metadata: 113250
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050564288205659776
(徳島大学機関リポジトリ: 113250, CiNii: 1050564288205659776) Hirokimi Fukuda, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Index Generation of BGM Video Based on Distinctive Comments,
International Journal of Advanced Intelligence (IJAI), Vol.10, No.1, 113-119, 2018.- (要約)
- The purpose of this study is to generate indexes for background music (BGM) based ondistinctive comments annotated to BGM videos posted on Nico Nico Videos. Our proposedmethod detects the end/start positions of the BGM considering the increase/decrease inthe number of comments, comments distinctive to the songs, and exclamatory expressionsannotated to the videos. The evaluation result indicated that the proposed method couldgenerate correct indexes within a 10 s error for BGM videos less than 40 min long andwith annotations of over 30,000 comments.
- (キーワード)
- Nico Nico Video / Index generation / BGM video for work
- (徳島大学機関リポジトリ)
- ● Metadata: 113249
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050845763182370176
(徳島大学機関リポジトリ: 113249, CiNii: 1050845763182370176) Kazuyuki Matsumoto, Seiji Tsuchiya, Miyake Takeshi, Minoru Yoshida and Kenji Kita :
Flame Prediction Based on Harmful Expression Judgement Using Distributed Representation,
International Journal of Technology and Engineering Studies, Vol.4, No.1, 7-15, 2018.- (要約)
- 近年,ソーシャルメディア上での炎上が問題になっている.炎上を避けるためには,投稿前に自動的にメッセージを確認して,炎上を引き起こす可能性の高い表現が含まれているかどうかを判断することが役立つ.提案手法では,有害表現辞書を作成する.このさい,表現を集めるコストを最小限に抑えるために,単語分散表現を使用して半自動的に辞書を構築した.辞書に登録された有害表現と一般的な表現を用い,有害表現と一般的表現の分類を行った.評価実験により,提案手法は約70%の精度で有害表現を抽出できることが分かった.提案手法は未知の表現を抽出することもできたが,有害でない表現も有害として抽出する傾向があった.提案手法は,基本辞書に含まれていない未知の有害な表現を決定することができ,有害表現間の意味的関係を判定することができる.
- (キーワード)
- 炎上予測 / 有害表現 / 分散表現 / サポートベクターマシン
- (徳島大学機関リポジトリ)
- ● Metadata: 113251
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.20469/ijtes.4.10002-1
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050282813228949248
- ● Search Scopus @ Elsevier (DOI): 10.20469/ijtes.4.10002-1
(徳島大学機関リポジトリ: 113251, DOI: 10.20469/ijtes.4.10002-1, CiNii: 1050282813228949248) Kazuyuki Matsumoto, Fuji Ren, Minoru Yoshida and Kenji Kita :
Review Score Estimation Based on Transfer Learning of Different Media Review Data,
International Journal of Advanced Intelligence (IJAI), Vol.9, No.4, 541-555, 2017.- (要約)
- 本研究では,異なるメディアのレビューデータに基づいたレビュー分類モデルの構築を提案します.現在,多種多様なビッグデータを対象とした異なるドメイン間での転移学習に関する研究が盛んである.異なるドメイン間では,評価表現が異なることが多く,評判分析の障壁となる.異なるメディアにおける著作物に触れているユーザが異なる表現を使用することは多い.たとえば,著作物に関して,「アニメ」や「漫画」,「ゲーム」,「映画」など,異なるメディアにおいては異なる用語や表現が存在する.評価表現以外にもメディアの違いの特徴が表れると考えられる.我々はメディア間でのレビューデータの転移学習をおこなうことで,こうした違いが分類精度にどんな影響を及ぼすかについて分析した.本研究では,著作物の媒体ごとに,転移先と転移元のメディアの相性について,レビューの評価分類モデルを構築することで明らかにした.また,評価実験の結果,Long Short Term Memoryを用いて,レビュー片の学習においてSo-Scoreを用いずに,SO-Scoreに基づく手法よりも正確に評価スコアの推定をおこなえた.
- (キーワード)
- レビュー分類 / 転移学習 / Long Short-Term Memory / different media
- (徳島大学機関リポジトリ)
- ● Metadata: 113252
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050001338252239488
(徳島大学機関リポジトリ: 113252, CiNii: 1050001338252239488) Kazuyuki Matsumoto, Akira Fujisawa, Minoru Yoshida and Kenji Kita :
Emotion Recognition of Emoticon Based on Character Embedding,
Journal of Software, Vol.12, No.11, 849-857, 2017.- (要約)
- 本研究では,顔文字の文字意味分散表現を用いた顔文字の感情認識をおこなう.従来の顔文字研究では,文中から顔文字を抽出したり,顔文字を構成パーツに分解しその組み合わせによる感情認識などがおこなわれてきた.近年発展してきた単語埋め込み技術を応用し,顔文字の文字単位での意味を学習し,特徴量として用いることで,より汎用的な顔文字の感情認識を試みる.文字の分散表現を素性として深層畳み込みニューラルネットワークに学習させる手法により構築した顔文字感情認識モデルを交差検証法により評価した結果,未知顔文字に対する感情認識を,単純な文字n-gram出現頻度ベクトルを素性として用いた手法よりも高い精度でおこなえることが分かった.
- (キーワード)
- 顔文字 / 感情認識 / 文字埋め込み / 畳み込みニューラルネットワーク
- (徳島大学機関リポジトリ)
- ● Metadata: 113914
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.17706/jsw.12.11.849-857
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.17706/jsw.12.11.849-857
(徳島大学機関リポジトリ: 113914, DOI: 10.17706/jsw.12.11.849-857) Yunong Wu, Kenji Kita, Kazuyuki Matsumoto, XIN KANG and Fuji Ren :
Constructing A Short Text Conversation system Based on the Relations Between Posts and Comments,
International Journal of Advanced Intelligence (IJAI), Vol.9, No.3, 369-380, 2017. Zhang Guodong, Jiang Peiling, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
An Improvement of Pedestrian Detection Method with Multiple Resolutions,
Journal of Computer and Communications, Vol.5, No.9, 102-116, 2017.- (要約)
- In object detection, detecting an object with 100 pixels is substantially different from detecting an object with 10 pixels. Many object detection algorithms assume that the pedestrian scale is fixed during detection, such as the DPM detector. However, detectors often give rise to different detection effects under the circumstance of different scales. If a detector is used to perform pedestrian detection in different scales, the accuracy of pedestrian detection could be improved. A multi-resolution DPM pedestrian detection algorithm is proposedin this paper. During the stage of model training, a resolution factor is added to a set of hidden variables of a latent SVM model. Then, in the stage of detection, a standard DPM model is used for the high resolution objects and a rigid template is adopted in case of the low resolution objects. In our experiments, we find that in case of low resolution objects the detection accuracy of a standard DPM model is lower than that of a rigid template. In Caltech, the omission ratio of a multi-resolution DPM detector is 52% with 1 false positive per image (1FPPI); and the omission ratio rises to 59% (1FPPI) as far as a standard DPM detector is concerned. In the large-scale sample set of Caltech, the omission ratios given by the multi-resolution and the standard DPM detectors are 18% (1FPPI) and 26% (1FPPI), respectively.
- (キーワード)
- Deformable Part Model / Pedestrian Detection / Multi-Resolution / Latent SVM
- (徳島大学機関リポジトリ)
- ● Metadata: 113913
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.4236/jcc.2017.59007
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.4236/jcc.2017.59007
(徳島大学機関リポジトリ: 113913, DOI: 10.4236/jcc.2017.59007) Kazuyuki Matsumoto, Satoshi Tanaka, Minoru Yoshida, Kenji Kita and Fuji Ren :
Ego-state Estimation from Short Texts Based on Sentence Distributed Representation,
International Journal of Advanced Intelligence (IJAI), Vol.9, No.2, 145-161, 2017.- (要約)
- 人間の性格は,複雑な要素が組み合わさって,多面的に構成される.性格診断手法としてのエゴグラムは,5つの自我状態の高低の組み合わせに基づき,性格をパターン分類するものである.近年のSNSの発達にともなって,性格をSNS上の発言から診断しようという試みが増えてきた.しかし,発言の表層情報を手掛かりとした性格診断は,自我状態を推定するうえでいくつかの問題を抱える.具体的には,性格がすべての発言に反映されているわけではないこと,また,個人の性格に起因する発言の傾向は時間とともに変化していくものであるということなどがあげられる.また,十分な量の性格診断結果を伴う発言の事例を収集することも重要となる.本研究では,SNS,とくにMicroblog 上の発言(ショートテキスト)をもとに,エゴグラム診断を自動化するために,Twitter 上の発言を事前学習において分散表現(文ベクトル)により表し,Deep Neural Network による機械学習を用いて,ユーザごとに自我状態のレベルを推定するモデルの構築を試みる.評価実験の結果,提案手法による自我状態推定モデルは,Bag of Words を素性としたベースライン手法よりも高精度%であることを示した.また,時間経過による性格変化を調べるため,エゴグラム診断の前後において,推定結果の一致率にどのような変化が起きているかを分析した.さらに本論文では,文のフォーマル度合いを特徴づける素性を追加することで性格パターン分類の精度向上を確認した.
- (キーワード)
- エゴグラム / 性格推定 / Twitter / Social Networking Service / 分散表現
- (徳島大学機関リポジトリ)
- ● Metadata: 113455
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050282677900653056
(徳島大学機関リポジトリ: 113455, CiNii: 1050282677900653056) 松本 和幸, 土屋 誠司, 芋野 美紗子, 吉田 稔, 北 研二 :
感性を考慮した日本語俗語の標準語変換,
人工知能学会論文誌, Vol.32, No.1, WII-A_1-12, 2017年.- (要約)
- 近年のソーシャルメディアを用いたコミュニケーションの普及に伴い,Web上での意見交換が老若男女問わず一般的になってきた.一方で,「ネット炎上」と呼ばれる問題が,ソーシャルネットワークサービスのユーザの増加にともない,しばしば起こっている.この理由は,ユーザが単語により表現された意味/意図/感情を理解しないためである.本研究では,SNS上でよく用いられるが,一般的な辞書に登録されていない俗語(ネットスラング)に着目し,それらを標準語に変換することを試みる.我々は,意味的な類似だけでなく,感性的な類似を考慮し,より適切な候補を出力しようと考える.提案手法は,分散表現に基づき得られた候補を,2つの点に焦点をあて,フィルタリングし再ランキングする.入力語と出力候補間の,(1)俗語/標準語の特徴,(2)感性的類似度 の2点である.評価実験において,提案手法により,ベースライン手法よりも高いMRRを得た.
- (キーワード)
- ネットスラング / 標準語 / 感性 / 単語概念
- (徳島大学機関リポジトリ)
- ● Metadata: 113254
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1527/tjsai.WII-A
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1527/tjsai.WII-A
(徳島大学機関リポジトリ: 113254, DOI: 10.1527/tjsai.WII-A) Zhang Guodong, Jiang Peilin, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Reidentification of Persons Using Clothing Features in Real-Life Video,
Applied Computational Intelligence and Soft Computing, Vol.2017, 1-9, 2017.- (要約)
- Person reidentification, which aims to track people across nonoverlapping cameras, is a fundamental task in automated video processing. Moving people often appear differently when viewed from different nonoverlapping cameras because of differences in illumination, pose, and camera properties. The color histogram is a global feature of an object that can be used for identification. This histogram describes the distribution of all colors on the object. However, the use of color histograms has two disadvantages. First, colors change differently under different lighting and at different angles. Second, traditional color histograms lack spatial information. We used a perception-based color space to solve the illumination problem of traditional histograms. We also used the spatial pyramid matching (SPM) model to improve the image spatial information in color histograms. Finally, we used the Gaussian mixture model (GMM) to show features for person reidentification, because the main color feature of GMM is more adaptable for scene changes, and improve the stability of the retrieved results for different color spaces in various scenes. Through a series of experiments, we found the relationships of different features that impact person reidentification.
- (キーワード)
- Clothing Feature / Gaussian mixture mode / spatial pyramid matching / person reidentification / perception-based color space
- (徳島大学機関リポジトリ)
- ● Metadata: 113911
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1155/2017/5834846
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1155/2017/5834846
(徳島大学機関リポジトリ: 113911, DOI: 10.1155/2017/5834846) Kazuyuki Matsumoto, Minoru Yoshida, Seiji Tsuchiya, Kenji Kita and Fuji Ren :
Slang Analysis Based on Variant Information Extraction Focusing on the Time Series Topics,
International Journal of Advanced Intelligence (IJAI), Vol.8, No.1, 84-98, 2016.- (要約)
- 近年,SNS の利用者増加に伴い,Web上でのコミュニケーションがよりいっそう活発になった. これにより,言葉の多様性について,SNS上のビッグデータを用いて解析できる可能性が出てきた.日本語では扱われる文字種が多いことからも,様々な表現が存在し,自然言語処理において基本的な処理である形態素解析が,比較的難しいことが問題となっている.こうした形態素解析の辞書に登録されていないような未知表現に対しては,厳密な定義が存在していないこともしばしばであり,意味解釈における個人差が大きいことが考えられる.本研究では,Twitter上の俗語に関連したトピックを時系列で分析する.本論文では,検証実験として,連続するTweetデータを用いたトピックの時系列分析実験をおこない,俗語の種類によるトピック変化の違いを考察する.変化しない情報(不変情報)が,一定期間においてどのような変化を示すかを実験により示し,標準語との差異を調べる.また,俗語の変化の仕方を変動値とし,特徴ベクトルとすることで,似たような傾向を示す俗語をクラスタリングする手法を提案し,実験結果を分析する.
- (キーワード)
- 俗語 / トピック分析 / 時系列分析
- (徳島大学機関リポジトリ)
- ● Metadata: 113910
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050001338855354112
(徳島大学機関リポジトリ: 113910, CiNii: 1050001338855354112) Fujisawa Akira, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
An Illustration Image Classification Focusing on Infrequent Colors,
International Journal of Advanced Intelligence (IJAI), Vol.8, No.1, 72-83, 2016.- (要約)
- 漫画やアニメ作品において用いられるイラスト画像は感性的な特徴である作風を持つ.作風はイラスト画像の様々な要素により表現される.イラスト画像の作風を扱った研究は少ない.本論文では,画像特徴量を用いることで作風のモデル化およびイラスト画像の作風による分類を試みた.我々は,イラスト画像においてあまり使用されない色が作風を表現していると考えた.そのため,あまり出現しない色を強調した色ヒストグラムを作成するための手法を提案する.我々はこのヒストグラムを「Infrequency histogram(IF-hist)」と呼ぶ.このヒストグラムの有効性を確認するため,我々は,IF-histを用いて「少年向け」と「少女向け」の2つの作風に分類する実験をおこなった.実験の結果,通常の色ヒストグラムを用いた場合よりも50%の精度改善を確認でき,本手法の有効性を示すことができた.
- (キーワード)
- 画像分類 / イラスト画像 / 色ヒストグラム / 作風 / IF-hist
- (徳島大学機関リポジトリ)
- ● Metadata: 113909
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050845763785485824
(徳島大学機関リポジトリ: 113909, CiNii: 1050845763785485824) Zhang Guodong, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Pedestrian Re-identification using Color Feature in Multi Surveillance Video,
International Journal of Advances in Electronics and Computer Science, Vol.3, No.3, 11-14, 2016.- (要約)
- In this paper we present a system to solve the problem of moving pedestrian re-identification in surveillancevideo. Surveillance video has low-resolution, high video noise and limited monitoring scope. Our proposed framework mustdeal with several problems such as variations of illumination conditions, poses and occlusions. How to extract the robustfeature that can adapt the problems have been the task. The people of global color approaches do not change in the processof monitoring. Our paper use the color histogram as feature descriptors and choose RGB HSV and UVW for color space.Traditional histogram method extract the global color approach as the feature. The object color structure information will beneglected. We use the SPM model supplement the structure information for the histogram. The results of a test from a realsurveillance system show that our method can provide a probability of matching.
- (キーワード)
- Pedestrian Re-identification / UWV Color space / Color Histogram / SPM
- (徳島大学機関リポジトリ)
- ● Metadata: 113906
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050001338855352832
(徳島大学機関リポジトリ: 113906, CiNii: 1050001338855352832) Sun Zhuoran, Minoru Yoshida, Kazuyuki Matsumoto and Kenji Kita :
A Study on the Review Analysis for the Automatic Evaluation of the Product,
International Journal of Management and Applied Science (IJMAS), Vol.2, No.3, 2016.- (要約)
- Nowadays, e-business has been never more popular and more convenient. Online merchants have flourished andmerchandize have diversified. However, its still difficult for users to quickly locate their desired products on online markets.Often times, an online shopper will evaluate ratings and comments from other users to speculate the current product. Inparticular, the easiest and the most intuitive way is to see the scores to determine the quality of the product. Therefore, if wecan automatically identify and analyze all the reviews and accurately and objectively give a score to a particular product, itwill be more efficient for users to search merchandize and for online business owners to manage the products they sell.
- (キーワード)
- e-ビジネス (e-business) / レビュー / Analysis / 自動評価 / 技術経営 (management of technology)
- (徳島大学機関リポジトリ)
- ● Metadata: 113907
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050845763785484800
(徳島大学機関リポジトリ: 113907, CiNii: 1050845763785484800) 市川 賢, 北岡 教英, 柘植 覚, 武田 一哉, 北 研二 :
種々のテキスト検索モデルの頑健性向上による音声ドキュメント検索の高精度化,
情報処理学会論文誌, Vol.56, No.3, 1003-1012, 2015年.- (要約)
- テキスト検索に用いられてきた従来の3つの主な検索手法(ベクトル空間モデル,クエリ尤度モデル,適合モデルに基づく手法)に対し統一的な枠組みで改良を加えることで,音声ドキュメント検索における語彙外単語や音声認識誤りに対処する手法を提案し,比較検討を行った.各検索手法に対し,新たな検索質問拡張手法,および音節の3連鎖を単語と同様に扱う検索を単語単位の検索とスコアレベルで組み合わせる手法を提案する.提案手法の有効性をNTCIR-9のSpokenDocタスクで評価した結果,各手法でBaseline手法よりも検索性能が向上した.特に,確率に基づくクエリ尤度モデルに基づく手法と適合モデルに基づく手法では検索性能が高かった.提案手法はNTCIR-9で公表されている公式の最高精度の結果を上回る結果を得た.
- (キーワード)
- 音声ドキュメント検索 / ベクトル空間モデル (vector space model) / クエリ尤度モデル / 適合モデル / 検索質問拡張 / 音節認識結果による検索
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050845762835865728
(CiNii: 1050845762835865728) Kazuyuki Matsumoto, Kyosuke Akita, Xielifuguli Keranmu, Minoru Yoshida and Kenji Kita :
Extraction Japanese Slang from Weblog Data Based on Script Type and Stroke Count,
Procedia Computer Science, Vol.35, No.2014, 464-473, 2014.- (要約)
- 若者はWeblogやSNSにおいてよく俗語を用いる.こうした語をどう扱うかが,テキストマイニングなどの分野において,一つの問題となっている.本論文では,若者にとくに用いられる若者言葉と呼ばれる日本語俗語を文字種と画数に着目することにより抽出する手法を提案した.評価実験の結果,文字種を適用した場合に高い抽出精4度が得られることが分かった.
- (キーワード)
- 日本語俗語 / 条件付き確率場 / 未知語 / 画数 / 文字種
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1016/j.procs.2014.08.127
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-84924135505
(DOI: 10.1016/j.procs.2014.08.127, Elsevier: Scopus) 柘植 覚, 大橋 宏正, 市川 賢, 北岡 教英, 武田 一哉, 北 研二 :
音声ドキュメント検索における種々の検討および線形補間係数を自動決定する検索質問拡張,
情報処理学会論文誌, Vol.55, No.6, 1625-1636, 2014年.- (要約)
- 本論文では,2011年に開催されたNTCIR-9ワークショップのコアタスクSpokenDoc内のSDRサブタスクに参加した際に行った音声ドキュメント検索に対する種々の検討を報告する.ベクトル空間モデルによるテキスト検索において,索引語の単位,索引語重みづけ方法,ベクトル空間に射影する音声認識候補数,検索質問拡張方法などの比較を行い,各ベクトル空間で計算される類似度を統合して音声ドキュメント検索を行う手法を提案した.
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050001337904502272
(CiNii: 1050001337904502272) Yunong Wu, Kenji Kita and Kazuyuki Matsumoto :
Three Predictions are Better than One: Sentence Multi-Emotion Analysis from Different Perspectives,
IEEJ Transactions on Electrical and Electronic Engineering (TEEE), Vol.9, No.6, 642-649, 2014.- (要約)
- 感情推定は,アフェクティブコンピューティングにおける核となるタスクの一つである.これは,人間の行動分析による人の精神状態を調べるために必要である.多くのブログ文には,著者の感情が表されているため,我々は,異なる人々のオンラインブログにおける感情推定に着目する.提案手法は,感情に関連するトピックに基づく感情推定と,文脈情報を用いた感情推定,また,局所的なBag of wordsを用いた感情推定を組み合わせたものである.また,我々は,既存の複数の確率的感情推定モデルを結合し,一つの感情に絞り込む方法を提案した.ブログコーパスを対象とした評価実験により,Micro F1スコアとMacro F1スコア双方において,提案手法が従来手法を上回る結果を得ることができた.
- (キーワード)
- 文感情分析 / 複数感情 / L-LDA / CRF / LGR
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1002/tee.22020
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-84907939400
(DOI: 10.1002/tee.22020, Elsevier: Scopus) 中川 祥平, 鈴木 基之, 松本 和幸, 北 研二 :
合成音声を用いた特徴量の正規化による感情識別法,
電子情報通信学会論文誌(D), Vol.J97-D, No.3, 533-539, 2014年.- (要約)
- 本論文では,音声からの感情推定において特徴量を正規化して識別を行う方法を提案する.従来感情識別に用いられている平均パワーやピッチといった韻律的特徴量は,感情による変化だけではなく発話内容そのものによって大きく変化する.そのため,たとえ同じ感情で発話されたとしても発話内容が異なれば異なる韻律となり,感情推定の性能低下を招き得る.そこで本論文では,平静の感情で同じ発話内容を発話した音声からも特徴量を抽出し,それとの差分に注目することで感情による特徴量の変化のみを抽出する方法を提案する.使用している5種類の特徴量(平均パワー,ピッチ等)ごとに減算による正規化,除算による正規化,正規化なし,の三つの方法で正規化し,全ての組み合わせの中で最も性能が向上する組み合わせを探索した.その結果,最適な組み合わせによる識別性能は,正規化を行わない従来法と比較して5.98%向上した.正規化法に関する分析を行ったところ,平均パワーは正規化が必要(演算は減算でも除算でも大きな差はない)であり,一方ピッチとMFCCは正規化なし,残りの二つの特徴量についてはどちらでも性能は大きくは変化しないことがわかった.
- (キーワード)
- 感情識別 / 特徴量正規化 / 合成音声
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1520009407264043136
(CiNii: 1520009407264043136) Keranmu Xielifuguli, Akira Fujisawa, Yusuke Kusumoto, Kazuyuki Matsumoto and Kenji Kita :
Pleasant/Unpleasant Filtering for Affective Image Retrieval Based on Cross-Correlation of EEG Features,
Applied Computational Intelligence and Soft Computing, Vol.2014, 2014.- (要約)
- 本論文では,脳波特徴を利用した感性的画像検索システムのための,画像の好き嫌い(好悪)を分類する感性的フィルタリング技術の提案を行った.類似画像検索により得られた検索結果画像集合に対し,感性フィルタリングを行う方法として,画像特徴から推定した感性特徴量に基づく,最大エントロピー法(Maximum Entropy Method :MEM)を用いた画像の好悪分類を行う.本論文では,画像を見ている時の脳波から計算して得た相互相関特徴量を感性的な特徴量と考える.しかし,被験者が未知の画像を見るたびに脳波の測定を行わなければならないという問題がある.本論文では,正準相関分析に基づく線形回帰法を用いて画像特徴量から相互相関特徴量を推定するという解決策を提案する.
- (キーワード)
- 画像処理 (image processing) / 情報検索システム (information retrieval system) / 脳波 (electroencephalogram) / 感性コンピュータ (sentience computer)
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1155/2014/415187
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1155/2014/415187
(DOI: 10.1155/2014/415187) Qingmei Xiao, Saito Narumi, Kazuyuki Matsumoto, Luo Xin, Yokota Yasushi and Kenji Kita :
Index Compression for Audio Fingerprinting Systems Based on Compressed Suffix Array,
International Journal of Information and Education Technology (IJIET), Vol.3, No.4, 455-460, 2013.- (要約)
- 圧縮接尾辞配列というデータ構造を利用し,オーディオ指紋に基づく検索のインデックスを圧縮する手法を提案した.ソートされたオーディオ指紋データが上位バイトは同じ値になりやすいという性質を利用し,同位8ビットに対するランレングス符号により圧縮を行う.また,データ順を示す配列が部分的に単調増加となる性質を利用し,Vertical Codeに基づく配列圧縮を行う.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.7763/IJIET.2013.V3.317
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.7763/IJIET.2013.V3.317
(DOI: 10.7763/IJIET.2013.V3.317) 肖 清梅, 大頭 勇作, 松本 和幸, 鈴木 基之, 北 研二 :
検索質問多重化による高速なオーディオ指紋検索,
電気学会論文誌C (電子,情報,システム部門誌), Vol.132, No.9, 1481-1487, 2012年.- (要約)
- 楽曲検索では,ノイズ等による楽曲の劣化や,検索質問曲の演奏開始位置が不明であることから,一般に膨大な検索空間を探索する必要がある.多くの楽曲検索システムでは,楽曲の音響的・知覚的な特性に基づくオーディオ指紋(audio fingerprint) を特徴量として用いているが,本稿では,オーディオ指紋に適した高速検索手法を提案する.また,8,740 曲の楽曲データベースを用いた評価実験を行い,提案手法の有効性を示した.
- (キーワード)
- 楽曲検索 / オーディオ指紋 (audio fingerprint) / ハミング空間検索 / 質問多重化
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1541/ieejeiss.132.1481
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1390282679584466688
- ● Search Scopus @ Elsevier (DOI): 10.1541/ieejeiss.132.1481
(DOI: 10.1541/ieejeiss.132.1481, CiNii: 1390282679584466688) Zhang Le, Kazuyuki Matsumoto, Motoyuki Suzuki and Kenji Kita :
Skelton Pruning Based on the Total Bisector Angle of the End Branches,
IEEJ Transactions on Electronics, Information and Systems, Vol.132, No.5, 750-758, 2012.- (要約)
- 画像の骨格化は,画像の形状を表現する上で重要な技術であるが,境界ノイズの影響を受けやすいという欠点があり,形状マッチングをする上で大きな問題点となっている.本論文では,終端枝角の二等分線に基づく,画像骨格線の枝刈りアルゴリズムを提案するとともに,実験においてその有効性を示した.
- (キーワード)
- Skelton / Skelton Pruning / Total Bisector Angle / End Branch
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1541/ieejeiss.132.750
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1390282679586212736
- ● Search Scopus @ Elsevier (DOI): 10.1541/ieejeiss.132.750
(DOI: 10.1541/ieejeiss.132.750, CiNii: 1390282679586212736) Kazuyuki Matsumoto, Kenji Kita and Fuji Ren :
Emotional Vector Distance Based Sentiment Analysis of Wakamono Kotoba,
China Communications, Vol.9, No.3, 87-98, 2012.- (要約)
- 本研究では,日本語俗語(若者言葉)に感情を付与した辞書を自動構築するため,コーパス内において若者言葉と共起する語(主に感情表現)の感情極性ベクトルを用いて,Earth Mover's Distanceによる感情ベクトルを推定する手法を提案する.感情表現への感情極性ベクトルは,感情表現辞書と感情極性対応表を組み合わせることにより付与できる.本手法の評価実験をおこない,単語重要度を用いた従来手法よりも高精度な感情ベクトルが推定できることを明らかにした.
- (キーワード)
- Wakamono Kotoba / sentiment analysis / emotion estimation / Earth Mover's Distance
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-84861787581
(Elsevier: Scopus) Yunong Wu, Kenji Kita, Fuji Ren, Kazuyuki Matsumoto and XIN KANG :
Exploring the Importance of Modification Relation for Emotional Keywords Annotation and Emotion Types Recognition,
International Journal of Intelligent Engineering and Systems, Vol.4, No.4, 19-26, 2011.- (要約)
- 本研究では感情キーワードの付与と,感情タイプ認識における,修飾関係の重要度を推定する手法を提案した.具体的には,中国語感情コーパスRen-CECpsを用いて,程度を表す語,否定語,接続語の3つの修飾素性を抽出する.実験の結果,文に対する感情キーワードの付与と,感情タイプの認識の精度の改善を達成できた.
- (キーワード)
- Emotional Keywords Annotation / Emotion types recognition / Modification relation / CRFs
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.22266/ijies2011.1231.03
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-84859614924
(DOI: 10.22266/ijies2011.1231.03, Elsevier: Scopus) Mei Chen, Kenji Kita and Xin Luo :
Cluster-Based Reputation Model in Peer-to-Peer Network,
International Journal of Machine Learning and Computing, Vol.1, No.4, 366-371, 2011.- (要約)
- 本論文では,ピアツーピア・ネットワークにおけるクラスタに基づく評判モデル(CBRM)を提案する.このモデルは,評判メカニズムとクラスタから構成され,評判メカニズムは安全なトランザクションを実現するために用いられる.また,CBRMのトポロジーはクラスタ型であるため,評判管理の効率が向上する.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.7763/IJMLC.2011.V1.54
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.7763/IJMLC.2011.V1.54
(DOI: 10.7763/IJMLC.2011.V1.54) Wenbin Zhang, Haoze Lu, Yasuo Horiuchi, Satoru Tsuge, Kenji Kita and Shingo Kuroiwa :
Text-Independent Speaker Identification Based on Reducing Intersession Variability of Speech Feature Using PCA Transformation,
Journal of Signal Processing, Vol.15, No.4, 275-278, 2011.- (要約)
- テキスト独立な話者認識において,音声変動やセッション間変動は話者認識の精度に大きな影響を与える.本論文では,PCA変換を用いることにより,音声データのセッション間変動を削減することを提案する.提案手法を用いることにより,MFCCを用いる従来手法に比べ,誤認識率を42.6%削減でき,MFB-PCAに基づく手法に比べ,誤認識率を27.2%削減できた.
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1524232505592363648
(CiNii: 1524232505592363648) Masami Shishibori, Sangkon Lee and Kenji Kita :
An E-mail Filtering Method Based on Multi-attribute Values of Users Profile,
International Journal of Computer Applications in Technology, Vol.40, No.4, 273-279, 2011.- (要約)
- 電子メールはコミュニケーションの手段として頻繁に使われているが,役に立たない多くのメールが行きかっている.この問題を解決するために,電子メールの内容に基づき,無益な電子メールをフィルタリングする手法を提案した.提案手法は,'Sender','Theme','Type'などの多属性値から個人プロファイルを作成することにより,新規の電子メールがユーザにとって重要か否かを判断する.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1504/IJCAT.2011.041656
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1504/IJCAT.2011.041656
(DOI: 10.1504/IJCAT.2011.041656) Masami Shishibori, Daichi Koizumi and Kenji Kita :
Fast Retrieval Algorithm for Earth Mover's Distance Using EMD Lower Bounds and Skipping Algorithm,
Advances in Multimedia, Vol.2011, No.Article ID 421820, 1-9, 2011.- (要約)
- Earth Mover's Distance(EMD)は2つの分布間の距離尺度であり,画像検索を始めとするさまざまなマルチメディア情報検索において用いられている.我々は,EMDに基づく大規模データ検索を高速かつ効率的に行うためのライブラリfastEMDを開発した.本論文では,fastEMDの実装に用いられている技術およびfastEMDの性能評価実験について述べた.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1155/2011/421820
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1155/2011/421820
(DOI: 10.1155/2011/421820) Yoshihide Matsumoto, Tadashi Uemiya, Masami Shishibori and Kenji Kita :
A Method for Detecting Subtitle Regions in Videos Using Video Text Candidate Images and Color Segmentation Images,
International Journal of Advanced Intelligence (IJAI), Vol.2, No.1, 37-55, 2010.- (要約)
- 本論文では,ドラマや映画やニュースのような字幕付きの映像からテキスト領域を自動的に検出する方法を提案した.字幕は位置が不変で,エッジが強いという特徴を持っており,これらの特徴を利用することにより,テキスト領域の候補を生成する.
Fast Multidimensional Nearest Neighbor Search Algorithm Based on Ellipsoid Distance,
International Journal of Advanced Intelligence (IJAI), Vol.1, No.1, 89-107, 2009.- (要約)
- 高次元空間における最近傍検索は,マルチメディア・コンテンツ検索,データ・マイニング,パターン認識等の分野における重要な研究課題である.高次元空間では,ある点の最近点と最遠点との間に距離的な差が生じなくなるという現象が起こるため,効率的な多次元検索手法を設計することが極度に困難になる.本論文では,楕円体距離に基づく多次元検索に対し,きわめて高速な最近傍検索アルゴリズムを提案した.提案したアルゴリズムでは,楕円体距離に基づく距離計算をユークリッド距離に基づく距離計算に置き換えるために,まずデータ変換を行い,この後,ユークリッド距離計算において不要な演算を削除することにより,効率化を図る.実験結果によると,提案アルゴリズムは高次元の場合にも効率が劣化しないという特徴を持っている.
A New Method of Medical Image Retrieval based on Color-Texture Correlogram and GTI Model,
International Journal of Information Technology & Decision Making, Vol.8, No.2, 239-248, 2009.- (要約)
- 本論文では,色テクスチャ・コリログラムと一般化Tverskyインデックス(GTI)に基づく内視鏡画像の検索手法について述べた.まず色コリログラムを拡張することにより,新しい画像特徴量である色テクスチャ・コリログラムを定義した.また画像検索においては画像の類似尺度が重要であるが,本論文では,医用画像検索の類似尺度としてGTIモデルを用いた.同時に,検索効率を向上させるために,関連性フィードバックも用いた.実験により,本論文で提案した手法に有効性を示した.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1142/S0219622009003363
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1142/S0219622009003363
(DOI: 10.1142/S0219622009003363) 金西 計英, 松浦 健二, 大家 隆弘, 佐野 雅彦, 北 研二, 矢野 米雄 :
徳島大学におけるポータルシステムの構成とその運用について,
大学情報システム環境研究, Vol.12, 34-42, 2009年.- (要約)
- 現在,高等教育機関において,学内の情報化を推進するため大学ポータルの導入が進んでいる.本稿では,大学ポータルのモデルを提案する.大学ポータルとは,単一のWEBベースのシステムではなく,分散するデータベースやWEBシステムが統合したシステムであり,学内情報の基盤となるフレームワークのことである.徳島大学の大学ポータルを事例として,大学ポータルの構築,運用に関する問題を具体的に考察する.運用の様子を示し,考察をおこなう.最後に,大学ポータルの課題について考察する.
- (キーワード)
- Single Signe On / single signe on / Authentication infrastructure / authentication infrastructure / Federation / federation / Authorization / authorization / WEB Service / web service / 認証 基盤 / ニンショウ キバン / 連携 / レンケイ / 認可 / ニンカ / WEB サービス / web サービス
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1521136281064684160
(CiNii: 1521136281064684160) Masami Shishibori, Nobuki Nishikawa and Kenji Kita :
A Method to Retrieve Telops based on the Distance of Character Image Features between Queries and Telops,
International Journal of Computer Applications in Technology, Vol.35, No.2/3/4, 234-240, 2009.- (要約)
- 本論文では,映像内の文字情報である字幕に着目した映像シーン検索システムを提案する.本手法では,各字幕の文字画像特徴量と検索キーに対応する文字画像特徴量との距離に基づいて該当の字幕が出現するフレームを検索する.また,各字幕の文字画像特徴量を多次元索引化することで,検索キーの文字画像特徴量との距離計算を高速化する.さらに,本手法では検索過程で特徴量照合を行うため,前処理で文字認識処理が必要でなく,時間コストを軽減できる.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1504/IJCAT.2009.026600
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-67650324065
(DOI: 10.1504/IJCAT.2009.026600, Elsevier: Scopus) Masami Shishibori and Kenji Kita :
Construction of an Image Knowledge Database on WWW Image Retrieval Systems,
International Journal of Computer Applications in Technology, Vol.34, No.2, 108-114, 2009.- (要約)
- WWW画像検索システムのフィードバック情報を格納するための画像知識データベースの構築方法について述べた.検索質問画像がデータベース中に存在しない場合,ユーザが選択した検索画像の特徴量をデータベースに格納する.また格納時には,特徴の類似性を考慮することにより,代表的な特徴のみをデータベースに格納する.検索時には,データベースを参照して,優先順位付きで結果を提示する.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1504/IJCAT.2009.023616
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1504/IJCAT.2009.023616
(DOI: 10.1504/IJCAT.2009.023616) 獅々堀 正幹, 宮本 裕也, 柘植 覚, 北 研二 :
距離索引VP-treeにおける解絞込みの一改良手法,
電子情報通信学会論文誌(D), Vol.J91-D-I, No.3, 677-686, 2008年.- (要約)
- 本論文では,距離索引の一つであるVP-treeの改良法を提案する.VP-treeは検索時にルートから検索範囲に適合するノードをたどり,最終的にたどり着いたリーフノードに格納されたデータとの距離を算出する.しかし,リーフノードにおける距離計算が増大すると検索速度が遅くなる.そこで,リーフノードにおける絞込み法に着目し,その改良法として検索入力に対する最近傍点を三角不等式の基準点として用いる手法を提案する.実際の画像データを用いて評価実験を行った結果,従来手法に比べ検索時間を5∼12%削減することができた.
- (キーワード)
- マルチメディアデータベース / 距離索引 / VP-tree / 三角不等式
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1520853834232752000
(CiNii: 1520853834232752000) Shiro Ajioka, Satoru Tsuge, Masami Shishibori and Kenji Kita :
Fast Multidimensional Nearest Neighbor Search Algorithm Using Priority Queue,
Electrical Engineering in Japan, Vol.164, No.3, 69-77, 2008.- (要約)
- 高次元空間における最近傍検索は,マルチメディア・コンテンツ検索,データ・マイニング,パターン認識等の分野における重要な研究課題である.高次元空間では,ある点の最近点と最遠点との間に距離的な差が生じなくなるという現象が起こるため,効率的な多次元検索手法を設計することが極度に困難になる.本論文では,線形探索アルゴリズムにおける距離計算中の不要な演算を削減することにより,きわめて高速な最近傍検索アルゴリズムを提案した.さらに,不必要な演算を早期検出するために,要素の分散値を用いた次元ソート法,並びに主成分分析に基づくデータ変換法を提案した.
- (キーワード)
- nearest neighbor search / high-dimensional space / fast linear search / priority queue / multimedia information retrieval
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1002/eej.20502
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1002/eej.20502
(DOI: 10.1002/eej.20502) 西川 伸紀, 獅々堀 正幹, 柘植 覚, 北 研二 :
検索質問と字幕の文字画像特徴量間の距離に基づく字幕検索手法,
情報処理学会論文誌, Vol.48, No.SIG20, 28-38, 2007年.- (要約)
- 本論文では,高精度かつ高速な字幕検索手法を提案する.本手法では,各字幕の文字画像特徴量と検索キーに対応する文字画像特徴量との距離に基づいて該当の字幕が出現するフレームを検索する.また,各字幕の文字画像特徴量を多次元索引化するととで,検索キーの文字画像特徴量との距離計算を高速化する.実際に3時間分の映像データに対して映像中の出現頻度が比較的多い91単語を用いて検索実験を行った結果,1-gram特徴量を用いた場合には最大98.61%,2-gram特徴量を用いた場合には最大99.59%の平均適合率を得ることができた.
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050001337891836672
(CiNii: 1050001337891836672) 原 一眞, 黒岩 眞吾, 田中 康司, 柘植 覚, 任 福継, 獅々堀 正幹, 北 研二 :
符号化音声認識のための合成音声を用いた不特定話者音響モデルの適応法,
電子情報通信学会論文誌(D), Vol.J90-D, No.9, 2541-2549, 2007年.- (要約)
- 現在,IP電話端末から音声認識システムを利用する場合,音声データ通信時における音声圧縮・伸張(符号化)の影響より固定電話と比較して音声認識精度が低下する問題がある.これを回避するため,符号化された多量の音声データを用いて音響モデルを再学習,及び適応する手法が提案されている.しかし,再学習や適応に必要となる多量の音声データを収集することは多大な労力と時間が必要となる.そこで本論文では,音声データの収集を必要としない音響モデル適応手法を提案する.本提案手法は,認識に用いる音響モデルから適応に必要な音声データを自己生成する手法である.本論文ではこの手法を実現するため,音響モデルの各分布より音素波形を合成し適応に用いる「合成音素波形による音響モデルの分布適応法」と連続音声を合成し適応に用いる「連続合成音声を用いた音響モデル適応法」を提案する.符号化方式G723.1を用いた音声認識実験結果より,連続合成音声を用いた音響モデル適応法は適応前の音響モデルの認識精度を改善することが分かった.これらの結果より,提案手法は適応データの収集を必要とせず,符号化音声を高精度に認識する手法として有効であるといえる.
- (キーワード)
- 符号化音声認識 / 音声符号化 / HMM音声合成 / 音響モデル適応
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1520853833503954304
(CiNii: 1520853833503954304) Xin Luo, Masami Shishibori, Fuji Ren and Kenji Kita :
Incorporate feature space transformation to content-based image retrieval with relevance feedback,
International Journal of Innovative Computing, Information and Control, Vol.3, No.5, 1237-1250, 2007.- (要約)
- 画像検索における関連性フィードバック検索では,従来,ユーザが検索意図に関連した画像と同時に,関連しない画像も指定する必要があった.本論文では,より簡便に関連性フィードバック検索を行うため,ユーザの指定した検索結果中の関連する画像のみからフィードバック情報を生成する.特徴空間において,検索画像と関連した画像が近くなるように,空間の解像度を変えていくことにより,次第にユーザの意図する方向に特徴空間を変換する.従来手法との比較により,提案手法の優位性を示した.
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-63649127226
(Elsevier: Scopus) Atsushi Inouchi, Shuichi Shinohara, Hiroshi Inoue, Kenji Kita and Mitsuo Itakura :
Identification of specific sequence motifs in the upstream region of 242 human miRNA genes.,
Computational Biology and Chemistry, Vol.31, No.3, 207-214, 2007.- (要約)
- 本論文では,miRNAステムループ配列におけるmiRNA特異的上流配列モチーフの同定手法を提案する.提案手法は,ヒトmiRNA上流塩基配列からモチーフ検索プログラムにより検出された配列モチーフの出現頻度を,ヒトmiRNA上流塩基配列と比較対照となるマウスmiRNA上流塩基配列,ヒトタンパク質コーディング遺伝子流塩基配列間で比較・検定することにより,そのmiRNA特異性を検討し,既知転写因子結合部位との配列マトリックス比較により,その新規性を検討する.また,提案手法の有効性検証のために,遺伝子データベースを用いた,配列モチーフ同定実験を行った.
- (キーワード)
- Animals / Base Composition / Base Sequence / Computational Biology / Consensus Sequence / CpG Islands / Databases, Genetic / GC Rich Sequence / Humans / Mice / MicroRNAs / Response Elements
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1016/j.compbiolchem.2007.03.011
- (文献検索サイトへのリンク)
- ● PubMed @ National Institutes of Health, US National Library of Medicine (PMID): 17499549
- ● Summary page in Scopus @ Elsevier: 2-s2.0-34248596571
(DOI: 10.1016/j.compbiolchem.2007.03.011, PubMed: 17499549, Elsevier: Scopus) 柘植 覚, 黒岩 眞吾, 獅々堀 正幹, 任 福継, 北 研二 :
分散音声認識における実時間周波数特性正規化手法,
情報処理学会論文誌, Vol.48, No.2, 900-908, 2007年.- (要約)
- 本論文では,分散音声認識における入力系の周波数特性の際による認識率劣化を抑制する周波数特性正規化手法として,複数参照ケプストラムを用いた実時間周波数特性正規化手法を提案した.
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050001337882493184
(CiNii: 1050001337882493184) 獅々堀 正幹, 大西 泰代, 柘植 覚, 北 研二 :
Earth Mover's Distanceを用いたハミングによる類似音楽検索手法,
情報処理学会論文誌, Vol.48, No.1, 300-311, 2007年.- (要約)
- 本論文では,距離尺度としてEarth Mover's Distance (EMD)を用いたハミング検索手法を提案する.EMDは輸送問題における輸送コストの最適解であり,本手法では輸送問題における各供給地が有する資源量を各音符の音長,輸送コストを各音符の出現時間と音高情報から算出することで,リズムと音程との類似度を同じ距離尺度で計り,全体の曲調が類似した曲を検索する.さらに,EMDの計算量が音符数に対して指数関数的に増加することに着目し,検索精度を維持しつつ計算コストを低減可能な音楽特徴量を提案する.
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050845762812636800
(CiNii: 1050845762812636800) 小泉 大地, 獅々堀 正幹, 中川 嘉之, 柘植 覚, 北 研二 :
WWW画像検索システムにおける有害画像フィルタリング手法,
情報処理学会論文誌, Vol.47, No.SIG8, 147-156, 2006年.- (要約)
- 本論文では,ユーザ・サイドで構築したURLデータベースを用いて,既存のWWW画像検索システムの検索結果から有害画像をフィルタリングする手法を提案する.本手法は有害画像を象徴する単語群を用意するだけでURLデータベースを自動構築する.URLデータベースにはURLのパスごとに有害度の重みづけを行い,有害性の高いURLを部分的に識別することで高精度なフィルタリングを実現する. Google Image Searchを対象として有害な画像が検索される27個の検索キーに対する評価実験を行った結果,F尺度として約70%のフィルタリング精度が得られた.
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050282812868568960
(CiNii: 1050282812868568960) 味岡 四郎, 柘植 覚, 獅々堀 正幹, 北 研二 :
順位キューを用いた多次元データの高速近傍検索アルゴリズム,
電気学会論文誌C (電子,情報,システム部門誌), Vol.126, No.3, 353-360, 2006年.- (要約)
- 高次元空間における最近傍検索は,マルチメディア・コンテンツ検索,データ・マイニング,パターン認識等の分野における重要な研究課題である.高次元空間では,ある点の最近点と最遠点との間に距離的な差が生じなくなるという現象が起こるため,効率的な多次元検索手法を設計することが極度に困難になる.本論文では,線形探索アルゴリズムにおける距離計算中の不要な演算を削減することにより,きわめて高速な最近傍検索アルゴリズムを提案した.さらに,不必要な演算を早期検出するために,要素の分散値を用いた次元ソート法,並びに主成分分析に基づくデータ変換法を提案した.
- (キーワード)
- 最近傍検索 / 高次元空間 / 高速線形探索 / マルチメディア情報検索 / Nearest neighbor search / High dimensional space / Fast linear search / Priority queue / Multimedia information retrieval
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1541/ieejeiss.126.353
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1390001204606139392
- ● Summary page in Scopus @ Elsevier: 2-s2.0-33644796982
(DOI: 10.1541/ieejeiss.126.353, CiNii: 1390001204606139392, Elsevier: Scopus) Satoru Tsuge, Masami Shishibori, Fuji Ren, Kenji Kita and Shingo Kuroiwa :
Specific Speaker's Japanese Speech Corpus over Long and Short Time Periods,
Advances in Natural Language Processing Research in Computing Science, Vol.18, 115-124, 2006.- (要約)
- 話者内音声変動と音声認識性能との関連性を調べるために,日本語の音声コーパスを長期間にわたり作成しており,本コーパスの概要について述べた.本コーパスは,6名の話者が週に1日,1日に3回,発話した内容を収録したものである.話者内音声変動と音声認識性能との関連性を調べるための実験を,1名の女性話者データを用いて行った結果,1日内の変動よりも複数日にわたる変動のほうが大きいことを示した.
Simple PCAを用いたベクトル空間情報検索モデルの次元削減,
電気学会論文誌C (電子,情報,システム部門誌), Vol.125, No.11, 1773-1779, 2005年.- (要約)
- 本稿では,情報検索の代表モデルであるベクトル空間モデル (VSM; Vector Space Model)の次元削減手法として,Simple Principal Component Analysis (SPCA)を用いることを提案した. SPCAは簡単な繰り返し演算により,主成分を寄与率の大きい順に求めていく近似的な主成分分析手法であり,SVD等の行列演算を基本とする手法に比べ計算量が格段に少ないという特長がある. MEDLINEを用いた検索実験を行った結果,削減後の次元数によらず,SVDに比べて同等以上の平均適合率を得た. また,この実験における最高の平均適合率はSPCAで0.694(次元数40), SVDで0.663(次元数50)であり,SPCAを用いることで誤り率は約1割 削減されている.
- (キーワード)
- 情報検索 / ベクトル空間モデル / 次元削減 / Simple PCA / クラスタリング / Information retrieval / Vector Space Model / Dimensionality Reduction / Simple PCA / clustering
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1541/ieejeiss.125.1773
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1390282679580608000
- ● Search Scopus @ Elsevier (DOI): 10.1541/ieejeiss.125.1773
(DOI: 10.1541/ieejeiss.125.1773, CiNii: 1390282679580608000) 羅 辛, 邰 暁英, 獅々堀 正幹, 北 研二 :
Image Database Retrieval Based on Relevance Feedback by Feature Space Warping,
計算机科学, Vol.32, No.7, 235-238, 2005年.- (要約)
- 画像検索における関連性フィードバック検索では,従来,ユーザが検索意図に関連した画像と同時に,関連しない画像も指定する必要があった.本論文では,より簡便に関連性フィードバック検索を行うために,検索結果から,ユーザの必要な画像だけを指定していくことにより,次第にユーザの意図する方向に特徴ベクトルを漸近的に近づけていく手法を提案した.従来手法との比較により,提案手法の優位性を示した.
言語表現のベクトル空間モデルにおける最適な計量距離,
電子情報通信学会論文誌(D-II), Vol.J88-D-II, No.4, 747-756, 2005年.- (要約)
- 自然言語処理の手法にはコサイン距離, すなわち単純なユークリッド距離に依存しているものが多いが, この距離は素性間の相関を考慮しないこと, また素性に恣意的な重みづけを必要とするという問題をもっている.本論文ではこれに代わり, 訓練データより導かれる最適な計量距離を提案し, 二つの問題を同時に解決する.この計量は訓練データのクラスタ構造のひずみを最小化する二次最適化問題の解として導くことができる.提案する計量距離の効果を, 同義文検索, 文書検索, 及び機械学習用一般ベクトルデータのクラスタリングタスクによって確認し, ユークリッド距離に対し常に精度の改善が見られた.特にクラスタ化の強い同義文検索タスクにおいて精度の改善が大きく, ベースラインと比較して11点平均精度で33%の向上があった.
- (キーワード)
- 距離計量 / コサイン距離 / 素性空間 / カーネル法
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1520572357970628608
(CiNii: 1520572357970628608) 柘植 覚, 黒岩 眞吾, 獅々堀 正幹, 北 研二 :
ETSI標準分散音声認識フロントエンドにおける入力系の周波数特性正規化手法,
電気学会論文誌C (電子,情報,システム部門誌), Vol.125, No.1, 120-127, 2005年.- (要約)
- 本論文では,分散型音声認識方式における入力系の周波数特性の異なりによる音声認識精度の変動を抑制する手法として,平均一致化手法を提案した.提案手法は入力特徴量の平均と圧縮に用いるVQセントロイドとの平均を一致させ,入力系の周波数特性を正規化する.提案手法の有効性を検証するためETSIが勧告している分散型音声認識フロントエンドを用いた音声認識実験を行った結果,提案手法より周波数特性の変動による音声認識精度の低下を抑制することが可能であった.
- (キーワード)
- 入力デバイスの周波数特性 / 量子化歪み / Distributed speech recognition / ETSI standard DSR front-end / Frequency characteristic of input device / VQ distortion
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1541/ieejeiss.125.120
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1390282679581397888
- ● Search Scopus @ Elsevier (DOI): 10.1541/ieejeiss.125.120
(DOI: 10.1541/ieejeiss.125.120, CiNii: 1390282679581397888) 柘植 覚, 獅々堀 正幹, 黒岩 眞吾, 北 研二 :
Non-negative Matrix Factorizationを用いたベクトル空間情報検索モデルの次元削減手法,
電気学会論文誌C (電子,情報,システム部門誌), Vol.124, No.7, 1500-1506, 2004年.- (要約)
- ベクトル空間情報検索モデルを用いた全文検索を行う場合,各文書を表現する索引語ベクトルがスパースになることが問題となる.そこで,本論文ではベクトル空間モデルの次元削減により情報検索精度を向上させる.次元削減には,非負行列である文書行列に対する次元削減手法として,Non-negative Matrix Factorization (NMF)を適用した.NMFは非負行列を2つの非負行列へ分解を行う手法である.提案手法は,NMFを用い非負行列である索引語文書行列を分解し,その一方の行列へ索引語文書行列を射影することにより,次元削減を行う手法である.MEDLINEを用いた情報検索実験で提案手法の有効性を示した.
- (キーワード)
- 類似文書検索 / ベクトル空間モデル / Non-negative Matrix Factorization / 次元圧縮
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1541/ieejeiss.124.1500
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1390282679580788480
- ● Search Scopus @ Elsevier (DOI): 10.1541/ieejeiss.124.1500
(DOI: 10.1541/ieejeiss.124.1500, CiNii: 1390282679580788480) 獅々堀 正幹, 小泉 大地, 柘植 覚, 北 研二 :
画像知識データベースを用いたWWW画像検索システムの開発,
電子情報通信学会論文誌(D-I), Vol.J87-D-I, No.2, 154-163, 2004年.- (要約)
- ユーザからのフィードバック情報を格納した画像知識データベースを用いたWWW画像検索システムを開発した.本システムでは,既存システムの結果からユーザが選択した正解画像の画像的特徴量をフィードバック情報としてデータベースに登録することで,次回の検索の際,このデータベースを教師データとして,より類似している画像を優先的に提示することができる.従来システムとしてGoogle Image Searchを用い,130個の検索キーに対する評価実験を行った結果,11.6%の精度向上が確認できた.
- (キーワード)
- WWW画像検索システム / 類似画像検索 / 両像知識データベース / World Wide Web
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1520572358455627008
(CiNii: 1520572358455627008) 北 研二, 獅々堀 正幹 :
1次元自己組織化マップを用いた高次元データの高速近傍検索,
自然言語処理, Vol.10, No.5, 41-54, 2003年.- (要約)
- 高次元空間における最近傍検索は,マルチメディア·コンテンツ検索,データ·マイニング,パターン認識等の分野における重要な研究課題であるが,効率的な多次元インデキシング手法は,従来,存在しなかった.本論文では,自己組織化マップを用いて,高次元空間での近傍関係をできる限り保ちつつ,高次元データを1次元空間へ配置し,1次元マップから得られる情報を用いて探索範囲を限定することにより,きわめて高速な最近傍検索手法を提案した.
- (キーワード)
- 最近傍検索 / 多次元インデキシング / マルチメディア・コンテンツ検索 / 自己組織化マップ
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.5715/jnlp.10.5_41
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1520853834973292928
- ● Search Scopus @ Elsevier (DOI): 10.5715/jnlp.10.5_41
(DOI: 10.5715/jnlp.10.5_41, CiNii: 1520853834973292928) Tai Xiaoying, Fuji Ren and Kenji Kita :
Improvement of vector space information retrieval by using long-term relevance feedback,
Asian-Information-Science-Life, Vol.2, No.1, 83-96, 2003.- (要約)
- 従来のベクトル空間モデルを情報検索に応用すると検索精度の低下がある.本論文では,長期的にベクトル空間モデルに基づく検索システムにユーザからのフィードバック情報を残す新しい方法を提案する.検索精度を高めるため,ユーザからの適合性の判定結果だけではなく,文書間距離などの情報も検索モデルに組み入れ,線形変換によりベクトル空間検索モデルを構築する.本論文で提案した手法の有効性を確かめることができた.
サポートベクターマシンによる適合性フィードバックを用いた情報検索,
情報処理学会論文誌, Vol.44, No.1, 59-67, 2003年.- (要約)
- 本論文では,ベクトル空間情報検索モデルを用いた全文検索精度の向上を目指した.本論文では,サポートベクターマシンを用いた適合性フィードバック手法を提案した.提案手法は,利用者からの適合·不適合の情報をもとにサポートベクターマシンを学習させ,利用者が要求する検索文書を識別し,不適合文書を利用者に提示しない手法である.日本語全文検索テストコレクションを用い,提案手法の有効性を検証する実験を行い,提案手法が全文検索に有効であることを示した.
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050564287837317504
(CiNii: 1050564287837317504) Tai Xiaoying, Fuji Ren and Kenji Kita :
An information retrieval model based on vector space method by supervised learning,
Information Processing & Management, Vol.38, No.6, 749-764, 2002.- (要約)
- 本論文は,部分問題の質問に適切なドキュメントのユーザに供給された情報の利用により,ベクトル空間モデルの検索パフォーマンスを改善する方法を提案する.ユーザの関連フィードバック情報に加えて,原本類似性のような情報は検索モデルに組み入れられる.それは一次変換のシーケンスの使用により構築される.その後,高次元で希薄なベクトルは特異値分解によって縮小され,低次元のベクトル空間(すなわち言葉の潜在している意味的な意味を表わすスペース)に変形される.提案した手法によりいろいろなテストを行ったが,その有効性を証明することができた.
- (キーワード)
- 情報検索 (information retrieval) / ドキュメント / フィードバック情報 / ベクトル空間モデル
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1016/S0306-4573(01)00053-X
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1573950401491463680
- ● Search Scopus @ Elsevier (DOI): 10.1016/S0306-4573(01)00053-X
(DOI: 10.1016/S0306-4573(01)00053-X, CiNii: 1573950401491463680) 台 暁英, 獅々堀 正幹, 北 研二, 任 福継 :
長期的適合性フィードバックによるベクトル空間モデルの精度改善,
情報, Vol.5, No.2, 255-265, 2002年.- (要約)
- 本論文では,ユーザからのフィードバック情報を,長期的にベクトル空間モデルに基づく検索システムに残す方法を提案する.提案するモデルでは,検索精度を高めるため,ユーザからの適合性の判定結果だけではなく,文書間距離などの情報も検索モデルに組み入れ,線形変換によりベクトル空間検索モデルを構築する.その後,ベクトル空間モデルの高次元行列を特異値分解により縮退し,低次元のベクトル空間,つまり索引語と文書の潜在的な意味構造を表した意味空間に変換する.提案手法により,実験システムを構築し,二つのテストコレクションを用いて,評価実験を行った.本論文で提案した手法の有効性を確かめることができた.
- (キーワード)
- ベクトル空間モデル / 文書間距離 / フィードバック情報 / 高次元行列
教師あり学習によるベクトル空間情報検索モデルの精度改善,
電気学会論文誌C (電子,情報,システム部門誌), Vol.121-C, No.10, 1647-1653, 2001年.- (要約)
- 本論文では,教師あり学習によるベクトル空間情報検索モデルの精度改善手法について述べた.提案手法を用いて,線形変換により検索質問集合に対する適合性情報および文書間距離情報を検索モデルに組み入れることにより,ユーザからのフィードバック情報を長期的に検索システムに反映させることが可能となった.
情報検索システムの統計的手法による特徴と精度の分析,
自然言語処理, Vol.8, No.1, 85-99, 2001年.- (要約)
- 本論文では,情報検索システムの平均適合率,再現率·適合率曲線を直線回帰させた傾きと切片が,システムで用いられている手法とどのような相関関係を持っているかを調査し,それぞれの手法がシステムの性能に与える大きさを統計的観点から分析した.
- (キーワード)
- 情報検索 / IREXワークショップ / 性能評価 / 適合率 / 再現率
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.5715/jnlp.8.85
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1390001204476116352
- ● Search Scopus @ Elsevier (DOI): 10.5715/jnlp.8.85
(DOI: 10.5715/jnlp.8.85, CiNii: 1390001204476116352) 佐々木 稔, 北 研二 :
ランダム·プロジェクションによるベクトル空間情報検索モデルの次元削減,
自然言語処理, Vol.8, No.1, 5-19, 2001年.- (要約)
- ベクトル空間モデルは,情報検索における代表的な検索モデルである.ベクトル空間モデルでは,文書を索引語の重みベクトルで表現するが,文書ベクトルは一般に要素数が非常に多く,スパースなベクトルになるため,検索時間の長さや必要なメモリ量が大きな問題となる.本論文では,この問題を解決するために,文書ベクトルの次元圧縮を行う手法としてランダム·プロジェクションを用いた検索モデルを提案した.
- (キーワード)
- 情報検索 / ベクトル空間モデル / ランダム・プロジェクション / LSI / 概念ベクトル
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.5715/jnlp.8.5
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1390282679452831488
- ● Search Scopus @ Elsevier (DOI): 10.5715/jnlp.8.5
(DOI: 10.5715/jnlp.8.5, CiNii: 1390282679452831488) 小田 裕樹, 北 研二 :
PPM*言語モデルを用いた日本語単語分割,
情報処理学会論文誌, Vol.41, No.3, 689-700, 2000年.- (要約)
- 日本語の単語分割の精度を向上させるために,データ圧縮アルゴリズムPPM* (Prediction by Partial Matching)を用いた言語モデルを適用した単語分割手法を提案した.PPM*は,確率·統計的テキスト圧縮技報として優れており,無限長文脈を取り扱うことができるという利点を持っているため,通常の文字n-gramモデルよりも頑健な単語分割を行うことができるようになった.
文字クラスモデルによる日本語単語分割,
自然言語処理, Vol.6, No.7, 93-108, 1999年.- (要約)
- 日本語処理において,単語の同定,すなわち文の単語分割は最も基本的かつ重要な処理である.本論文では,日本語文字のクラス分類により得られた文字クラスの確率モデルを用いた新しい単語分割手法を提案した.また,対話文データベースを用いた評価実験の結果,文字クラスモデルは単純な文字連鎖の確率モデルよりも,高い精度を達成できることを示した.
Automatic Clustering of Languages Based on Probabilistic Models,
Journal of Quantitative Linguistics, Vol.6, No.2, 167-171, 1999.- (要約)
- 各言語の言語データから確率的言語モデルを構築し,次に確率的言語モデルの間に導入した距離に基づき,元の言語に対するクラスタリングを実行する方法を提案した.また,ECI多言語コーパス中の19ヶ国語のテキストデータから,言語の系統樹を再構築する実験を行い,提案した方法の有効性を示した.
単語の位置情報に基づくコーパスからのコロケーションの自動抽出,
自然言語処理, Vol.5, No.1, 79-99, 1998年.- (要約)
- コーパス中の単語位置情報に基づき,連語表現(コロケーション)を自動抽出する手法を提案した.提案した手法では,コーパス中に各単語の位置情報を用いて,任意の文中のコロケーションを連続型・不連続型の別に抽出する.実験の結果,連続型・不連続型コロケーションともに重要な表現が抽出されており,提案した手法の有効性を示すことができた.
発話タイプ付きコーパスを用いた確率的対話モデルの自動生成,
自然言語処理, Vol.4, No.4, 73-85, 1997年.- (要約)
- 高次の言語情報である対話に対する確率的モデルを,エルゴード HMM および確率オートマトンを用いて,コーパスから自動的に生成するための方法について述べた.これらの確率的対話モデルを用いることにより,話者の交替や質問・応答・確認といった会話の基本的な構造を確率・統計的な観点からモデル化することができた.また,得られた確率的対話モデルを,情報理論的な観点から評価した.
確率的言語モデルに基づく多言語コーパスからの言語系統樹の再構築,
自然言語処理, Vol.4, No.3, 71-82, 1997年.- (要約)
- 各言語の言語データから確率的言語モデルを構築し, 次に確率的言語モデルの間に導入した距離に基づき, 元の言語に対するクラスタリングを実行する方法を提案した. 提案した方法を用いることにより,言語系統樹の構築を自動的に行うことが できることを示した.
Collocations in Language Learning: Corpus-based Automatic Compilation of Collocations and Bilingual Collocation Concordancer,
Journal of Computer Assisted Language Learning, Vol.10, No.3, 229-238, 1997.- (要約)
- 大規模な言語データであるコーパスから連語表現(コロケーション)を自動抽出する方法,および 抽出された表現を外国語学習に適用する方法について述べた.連語表現をコーパスから効率的に抽出するために,仕事量基準と木構造を用いる方法を提案した.また,学習者に対し,母国語と外国語の間で,対応する連語表現を並べて提示できるようなツール(bilingual concordancer)を提案した.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1080/0958822970100303
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1080/0958822970100303
(DOI: 10.1080/0958822970100303) Kenji Kita :
Mixture Probabilistic Context-Free Grammar: An Improvement of a Probabilistic Context-Free Grammar Using Cluster-Based Language Modeling,
Journal of Natural Language Processing, Vol.3, No.4, 103-113, 1996.- (要約)
- 自然言語の確率·統計的モデルとして,混合確率文脈自由文法という新しい言語モデルを提案した.このモデルは,言語モデルのパラメータはトピックやドメインにより異なった確率分布を持っていると仮定している.混合確率文脈自由文法では,学習データを幾つかのクラスタに分割し,各クラスタから学習した確率文脈自由文法を組み合わせることにより,場面·状況依存の言語現象を取り扱うことができるという利点がある.
One-Pass Search Algorithm for Continuous Speech Recognition Using Generalized LR Parsing: A CFG-Driven, Frame-Synchronous HMM-Based Approach,
Transactions of Information Processing Society of Japan, Vol.36, No.5, 1252-1259, 1995.- (要約)
- 隠れマルコフモデル(HMM),LR パーザ,One-Pass サーチを統合化した 新しい連続音声認識アルゴリズムを提案した.提案したアルゴリズムを用いることにより,文脈自由文法に基づく構文制約のもとで探索空間を順次縮小しながら,確率的音響モデルであるHMMを駆動できるため,きわめて効率的に音声認識を行うことができる.提案したアルゴリズムには,LRパス統合,共有化木構造スタック,LRパーザに基づく動的ネットワーク生成という3つの技術を導入している.
A Comparative Study of Automatic Extraction of Collocations from Corpora: Mutual Information vs. Cost Criteria,
Journal of Natural Language Processing, Vol.1, No.1, 21-33, 1994.- (要約)
- 言語学習の使用に供するために,大規模な言語データであるコーパスからコロケーションに関する知識を獲得することに関し述べた.まず,第2外国語学習におけるコロケーション知識の重要性を論じ,次にコーパスからコロケーションを自動的に抽出するための尺度として,相互情報量と仕事量基準を用いた場合の比較について述べた.
- (キーワード)
- corpus
HMMと一般化LR構文解析法を用いた実時間大語彙連続音声認識装置の実現,
日本音響学会誌, Vol.50, No.9, 723-729, 1994年.- (要約)
- 大語彙の連続音声認識を実時間で処理するための,HMM-LR 連続音声認識装置の設計,開発及び処理性能について述べた.処理量が極めて大きな継続時間制御付きトレリス計算を伴うHMM-LR連続音声認識を実時間で実行するために,本装置は種々の高速化手法を33個のDSPを用いて実現した.その結果,連続文節発声の入力音声に対し,入力文の長さに依らずに,発声終了後から2∼3秒ですべての認識処理を終了する処理速度を達成した.
Spoken Sentence Recognition Based on HMM-LR with Hybrid Language Modeling,
IEICE Transactions on Information and Systems, Vol.E77-D, No.2, 258-265, 1994.- (要約)
- 統語的言語モデルと確率的言語モデルを融合した日本語連続音声認識について述べた.ベースライン・システムにHMM-LR音声認識システムを採用し,このシステムを改良することにより連続的に話された文を認識できるようにした.改良点は,(1)単語発声と連続発声データを用いたHMM学習,(2)文に対する文法の開発,(3)統計的言語モデルの導入の3つである.
仕事量基準を用いたコーパスからの定型表現の自動抽出,
情報処理学会論文誌, Vol.34, No.9, 1937-1943, 1993年.- (要約)
- 自然言語において頻繁に使用される定型的な表現をコーパスから自動的に抽出する基準として仕事量という概念を提案した.仕事量は,いくつかの単語を一まとまりの単位と考えることにより,各単語を別個に処理するよりも,どれだけの処理が削減できるかということを定量的に測る尺度である.また,仕事量基準を用いた定型表現の抽出方法について述べ,提案した方法が有効であることを実験的に示した.
Three Different LR Parsing Algorithms for Phoneme-Context-Dependent HMM-Based Continuous Speech Recognition,
IEICE Transactions on Information and Systems, Vol.E76-D, No.1, 29-37, 1993.- (要約)
- 連続音声認識において,コンテキスト依存の HMM 音韻モデルを駆動することのできる LR パーザの3通りの実現アルゴリズムを提案し,連続音声認識において評価した.また,認識実験の結果を検討し,提案した3通りのアルゴリズムの効率を比較した.
LR Parsing with a Category Reachability Test Applied to Speech Recognition,
IEICE Transactions on Information and Systems, Vol.E76-D, No.1, 23-28, 1993.- (要約)
- LR 解析法に上位文法カテゴリへの到達可能性照合機構を組み入れた LR-CRT アルゴリズムを提案した.このアルゴリズムを用いることにより,ある特定の文法カテゴリに属する解析結果だけを効率的に求めることが可能となる.また,このアルゴリズムを音声認識へ適用し,評価を行った結果,単語認識率97.5%,文認識率91.2%という高い精度を達成することができた.
Processing Unknown Words in Continuous Speech Recognition,
IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences, Vol.E74, No.7, 1811-1816, 1991.- (要約)
- 音声認識における未知語処理方法として,タスクを記述する通常の文法と,音韻間の制約を記述した文法の 2 つを 用いることにより,未知語の部分を音韻のつながりとして認識する方法を提案した.
Continuous Speech Recognition Using Two-Level LR Parsing,
IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences, Vol.E74, No.7, 1806-1810, 1991.- (要約)
- 日本語の音声認識に適した方法として, 文節内および文節間の 2 つのレベルの文法を段階的に 用いる 2 段階 LR 解析法を提案した. また,日本語の音声認識評価実験を行い,単語認識率95.9%,文認識率84.7%という高い精度を達成した.
- (キーワード)
- 音声認識 (speech recognition)
HMM Speech Recognition Using Stochastic Language Models,
The Journal of the Acoustical Society of Japan, Vol.12, No.3, 99-105, 1991.- (要約)
- 言語的な尤度を計算するのに有効な確率的言語モデルとして, 日本語音節の連鎖統計情報,確率文脈自由文法,文脈自由文法の生成規則の連鎖統計情報 の 3 つのモデルを音声認識に適用し,各モデルの有効性を示した.
- (キーワード)
- 音声認識 (speech recognition)
HMM-LR音声認識システムの性能評価,
日本音響学会誌, Vol.46, No.10, 817-823, 1990年.- (要約)
- HMM 音韻認識と拡張 LR 構文解析法を統合化した HMM-LR 音声認識システムに セパレートベクトル量子化,HMM の継続時間長制御,VQ コードブック·マッピングに基づく話者適応 を組み入れることによりシステムの改良を行った. 日本語文節認識実験で評価を行い,システムの有効性を示した.
- (キーワード)
- 音声認識
HMM音韻認識と拡張LR構文解析法を用いた連続音声認識,
情報処理学会論文誌, Vol.31, No.3, 472-480, 1990年.- (要約)
- 高精度の音声認識を実現するためには,言語的な情報の利用が不可欠である. 本論文では,文脈自由文法に基づく統語的(文法的)な制約を音声認識時に用いる方法について検討し, 拡張 LR 構文解析法と HMM (Hidden Markov Model)を用いた 音声認識手法を提案した.提案した手法では,音声認識と言語処理の間に音韻ラティス等の中間的なデータを介さないため,高精度のかつ効率的な認識処理系を構成することができるという特徴を持っている.
直観主義的解析学の諸原理,
科学基礎論研究, Vol.16, No.1,2, 69-75, 1983年.- (要約)
- 本論文は,直観主義論理的論理に基づく解析学である直観主義的解析学での公理の意味を明らかかにすると共に,直観主義的解析学の公理系から,古典的解析学では成立しえない 定理をいくつか導き,これらの定理の意味論的立場での解釈について論じた.
- MISC
- 佐野 雅彦, 北 研二 :
徳島大学キャンパスネットワークシステムの更新について,
大学情報システム環境研究, 94-102, 2010年.- (要約)
- 徳島大学で平成22年3月に行われたキャンパスネットワークの更新について述べた.ネットワークのさまざまな問題点を調査し,可用性向上,帯域拡大,高機能化,低運用コスト化等の課題について検討し,更新を行った.
- (キーワード)
- キャンパス ネットワーク 更新 / キャンパス ネットワーク コウシン / ネットワーク の 可用性 / ネットワーク ノ カヨウセイ / 運用 コスト 削減 / ウンヨウ コスト サクゲン / Update of campus network / update of campus network / Availability of network / availability of network / Operation cost reduction / operation cost reduction
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1521417756041793408
(CiNii: 1521417756041793408) Xin Luo, 獅々堀 正幹, 北 研二 :
画像検索のための距離尺度の学習,
広西師範大学学報, Vol.25, No.2, 186-189, 2007年.- (要約)
- 画像検索システムの性能は,データベース中の画像を表現する低レベルの特徴量によって決められる.本論文では,単純なクラスタと少量の学習データから,特徴量間の距離尺度を自動的に学習する手法を提案する.自動学習により得られた距離尺度を用いることにより,画像検索性能を改善することができた.
Value行列を手掛かりとした Transformerの分析,
人工知能学会論文誌, Vol.38, No.2, 2023年.- (キーワード)
- Transformer / value matrix / word embedding
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1527/tjsai.38-2_C-MB7
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1390013795251121280
- ● Search Scopus @ Elsevier (DOI): 10.1527/tjsai.38-2_C-MB7
(DOI: 10.1527/tjsai.38-2_C-MB7, CiNii: 1390013795251121280) 獅々堀 正幹, 山本 一晴, 小泉 大地, 北 研二 :
URLの類似性に着目したWWW空間からの関連語自動収集手法,
日本データベース学会Letters, Vol.6, No.1, 57-60, 2007年.- (要約)
- 本論文では,シーズとなる単語群(基底単語群)の関連語をWWW空間から効率的に自動収集する手法を提案する.基底単語群が存在するページのURL集合と関連語が存在するURL集合間に類似性があると予測される.そこで本手法では,基底単語群を既存のWWW検索システムに入力することで得られる検索結果のURLをデータベース化し,基底単語群のURLデータベースと類似性を計算することで,関連語を効率的に収集する.
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1520290884798639104
(CiNii: 1520290884798639104)
- 総説・解説
- 藤澤 日明, 松本 和幸, 奥村 紀之, 吉田 稔, 北 研二 :
アスキーアートへの挑戦 - 画像特徴量によるアプローチ -,
人工知能学会誌(-2013), Vol.32, No.3, 364-370, 2017年5月.- (キーワード)
- アスキーアート / 画像特徴 / 非言語表現 / 顔文字 / histograms of oriented gradients
- (徳島大学機関リポジトリ)
- ● Metadata: 113912
(徳島大学機関リポジトリ: 113912) 北 研二, 山川 義介 :
類似画像検索技術を用いた商品推薦システム 『SUDACHI』の開発とその応用,
画像ラボ, Vol.19, No.8, 11-15, 2008年8月. 北 研二, 山本 幹雄 :
確率·統計情報を用いた文法研究,
日本語学, Vol.19, No.4, 202-212, 2000年4月.- (要約)
- 言語データ(コーパス)を重視する経験主義的な方法論の有効性と,言語データをもとにした文法の研究について,確率文脈自由文法と確率木置換文法を例にとり説明した.
確率·統計的言語モデル,
Computer Today, No.3, 28-33, 2000年3月.- (要約)
- 確率·統計的言語モデルの基本的な考え方,および,応用例として統計的機械翻訳などについて述べた.
確率·統計モデルの音声言語処理への応用,
人工知能学会誌(-2013), Vol.10, No.2, 25-32, 1995年3月.- (要約)
- 音声言語の確率·統計的モデルが,実際の音声認識や自然言語処理でどのように用いられているのかを中心に説明した.また,確率文脈自由文法の弱点である文脈情報や語彙情報の記述能力の不足を解消する試みとして,履歴に基づく文法や決定木パーザなどの新しい構文解析モデルについても解説した.
音声言語の確率モデル,
人工知能学会誌(-2013), Vol.10, No.2, 17-24, 1995年3月.- (要約)
- 音声言語処理におけるマルコフモデルを基本とした確率モデル,および,最尤推定法やEMアルゴリズムを基本としたモデルのパラメータ推定法について述べた.
- 講演・発表
- Shohei Noguchi, Kazuyuki Matsumoto, Minoru Yoshida, Ryota Nishimura and Kenji Kita :
Extraction of keywords from disease-fighting blogs by fine-tuning the T5 model,
2022 6th International Conference on Natural Language Processing and Information Retrieval, Dec. 2022.- (要約)
- To measure lifestyle-related diseases such as heart disease and diabetes, which are on the increase, information on patients' lifestyles is necessary. With the growth of the Internet culture in recent years, a great deal of valuable information about patients' long fight against the disease, including lifestyle and condition changes, is now being written in the form of blogs and tweets. In this study, keywords related to changes in health status are extracted from "disease-fighting blogs" using Named Entity Recognition system, which is fine-tuned the "T5 Model", one of the latest deep learning and natural language processing models. This method can be applied to a system that informs patients and health care professionals how their lifestylehabits affect their health status.
- (キーワード)
- disease-fighting blog / named entity recognition / T5
Emotion and personality estimation of utterances in a dialogue model reflecting personality,
Proceedings of 4th International Conference on Technological Competency as Caring in Nursing and Health Sciences 2022, 105, Online, Dec. 2022.- (要約)
- One of the factors that enable humans to interact with AI in a friendlier manner is personality, and since the personality required of AI varies depending on the situation and context, a mechanism is needed that allows AI to switch between different personalities depending on the person with whom he or she is interacting. In this study, we use a Japanese language Transformer Encoder-decoder dialogue model (Japanese-dialog-transformers) and aim to construct a dialogue model that reflects the personality of the target person by fine-tuning the interview dialogue data. By analyzing the output of the proposed dialogue models using the MBTI estimation model and the sentiment analysis model, we evaluate the consistency of the personality and discuss the differences and similarities among the dialogue models.
- (キーワード)
- 自然言語処理 (natural language processing) / 対話モデル / 人工知能 (artificial intelligence) / 深層学習 (deep learning)
Affective Analysis and Visualization from Posted Text, Replies, and Images for Analysis of Buzz Factors,
Frontiers in Artificial Intelligence and Applications (FAIA), Fuzzy Systems and Data Mining VIII, Vol.358, 191-203, Nov. 2022.- (要約)
- In this study, we propose a method to visualize the factors that contribute to the buzz phenomenon triggered by Twitter posts. The analysis included tweets, images, and replies. Replies are after-the-fact responses posted in response to a posted tweet and therefore cannot be used to predict buzz phenomena. Therefore, they cannot be used to predict the buzz phenomena. In this study, the tweet body, images, and reply text were feature vectors, and an affective analysis model was constructed. Visualization of the relationship between the sensibility features output from this model and the number of RTs and likes (echo index), which represent the scale of the buzz, will be useful for analyzing the factors behind the popularity. Consequently, the subjective sensibility information with the most likes also tended to have a higher degree of similarity among the sensibility vectors.
- (キーワード)
- Tweet analysis / 自然言語処理 (natural language processing) / trend analysis
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3233/FAIA220384
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85142130952
(DOI: 10.3233/FAIA220384, Elsevier: Scopus) Motonobu Yoshida, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
A System to Correct Toxic Expression with BERT,
Proceedings of the 14th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management - KEOD, 92-97, Valletta, Oct. 2022.- (要約)
- This paper describes a system for converting posts with toxic expression on social media, such as those containing slander and libel, into less-toxic sentences. In recent years, the number of social media users as well as the cases of online flame wars has been increasing. Therefore, to prevent flaming, we first use a prediction model based on Bidirectional Encoder Representations from Transformers (BERT) to determine whether a sentence is likely to be flamed before it is posted. The highest classification accuracy recorded 82% with the Japanese Spoken Language Field Adaptive BERT Model (Japanese Spoken BERT model) as a pre-trained model. Then, for sentences that are judged to be toxic, we propose a system that uses BERTs masked word prediction to convert toxic expressions into safe expressions, thereby converting them into sentences with mitigated aggression. In addition, the BERTScore is used to quantify whether the meaning of the converted sentence has changed in meaning compared to the original sentence and evaluate whether the modified sentence is safe while preserving the meaning of the original sentence.
- (キーワード)
- Toxic Expression / BERT / 分類 (classification) / Text Crrection / Flame War
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.5220/0011586100003335
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85146200806
(DOI: 10.5220/0011586100003335, Elsevier: Scopus) Daichi Kawahara, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Music Video Search System Based on Comment Data and Lyrics,
Advances in Natural Computation, Fuzzy Systems and Knowledge Discovery(Lecture Notes on Data Engineering and Communications Technologies; LNDECT), Vol.153, 1125-1135, Jul. 2022.- (要約)
- Many people currently use video-sharing services such as YouTube. Keyword search is prevalent in these services. It can be hard to find a video that matches the users' interests using keyword search unless appropriate words are used. In this study, we propose a method for retrieving music videos with similar impressions by analyzing comment data from YouTube viewers and music lyrics. The proposed method converts comments and lyrics into vectors using Word2Vec, and music videos with similar impressions are retrieved using fuzzy c-means clustering According to the mean reciprocal rank (MRR) scores, it was clear that the output of the music videos had the same impression within the top three songs.
- (キーワード)
- 人工知能 (artificial intelligence) / music video search / lyric / fuzzy c-means
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-031-20738-9_122
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85147845007
(DOI: 10.1007/978-3-031-20738-9_122, Elsevier: Scopus) Naomichi Tabuchi, Kazuyuki Matsumoto, Minoru Yoshida, Ryota Nishimura and Kenji Kita :
Analysis of Lifestyle Habits from Weblogs of Patients with Intractable Diseases Using Deep Learning,
Proceedings of International Conference on Electrical, Computer and Energy Technologies (ICECET), Jul. 2022.- (要約)
- In recent years, patient-centered medicine has become widely accepted. To keep a record of their struggles,patients sometimes publish their diaries (disease blogs) on weblogs to be read by an unspecified number of people. In particular, writing a blog may be helpful in the case of intractable diseases of which there are few cases, and patients often feel isolated because they know few people with the same disease. In this study, we used deep learning technology to analyze the blogs written by patients with intractable diseasesand to determine how they live their daily lives and their feelings. If their lifestyles are understood, the relationship between the physical condition and mental changes of people fighting intractable diseases can be determined, and a system that shows behavioral guidelines for new users fighting similar intractable diseases can be built.
- (キーワード)
- lifestyle habits / intractable disease / 深層学習 (deep learning)
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/ICECET55527.2022.9872887
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85138876019
(DOI: 10.1109/ICECET55527.2022.9872887, Elsevier: Scopus) Naomichi Tabuchi, Kazuyuki Matsumoto, Minoru Yoshida, Ryota Nishimura and Kenji Kita :
Risk Analysis of Developing Lifestyle-related Diseases based on the Content of Social Networking Service Posts,
Innovation in Medicine and Healthcare, Part of the Smart Innovation, Systems and Technologies book series, Vol.308, 63-72, Jun. 2022.- (要約)
- Japans leading causes of death are cancer, cardiovascular disease, and diabetes, which account for approximately 60% of all deaths. All these diseases are closely related to lifestyle habits such as diet, exercise, and sleep and are called lifestyle-related diseases. Lifestyle-related diseases are characterized by a lack of subjective symptoms, making it difficult to notice the deterioration of the disease. In this study, we analyzed tweets related to diet, exercise, physical condition, and mental state from the contents posted by users on social networking services (SNS) to construct a system that can prevent lifestyle-related diseases more simply. We found that the results of this work can lead to the construction of a system than can detect risk factors leading to the development of lifestyle-related diseases, from the contents of users posts.
- (キーワード)
- risk analysis / social networking service / lifestyhle-related diseases
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-981-19-3440-7_6
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85135061563
(DOI: 10.1007/978-981-19-3440-7_6, Elsevier: Scopus) Taiga Kirihara, Kazuyuki Matsumoto, Manabu Sasayama, Minoru Yoshida and Kenji Kita :
Topic Segmentation for Interview Dialogue System,
Proceedings of 2021 5th International Conference on Natural Language Processing and Information Retrieval, Online, Dec. 2021.- (要約)
- In this study, topic segmentation was performed by referring to the interview dialogue corpus. Utterance intention tags were added to the existing interview dialogue corpus, and uttered sentences were vectorized using BERT, Sentence BERT, and Distil BERT. In addition, topic classification was performed using the utterance intention tags and the features of the preceding and following uttered sentences. Consequently, the greatest accuracy was achieved when the utterance intention tag was used with DistilBERT
- (キーワード)
- interview dialogue / neural networks / speech intention / DistilBERT
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1145/3508230.3508237
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1145/3508230.3508237
(DOI: 10.1145/3508230.3508237) Reishi Amitani, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Prediction of Number of Likes and Retweets based on the Features of Tweet Text and Images,
Proceedings of 2021 5th International Conference on Natural Language Processing and Information Retrieval, Online, Dec. 2021.- (要約)
- The current study aimed to investigate social media trends and propose an analysis method to explore the factors underpinning the buzz phenomenon on Twitter. As it is not always possible to determine the cause of the buzz phenomenon from the text content alone posted on Twitter, we limited the analysis to tweets with attached images and devised an analysis method using both text and images. We investigated whether there is a relationshipbetween the features of both tweet text and its attached images, and how the relationship between these features is related to the number of likes and retweets (RTs) receivedthat is, indicators of popularity. We trained a multi-task neural network that takes the features extracted from the images and text as input, and then outputs the number of likes and RTs before extracting the feature vectors of the same dimension from the two inputs (images and text, respectively) from the middle layer. By calculating the distance between these feature vectors, we analyzed the relationship between the number of likes and RTs. The results revealed that the average vectors of BERT and inceptionresnetv2 served as predictors of the number of likes and RTs. We also found that tweet text with a low number of likes and RTs was short and simple.
- (キーワード)
- Twitter / multi-task learning / neural networks / trend ananlysis
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1145/3508230.3508244
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1145/3508230.3508244
(DOI: 10.1145/3508230.3508244) Ryota Kishima, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Construction of MBTI Personality Estimation Model Considering Emotional Information,
Proceedings of the 35th Pacific Asia Conference on Language, Information and Computation (PACLIC35), 262-269, Shanghai, Nov. 2021.- (要約)
- The widespread use of social networking services (SNSs) such as Twitter and Facebook in recent years have rendered it easy to interact with various people all over the world.Analysis of the user personality and emotion using features such as the text information and image information on SNSs has been researched.This study analyzes the effectiveness of using emotional information as a feature when building a personality estimation model for Twitter users. The extensively used Myers-Briggs type indicator (MBTI) is used for analysis. A method is proposed for estimating the MBTI personality pattern by extracting emotional information from Twitter and adding it to the characteristics of the distributed expressions of sentences and words.Through evaluation experiments, it is determined whether the emotional information is effective in constructing the MBTI personality estimation model. The obtained results demonstrate that the accuracy is improved when emotional information is included as a feature, compared to the case without emotional information.
- (キーワード)
- MBTI / personality analysis / 感情 (emotion) / Twitter
Construction of Emotional Similarity Word Embedding Model for Sentiment Analysis,
20th Mexican International Conference on Artificial Intelligence (MICAI2021), Oct. 2021.- (要約)
- We propose a method for constructing a dictionary of emotional expressions, which is an indispensable language resource for sentiment analysis in the Japanese. Furthermore, we propose a method for constructing a language model that reproduces emotional similarity between words, which to date has yet not been considered in conventional dictionaries and language models. In the proposed method, we pre-trained sentiment labels for the distributed representations of words. An intermediate feature vector was obtained from the pre-trained model. By learning an additional semantic label on this feature vector, we can construct an emotional semantic language model that embeds both emotion and semantics. To confirm the effectiveness of the proposed method, we conducted a simple experiment to retrieve similar emotional words using the constructed model. The results of this experiment showed that the proposed method can retrieve similar emotional words with higher accuracy than the conventional word-embedding model.
- (キーワード)
- affective computing / emotional embedding / DistilBERT / deep neural networks / 感情 (emotion)
The Relationship between Personality Patterns and Harmfulness: Analysis and Prediction based on Sentence Embedding,
3rd Technological Competency as Caring in the Health Sciences 2021, Aug. 2021.- (要約)
- In this paper, we propose a method for detecting harmful contents in social media. In the Social Networking Service (SNS) the articles and messages posted on these services can be viewed by an unspecified number of unknown people from worldwide. Recently, increasing the number of users who have been forced to close their SNS accounts or have been suffering from mental problems because of blew up SNS triggered by hate speech or bullying remarks in social media. Even if the management of the SNS takes countermeasures, it is difficult to deal with all types of harmful expressions. In this research, we focus on the characteristic that harmful statements need to be judged from the entire sentence, and extract features of harmful expressions using a general-purpose language model.
- (キーワード)
- harmful expression / sentence embedding / Internet flaming / MBTI / personality analysis
Lifestyle Analysis via a Corpus of Disease-Fighting Weblogs,
Proceedings of 2021 IEEE 2nd International Conference on Pattern Recognition and Machine Learning (PRML 2021), 266-272, Chengdu, Jul. 2021.- (要約)
- 近年,日本では糖尿病予備軍の人口が年々増加している.2型糖尿病は生活習慣病の一種で 型糖尿病は生活習慣病の一種であり,生活習慣を改善することである程度予防することができる.しかし,生活習慣に問題があると気付いた時には手遅れになってしまうこともある.そのため,生活習慣病の危険因子を早期に発見することが重要である.本研究では,生活習慣病闘病者のブログを収集し,危険因子に関連すると考えられる複数のキーワードカテゴリを設定し,カテゴリごとにラベルを付けて闘病ブログのコーパスを構築した.評価実験の結果,提案手法は,単純な手法よりも高い精度でキーワードや文章の分類を実現した.
- (キーワード)
- diabetic patients / 生活習慣病 (lifestyle-related disease) / category classification / 機械学習 (machine learning)
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/PRML52754.2021.9520697
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1109/PRML52754.2021.9520697
(DOI: 10.1109/PRML52754.2021.9520697) Minoru Yoshida, Kohno Shogo, Kazuyuki Matsumoto and Kenji Kita :
Visualization of the Artist Relations Using Twitter User Profiles,
Frontiers in Artificial Intelligence and Applications (FAIA), Fuzzy Systems and Data Mining VI,, Vol.331, 682-689, Nov. 2020.- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3233/FAIA200746
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85101594489
(DOI: 10.3233/FAIA200746, Elsevier: Scopus) Fujisawa Akira, Kazuyuki Matsumoto, Kazuki Ohta, Minoru Yoshida and Kenji Kita :
ASCII Art Classification Model by Transfer Learning and Data Augmentation,
Frontiers in Artificial Intelligence and Applications (FAIA), Fuzzy Systems and Data Mining VI, Vol.331, 608-618, Nov. 2020.- (要約)
- In this study, we propose an ASCII art category classification method based on transfer learning and data augmentation. ASCII art is a form of nonverbal expression that visually expresses emotions and intentions. While there are similar expressions such as emoticons and pictograms, most are either represented by a single character or are embedded in the statement as an inline expression. ASCII art is expressed in various styles, including dot art illustration and line art illustration. Basically, ASCII art can represent almost any object, and therefore the category of ASCII art is very diverse. Many existing image classification algorithms use color information; however, since most ASCII art is written in character sets, there is no color information available for categorization. We created an ASCII art category classifier using the grayscale edge image and the ASCII art image transformed from the image as a training image set. We also usedVGG16, ResNet-50, Inception v3, and Xceptions pre-trained networks to fine tune our categorization. As a result of the experiment of fine tuning by VGG16and data augmentation, an accuracy rate of 80% or more was obtained in the human category.
- (キーワード)
- テキストアート / アスキーアート / 転移学習 / ファインチューニング / データ拡張
- (徳島大学機関リポジトリ)
- ● Metadata: 115914
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3233/FAIA200738
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.3233/FAIA200738
(徳島大学機関リポジトリ: 115914, DOI: 10.3233/FAIA200738) Kirihara Taiga, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Keyword Extraction from TV Program Viewers Tweet Based on Neural Embedding Model,
Frontiers in Artificial Intelligence and Applications (FAIA), Fuzzy Systems and Data Mining VI, Vol.331, 360-369, Nov. 2020.- (要約)
- In recent years, young people have not been watching television (TV) as much as they used to. This is mainly because a number of TV programs are very long and/or have limited viewing times. Recently, individuals have been actively posting live-action tweets on Twitter to comment on TV content while watching programs in real time. In this study, we propose a method for extracting key phrases related to the event scenes of TV programs using live tweets, and we propose a scene search system that aims at efficient TV program viewing. The experimental results indicated that the program contents were estimated with an error of approximately 5% to 10% with respect to the program time. In addition, the extracted key phrases were visualized for each event scene category using the t-SNE algorithm.
- (キーワード)
- 自然言語処理 (natural language processing) / TV番組 / キーフレーズ抽出 / ツイッター解析
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3233/FAIA200714
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85101584659
(DOI: 10.3233/FAIA200714, Elsevier: Scopus) Kohei Torii, Minoru Yoshida, Kazuyuki Matsumoto, Jiro Tsuruki, Kobayashi Kenichiro, Eiichi Honda and Kenji Kita :
Towards Automatic Dental Diagnosis System Based on Deep Learning,
Proc. IEEE International Conference on Natural Language Processing and Knowledge Engineering, 64-65, Online, Oct. 2020. Mawoneke Felix Kudzai, Luo Xin, Shi Youqin and Kenji Kita :
Reverse Image Search for the Fashion Industry Using Convolutional Neural Networks,
2020 IEEE 5th International Conference on Signal and Image Processing (ICSIP), Oct. 2020.- (キーワード)
- Reverse Image Search / Convolutional Neural Network / Fashion
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/ICSIP49896.2020.9339350
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85101075568
(DOI: 10.1109/ICSIP49896.2020.9339350, Elsevier: Scopus) Ryu Mopuaa, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Construction of Annotated TOBYO Blog Corpus for Lifestyle Disease Analysis of Diabetic Patient,
Proceedings of The 15th International Conference on Natural Language Processing and Knowledge Engineering (NLP-KE20), 77, Oct. 2020.- (要約)
- In this study, we target to analyze weblogs authored by diabetes patients describing their struggle against their disease. In order to build a corpus for analysis, we annotate tags to the important keywords/key phrases such as blood glucose level, diet and emotions in collected weblog data. We aim at constructing a labeled lifestyle disease weblog corpus (called as TOBYO weblog corpus) to extract useful information from patients' weblogs of against illness. For example, to improve our lifestyle, it would be very useful to know how we should live every day, what kind of diet we should eat, how much exercise is appropriate, and so on. In our study, we organize the tagged data and take statistics on part-of-speech combinations. We set the top N thresholds in the rank of the frequency of the part-of-speech and create a system to exclusively pre-process the key phrases that are ranked as more frequent part of speech combinations. The extracted key phrase information is vectorized by a model of BERT (bidirectional encoder representation from a transformer), then the key phrases are sorted out by making a model for category prediction that uses two inputs (BERT vector and character frequency vector). To evaluate our proposed method, we conduct cross validation test and open test by using several machine learning algorithms. In comparison with the baseline classification method, which is a simple and ordinal neural network method, our method can achieve higher performance.
- (キーワード)
- 闘病コーパス / ニューラルネットワーク / ブログ / 生活習慣病 (lifestyle-related disease) / 糖尿病 (diabetes)
Construction of lifestyle disease weblog corpus and evaluation of keyword classification model,
International Forum on Advanced Technologies 2020 (IFAT2020), Mar. 2020.- (キーワード)
- 生活習慣病 (lifestyle-related disease) / weblog corpus / keyword classification
Emotional State Estimation by Dialogue History and Sentence Distributed Representation,
Proceedings of 2019 6th IEEE International Conference on Cloud Computing and Intelligence Systems(CCIS2019), 31-35, Singapore, Dec. 2019.- (要約)
- The paper presents a novel approach to predict humans emotion in the dialogue. We target the scenario dialogue corpora. The corpora are annotated by some subjects with emotion tag. We use sentence embedding by Bidirectional Encoder Representations from Transformers as versatile and rich feature. By acquiring multi-context information from dialogue text, the accuracy of emotion prediction can be improved. As an experiment by machine learning algorithm such asdeep neural networks for the proposed method, we achieved higher accuracy than the method using embedding feature from utterance itself.
- (キーワード)
- dialogue sentences / dialogue emotion estimation / sensibility robotics
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/CCIS48116.2019.9073750
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85085005205
(DOI: 10.1109/CCIS48116.2019.9073750, Elsevier: Scopus) Jin Qiuzi, Luo Xin, Shi Youqun and Kenji Kita :
Image Generation Method Based on Improved Condition GAN,
International Conference on Systems and Informatics (ICSAI2019), 1290-1294, Shanghai, Nov. 2019.- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/ICSAI48974.2019.9010120
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85081970301
(DOI: 10.1109/ICSAI48974.2019.9010120, Elsevier: Scopus) Yuko Sakuta, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Kansei Mapping of Color Images Using Earth Mover's Distance,
International Conference on Software Technology and Engineering (ICSTE2019), Oct. 2019. Akira Fujisawa, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
An Approach for Conversion of Japanese Emoticons into Emoji Based on Character-Level Neural Autoencoder,
Frontiers in Artificial Intelligence and Applications, Vol.320, 635-644, Oct. 2019.- (要約)
- In this paper, we propose a method for converting Japanese emoticons into emoji. The method creates a model that translates text into emoji using training neural networks with a character-based feature; the model determines the positive/negative/neutral polarity of the emoji from the text. By extracting a feature vector from the hidden layer of the model, we calculate the similarity between the input sentence and the text annotated with emoji in the database; the conversion candidates come from the emoticon in the input text. In comparison tests of the proposed method and a word-level feature method that uses a word distributed representation vector, the emoji emotion polarity-based model achieved a maximum accuracy rate of 90.0%, representing an 8% improvement over the word-level feature method.
- (キーワード)
- emoji / emoticon / neural autoencoder
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3233/FAIA190231
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.3233/FAIA190231
(DOI: 10.3233/FAIA190231) Kazuyuki Matsumoto, Mopaa Ryu, Minoru Yoshida and Kenji Kita :
Emotion Analysis on Weblog of Lifestyle Diseases,
Proceedings of the 2019 International Symposium on Signal Processing Systems (SSPS2019), 142-148, Beijing, Sep. 2019.- (要約)
- In this paper, we investigate the relation between patient lifestyle and emotional state transition by analyzing weblog articles written by patients with diabetes. To conduct our analysis, we use blood sugar level and body weight to indicate the disease condition, together with meal keywords and sentences that express feelings in the selected weblogs. A corpus annotated with a tag to word units in the target articles is constructed and a method of keyword classification based on the constructed corpus is proposed and evaluated. Finally, we analyze whether the indicated emotion is positive or negative in sentences expressing emotion in the corpus and investigate the relation between the emotion and a change in blood sugar level.
- (キーワード)
- テキストマイニング (text mining) / 糖尿病 (diabetes) / 生活習慣病 / 感情分析 / 機械学習 (machine learning)
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1145/3364908.3365294
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85077207726
(DOI: 10.1145/3364908.3365294, Elsevier: Scopus) Kazuyuki Matsumoto, Yuta Hada, Minoru Yoshida and Kenji Kita :
Analysis of Reply-Tweets for Buzz Tweet Detection,
Proceedings of 33rd Pacific Asia Conference on Language, Information and Computation (PACLIC33), 138-146, Sep. 2019.- (要約)
- In this study, we propose a method for predicting whether a tweet will create a buzz on the Internet by examining tweeted replies posted by others. We also investigate the distinguishing characteristics of replies to buzz tweets by analyzing feature amounts. Our proposed method first converts each reply tweet into a vector expression using a word distributed representation or some other vectorization method. We then apply a machine learning method for binary classification todetermine whether the reply is to a buzz tweet or a non-buzz tweet. We classify the target tweet into buzz or non-buzz categories by comparing the total buzz and non-buzz scores produced by the classifier. The proposed method using StarSpace achieved 93.1% F1-score, while an approach that used number of retweets and number of favors (likes) achieved 77.8% F1-score. Wealso found that there are a number of words that are characteristic of buzz tweet replies anda number of words that are characteristic of non-buzz tweet replies.
- (キーワード)
- テキストマイニング (text mining) / Twitter / buzz tweet / StarSpace / Deep learning
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85084953625
(Elsevier: Scopus) Kazuyuki Matsumoto, Manabu Sasayama, Minoru Yoshida and Kenji Kita :
Personality Analysis on Dialogue System for Emotional Interaction Robot,
Conference Proceedings of Asia Pacific Society for Computing and Information Technology 2019 Annual Meeting (APSCIT 2019 Annual Meeting), Jul. 2019.- (要約)
- In this study, we proposed the personality analysis method for dialogue system towards realization of emotional interaction robot. To achieve smooth communication between human and robot in dialogue, it is necessary that overcome feeling of strangeness by generating dialogue utterance based on consistent personality. Firstly, we extract the wording feature from utterance texts on social media. To obtain relation between the wording feature and personality ego-state level, we use sentence level embedding feature and create state level estimator for each ego-state. Next, we evaluate the ego-state level estimator with an evaluation test set. Finally, we use this estimator for analysis of chat-bot dialogue. By comparing the existing chat-bot dialogue and user utterance, we consider about non-reality of current chat-bot dialogue generation.
- (キーワード)
- personality analysis / dialogue system / egogram / emotional interaction robot
Research on statements in tweets and sleep time of classification,
the 3rd International Conference on Natural Language Processing and Information Retrieval, Tokushima, Japan, Jun. 2019. Hidetoshi Nakao, Masakazu Imaoka, Kenji Oka, Mitsumasa Hida, Takeshi Morifuji, Masashi Hashimoto, Kazuyuki Matsumoto and Kenji Kita :
Factor Affecting Low-Arch and High-Arch of Foot,
13th International Society of Physical and Rehabilitation Medicine (ISPRM 2019), No.P3-447, Jun. 2019. Hidetoshi Nakao, Masakazu Imaoka, Kenji Oka, Mitsumasa Hida, Takeshi Morifuji, Masashi Hashimoto, Kazuyuki Matsumoto and Kenji Kita :
Body Factors of Low Arch of Foot for Middle and Senior Age,
World Confederation for Physical Therapy (WCPT2019), No.PO-E-30-SUN2, May 2019. Horikawa Haruki, Minoru Yoshida, Kenji Kita and Kazuyuki Matsumoto :
Extended Dataset for Food Image Classification Based on Twitter,
Hong Kong International Conference on Engineering and Applied Science (HKICEAS 2018), Dec. 2018. Feng Zhihua, Luo Xin, Yang Tao and Kenji Kita :
An object Detection System Based on YOLOv2 in Fashion Apparel,
2018 IEEE 4th International Conference on Computer and Communications (ICCC), Dec. 2018.- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/CompComm.2018.8780944
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85070807662
(DOI: 10.1109/CompComm.2018.8780944, Elsevier: Scopus) Minoru Yoshida, Kazuyuki Matsumoto and Kenji Kita :
Modeling Relations Between Profiles and Texts,
Proceedings of the 14th the Asia Information Retrieval Societies Conference (AIRS 2018), LNCS 11292, 103-109, Taipei, Nov. 2018.- (要約)
- Twitterのテキストと投稿者のプロフィールを同時にモデル化する手法を提案する.提案手法では,テキスト中の単語とプロフィール中の単語との関連を考慮したん分散表現学習を行い,それぞれの単語のベクトル表現を獲得する.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-030-03520-4_10
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85057273674
(DOI: 10.1007/978-3-030-03520-4_10, Elsevier: Scopus) Akira Fujisawa, Kazuyuki Matsumoto, Ohta Kazuki, Minoru Yoshida and Kenji Kita :
ASCII Art Category Classification based on Deep Convolutional Neural Networks,
Proceedings the 5th IEEE International Conference on Cloud Computing and Intelligence Systems (CCIS), 345-349, Nanjing, Nov. 2018.- (要約)
- ソーシャルメディア上のテキストベースのコミュニケーションでは,絵文字は,感情を伝達し,短いテキストでスムーズなコミュニケーションを促進する重要な方法を提供する.非言語表現として,アスキーアートの文字そのものには意味はないが,文字の位置や形を用いることで,感情や意図を視覚的に表現することができる.文字を特徴量としてアスキーアートを分類することはこれまで困難であった.本稿では,アスキーアートを画像に変換し,深層学習を用いてアスキーアートを分類する手法を提案する.評価実験では,97%の分類成功率を達成することができた.
- (キーワード)
- ASCII Art / 分類 (classification) / Deep learning / Convolutional Neural Networks
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/CCIS.2018.8691245
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85064980913
(DOI: 10.1109/CCIS.2018.8691245, Elsevier: Scopus) Kazuyuki Matsumoto, Manabu Sasayama, Minoru Yoshida, Kenji Kita and Fuji Ren :
Transfer Learning Based on Utterance Emotion Corpus for Lyric Emotion Estimation,
Proceedings of 2018 5th IEEE International Conference on Cloud Computing and Intelligence Systems (CCIS), 699-703, Nanjing, Nov. 2018.- (要約)
- 感情推定の研究では,従来,コーパスベース,辞書ベース,またはルールベースの様々なアプローチが存在する.しかし,各ドメインに適した言語リソースを用意する必要があり,多大なコストがかかる.本稿では,転移学習を用いて歌詞フレーズの感情を推定する手法を提案する.既存の発話感情コーパスを歌詞感情推定タスクに適用することで,単純なBag of Wordsモデルを用いたtf-idfベクトルおよびロジスティック回帰モデルによるベースライン法と比較し,より高い精度を得た.
- (キーワード)
- Transfer learning / Emotion estimation / Lyric / Word embedding
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/CCIS.2018.8691207
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85064985706
(DOI: 10.1109/CCIS.2018.8691207, Elsevier: Scopus) Bando Koji, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Twitter User's Hobby Estimation Based on Sequential Statements Using Deep Neural Networks,
2018 10th International Conference on Software Technology and Engineering, Oct. 2018.- (キーワード)
- Twitter / 趣味推定 / ニューラルネットワーク / ランダムフォレスト / サポートベクトルマシン
Emoticon-based emotion analysis for Weibo articles in sentence level,
Lecture Notes in Computer Science, Vol.11248, 104-112, Oct. 2018.- (キーワード)
- Emotion Analysis / Emoticon
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-030-03014-8_9
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85057082718
(DOI: 10.1007/978-3-030-03014-8_9, Elsevier: Scopus) Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Classification of Emoji Categories from Tweet Based on Deep Neural Networks,
Proceedings of the 2nd International Conference on Natural Language Processing and Information Retrieval (NLPIR2018), 17-25, Bangkok, Sep. 2018.- (要約)
- In this paper, we describe the sentiment analysis method from tweets based on emojis category. Many of existing study about sentiment analysis focused on the emotional expressions included in sentence. However, because there are various kinds of emotional expressions, such as Internet slang, it cannot be constructed that the fixed emotional expression dictionary. The most of the methods based on corpus and machine learning, its performance is quite depended on the quality of annotation. Therefore, we attempt to use categories which are expressed by emoji as sentiment label instead of manually annotated labels. Our proposed method uses automatically annotated category label by emoji which is annotated to sentence, and train word embedding feature by deep neural networks. As the result of the experiment, our proposed method overcome the simple word feature based method.
- (キーワード)
- 絵文字 / Twitter / 深層ニューラルネットワーク
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1145/3278293.3278306
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1145/3278293.3278306
(DOI: 10.1145/3278293.3278306) Nakao Hidetoshi, Jirela Dilixiati, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Emotion Recognition from Emoticons using Convolutional Neural Networks,
Proceedings of 2nd Technological Competency as Caring in the Health Sciences 2018, 72, Aug. 2018.- (要約)
- In recent years, text communication has been grown steadily so that all kinds of daily contacts could be conducted now through Internet based text messaging services. As an advantage of text-based communication via the Internet, we can quickly interact with anyone wherever we are. At the same time, since it is difficult to express emotions with each other only with text, the chance of adding non-verbal information such as photos to text is increasing. Among the non-verbal information, there are emoticons in expressions that have been developed by Internet bulletin boards, chat, e-mail, etc. In particular, the types of emoticons used in Japan are diverse, even now; various types of emoticons continue to increase. There have been studies on these emoticons until now, which have become increasingly important in recent years. In this paper, we propose a method to classify facial expressions expressed from emoticons by letting deep convolutional neural networks. When recognizing emotions from emoticons, it is not known that seeing emoticons in character units is very effective. Information such as role positioning and coexistence roles is necessary. Characters in emoticons differ depending on font it also gives different impressions depending on context. In order to realize semantic analysis / emotion analysis considering emoticons, it is necessary to provide a corpus that records various kinds of emoticons and a database that gives information such as meanings and emotions expressed by emoticons. However, including all the emoticons is difficult, and since the emoticons are more vague than ordinary language expressions, that is why the construction of the dictionary is delayed. In this paper, we propose a method to classify the emotions of the emoticons by letting the deep convolutional neural network learn the features of the emoticons. By treating the emoticon as an image, the visual features can be captured and it is considered that natural recognition can be performed instead of processing like a character string. In addition, since the emoticon characterizes the facial expression with a character string, there is a problem that the impression is different only when the used fonts are different from each other, and therefore, when different fonts are used, how the classification accuracy is changed, we consider whether to do so.
- (キーワード)
- 顔文字 / 畳み込みニューラルネットワーク / 感情認識 / データ拡張
Sentence Emotion Classification for Intelligent Robotics Based on Word Lexicon and Emoticon Emotions,
Proceedings of the International Conference of Intelligent Robotic and Control Engineering, 38-41, Aug. 2018.- (キーワード)
- ロボティクス (robotics) / 自然言語処理 (natural language processing)
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/IRCE.2018.8492969
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85056756985
(DOI: 10.1109/IRCE.2018.8492969, Elsevier: Scopus) Ryusei Matsumoto, Minoru Yoshida, Kazuyuki Matsumoto, Hironobu Matsuda and Kenji Kita :
Visualization of the occurrence trend of infectious diseases using Twitter,
Proceedings of the 11th edition of the Language Resources and Evaluation Conference (LREC 2018), (poster), 511-514, May 2018.- (要約)
- 感染症の流行を可視化するシステムを提案する.Twitterデータを対象に,投稿者が感染の当事者か否かを判定する事実性解析を行い,結果を用いて可視化する.複数の感染症について提案手法を適用し,その効果を示す.
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85059887520
(Elsevier: Scopus) Jirela Dilixiati, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Predicting facial expression from emoticon based on convolutional neural networks,
4th International Forum on Advanced Technologies (IFAT 2018), Mar. 2018.- (要約)
- Text communication has been developed in recent years, all kinds of daily contacts are through the SNS regardless of age, gender and active. As an advantage of text-based communication via the Internet. There is a point that you can quickly respond to anyone wherever you are. In this paper, by letting the deep convolution neural network learn the image features of emoticons. We propose a method to classify by emotion expressed by emoticons. By treating emoticons as images, it is possible to capture visual features and think that natural identification can be made rather than handling as character strings.
- (キーワード)
- 顔文字 / 畳み込みニューラルネットワーク / 感情 / 顔表情
The Effectiveness of Image Data Augmentation for Deep Learning,
Conference Abstract of the 3rd International Conference on Multimedia and Image Processing, 19, Mar. 2018.- (キーワード)
- Deep Learning / Data Augmentation / 画像処理 (image processing)
Visual Similarity for ASCII Arts Using Image Features,
Proceedings of the 2018 2nd International Conference on Machine Vision and Information Technology (CMVIT 2018), 17, Hong Kong, Feb. 2018.- (要約)
- Communication with various types of non-verbal expressions has been increasing on Social Networking Services. Among them, ASCII art is a character-based design technique to express human emotions. In many cases, ASCII arts are generated from original images by mapping some region of pixels to a certain character. In the field of natural language processing, ASCII arts are treated as sequences of characters. In addition, there have been few studies that aim to analyze or classify ASCII arts. In this paper, we extract characteristics of ASCII arts using image shape features. Our image shape-based features provide visual similarity between ASCII arts that are invariant across image scale and characters used in ASCII arts. Moreover, the proposed method enable us to compare visual similarity between ASCII arts and original images. To extract shape features from ASCII arts, we use image features of original images by converting ASCII arts to images. In the experiment, we compared visual similarity between ASCII arts and original images by using Histograms of Oriented Gradients(HOG). Our experimental result shows that the proposed method is effective to compare visual similarity between ASCII arts and original images.
- (キーワード)
- visual similarity / ascii art / image feature
Exploring the Relations Between Posts and Comments for Short Text Conversation,
Proceedings of The 12th International Conference on Natural Language Processing and Knowledge Engineering (NLP-KE17), 228-238, Chengdu, Dec. 2017. Kazuyuki Matsumoto, Fuji Ren, Minoru Yoshida and Kenji Kita :
Review Score Estimation Based on Transfer Learning of Different Media Review Data,
Proceedings of The 12th International Conference on Natural Language Processing and Knowledge Engineering(NLP-KE'17), 185-199, Dec. 2017.- (要約)
- In this paper, we proposed a model to classify reviews based on review data of different media. Recently, researches have been actively made on transfer learning between different domains with various kinds of big data as a target. Evaluation expressions are usually different in different domains, and this becomes a barrier for reputation analysis. Users usually use different linguistic expressions to refer to the creative works of each media. For example, media such as "anime", "comics", "games" and "movies" have different terms or expressions to be described their creative works. These differences can be considered showing features of each medium and such differences should be found in other expressions as well as in evaluation expressions. We analyzed what effect such differences would cause to classication accuracy by conducting transfer learning between review data ofdifferent media. In this paper, we proved compatibility between original (pre-transferring) and target (post-transferring) media for each medium of the creative works by constructing a review classication model. As a result of evaluation experiments, we could more accurately estimate review score without using SO-Score for training of review fragment based on Long Short Term Memory (LSTM) than the SO-Score based method.
- (キーワード)
- レビュー分類 / 転移学習 / Long Short-Term Memory / 異メディア
Index Generation of BGM Video Based on Distinctive Comments,
Proceedings of The 12th International Conference on Natural Language Processing and Knowledge Engineering(NLP-KE'17), 179-184, Dec. 2017.- (要約)
- The purpose of this study is to generate indexes to the BGMs based on the distinctive comments annotated to the BGM videos posted on Nico Nico Videos. Our proposed method detects the end/start positions of the BGMs considering the increase/decrease of the number of the comment data, the comments distinctive to the songs and the exclamatory expressions annotated to the videos. The evaluation result showed that the proposed method could generate correct indexes within 10 seconds error for the BGM videos with length of less than 40 minutes and with annotation of over 30,000 comments.
- (キーワード)
- ニコニコ動画 / インデックス生成 / 作業用BGM
Emotion Estimation Adapted to Gender of User Based on Deep Neural Networks,
Proceedings of The 12th International Conference on Natural Language Processing and Knowledge Engineering(NLP-KE'17), 166-178, Dec. 2017.- (要約)
- In this study, we focus on a representative SNS, Twitter and target emotion estimation from tweets posted on Twitter. we construct emotion estimation models applicable to each gender. It is considered that there would be different word usage tendencies depending on gender. Therefore, we analyze what difference exists in usage tendency of slangs or emoji, which are thought to be related to emotion, depending on gender. Then, we propose a method to improve emotion estimation based on neural networks by usingdistributed representation models for each gender. As the result of the evaluation experiments, the higher estimation accuracy was realized by training with Deep Convolutional Neural Networks using word's distributed representation as feature than by training with Feed Forward Neural Networks.
- (キーワード)
- emotion estimation / user's gender / deep neural networks
TUA1 at NTCIR-13 Short Text Conversation 2 Task,
Proceedings of the 13th NTCIR Conference on Evaluation of Information Access Technologies, 211-214, Tokyo, Dec. 2017. Akira Fujisawa, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Facial Expression Classification Based on Shape Feature of Emoticons,
Proceedings of 1st International Conference on Machine Learning and Data Engineering (iCMLDE2017), 29-34, Sydney, Nov. 2017.- (要約)
- Emoticons are used in the situation of textual communication such as web mails and internet forums. Many of the existing studies dealing with classification or extraction of emoticons regard emoticons as a kind of character string and focus on what characters constitute the emoticons or how they are lined up. However, emoticons are used to express human facial expressions, and characters constituting them represent various facial parts such as eyes, nose, mouth, etc. Such characters can be identified as different facial parts depending on their positions, and facial expressions are thought to be represented by the combinations of their shape features. In this study, we classified the facial expressions of emoticons by focusing on the shape features of those emoticons. To deal with shape features of emoticons, we converted emoticons, which are text data, to image data. Emoticons are mainly formed by line segments of characters, and use only black and white colors. Therefore, other factors such as colors and shades were not considered as the feature to classify the facial expressions. In the experiments, we used image features that did not require color information. As the result of comparative experiment with the 1-nearest neighbor method using character features, the facial expression recognition rate is 52% when using the Histograms of Oriented Gradients(HOG) was used as image feature. By this result, proposed method improved recognition rate by 2 % than using baseline.
- (キーワード)
- facial expression classification / 顔文字 / 画像特徴
Gender Estimation from Facial Images by Deep Neural Network,
Proceedings of Annual Conference on Engineering and Applied Science, Nov. 2017.- (要約)
- In this paper, we collect new learning data and learned this by the existing neural network in order to exceed the accuracy of the model of the existing research. As a result, we succeeded in improving the accuracy by increasing the learning data. However, we discovered that performance declined due to biased learning data. The future task is to further improve accuracy and Research the relationship between bias and accuracy of learning data.
- (キーワード)
- 性別推定 / 顔画像 / 深層ニューラルネットワーク / 画像処理 (image processing) / 深層学習
Emotion Recognition of Emoticon Based on Character Embedding,
9th International Conference on Software Technology and Engineering (ICSTE2017), Hong Kong, Oct. 2017.- (要約)
- 本研究では,顔文字の文字意味分散表現を用いた顔文字の感情認識をおこなう.従来の顔文字研究では,文中から顔文字を抽出したり,顔文字を構成パーツに分解しその組み合わせによる感情認識などがおこなわれてきた.近年発展してきた単語埋め込み技術を応用し,顔文字の文字単位での意味を学習し,特徴量として用いることで,より汎用的な顔文字の感情認識を試みる.文字の分散表現を素性として深層畳み込みニューラルネットワークに学習させる手法により構築した顔文字感情認識モデルを交差検証法により評価した結果,未知顔文字に対する感情認識を,単純な文字n-gram出現頻度ベクトルを素性として用いた手法よりも高い精度でおこなえることが分かった.
- (キーワード)
- 顔文字 / 感情認識 / 文字埋め込み / 畳み込みニューラルネットワーク
Face Identification Based on Deep Convolutional Neural Networks,
9th International Conference on Graphic and Image Processing, Oct. 2017.- (キーワード)
- 顔認証 / 深層ニューラルネットワーク
Flame Prediction Based on Harmful Expression Judgement Using Distributed Representation,
Book of Abstracts Proceeding of Engineering & Technology, Computer, Basic and Applied Sciences (ECBA-2017), Vol.3, No.16, 11, Taipei, Sep. 2017.- (要約)
- In recent years, flaming on social media has been a problem. To avoid flaming, it is useful for the system to automatically check the sentences whether they include the expressions that are likely to trigger flaming or not before posting messages. In this research, we target two harmful expressions. There are insulting expressions and the expressions that are likely to cause a quarrel. Firstly, we constructed an original harmful expression dictionary. Because a large cost requires to collect the expressions manually, we constructed the dictionary semi-automatically by using word distributed representations. The proposed method used distributed representations of the harmful expressions and general expressions as features, and constructed a classifier of harmful/general based on those features. An evaluation experiment found that the proposed method could extract harmful expressions with accuracy of approx. 70%.On the other hand, it was found that the proposed method could also extract unknown expressions, however, it wrongly extracted non-harmful.
- (キーワード)
- Flame Prediction / Harmful Expression / Distributed Representation / Support Vector Machine
Distributed Representations for Words on Tables,
Proceedings of the 21st Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD 2017), Part-I (LNAI 10234), 135-146, May 2017.- (要約)
- 表形式中の単語に対する分散表現学習の手法を提案する.提案手法では,同一行のセル,同一列のセルという二種類の文脈を考慮し,水平方向と垂直方向の二種類の単語関係を同時にモデル化する.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-319-57454-7_11
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85018412327
(DOI: 10.1007/978-3-319-57454-7_11, Elsevier: Scopus) Minoru Yoshida, Kazuyuki Matsumoto and Kenji Kita :
Acceleration of Similar Word Search in Distributed Representation,
Proceedings of the 18th International Conference on Computational Linguistics and Intelligent Text Processing (CICLING 2017) (poster), Apr. 2017.- (要約)
- コサイン類似度を用いた単語分散表現ベクトルの検索を高速化するための手法を提案する.提案手法は,類似尺度をユークリッド距離に変換し,距離計算そのものに対して分枝限定法を適用し,しきい値を超えた距離計算を途中で打ち切るというアイデアにより高速化を図る.さらに,PCAを用いてベクトル表現そのものを変換する前処理により,距離計算におけるさらなる加算・乗算演算の削減を行う.
A Comparison of Face Recognition Features Derived from Convolutional Neural Networks,
Conference Abstracts of the 2017 International Conference on Frontiers of Image Processing, 17, Kathmandu, Nepal, Mar. 2017. Kazuyuki Matsumoto, Tanaka Satoshi, Minoru Yoshida, Kenji Kita and Fuji Ren :
Ego-state Estimation from Short Texts Based on Sentence Distributed Representation,
The 11th International Conference on Natural Language Processing and Knowledge Engineering (NLP-KE'16), Dec. 2016.- (キーワード)
- ego-state / egogram / deep neural network / sentence distributed representation
Improvement of the Histogram for Infrequent Color-Based Illustration Image Classification,
Fuzzy Systems and Data Mining II, Frontiers in Artificial Intelligence and Applications, Vol.293, 299-305, Dec. 2016.- (キーワード)
- イラスト画像 / 色ヒストグラム / 画像分類 / 作風
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3233/978-1-61499-722-1-299
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.3233/978-1-61499-722-1-299
(DOI: 10.3233/978-1-61499-722-1-299) Minoru Yoshida, Kazuyuki Matsumoto and Kenji Kita :
Table Topic Models for Hidden Unit Estimation,
Proceedings of the 12th Asia Information Retrieval Societies Conference (AIRS2016), LNCS 9994, 302-307, Dec. 2016.- (要約)
- 表形式中に出現する数値について,省略された単位を推定する手法を提案する.Wikipediaの表形式を対象に,数値のみを含むセルに対して,どの単位が適切であるかを推定する.同一列の第一行目の単語等の文脈情報を用いてそのような推定を行うほか,表形式と周囲の文章を同時にモデル化できる表形式トピックモデルを提案し,それによるパラメータ推定結果を用いることで,精度の向上を図る.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-319-48051-0_23
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85007107751
(DOI: 10.1007/978-3-319-48051-0_23, Elsevier: Scopus) Kazuyuki Matsumoto, Minoru Yoshida, Kenji Kita, Yunong Wu and Iwasa Fumihiro :
Effect of Users Attribute on Emotion Estimation from Twitter,
Proceedings of the 2nd IEEE International Conference on Computer and Communications, Vol.3, 1186-1190, Oct. 2016.- (要約)
- This study focused on emotion estimation fromutterances on Twitter and analyzed the differences caused forestimation according to the attributes of users. SNS userspossess various user attributes. If we could clarify the tendencyfor each attribute to involve emotion estimation, we would beable to create an emotion estimation model suitable for eachattribute. This study considered two attributes, sex and job, andinvestigated the tendency of emotion estimation based on anemotion estimation model constructed by machine learning. Inthis paper, as a feature for machine learning, we used asentence vector that was obtained by the summation of theword distributed expressions. As a result of the evaluationexperiment using a method based on the nearest neighbormethod, we obtained 0.4 higher estimation accuracies thanusing a baseline method based on a simple Bag of Words model.
- (キーワード)
- user attribute / emotion recognition / Twitter
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/CompComm.2016.7924892
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1109/CompComm.2016.7924892
(DOI: 10.1109/CompComm.2016.7924892) Kazuyuki Matsumoto, Seiji Tsuchiya, Minoru Yoshida and Kenji Kita :
Judgment of Slang Based on Character Feature and Feature Expression Based on Slangs Context Feature,
Communications in Computer and Information Science, Vol.652, 280-288, Kuala Lumpur, Sep. 2016.- (要約)
- This paper proposes a method to distinguish standardwords from slang words using information from the characters comprising thecharacter string. An experiment testing the effectiveness of our method showeda 30 % or more improvement in classification accuracy compared to the baselinemethod. We also use a contextual feature related to emotion to expand theunregistered slang word in the training data into other expressions and proposean emotion estimation method based on the expanded expressions. In our experiment,successful emotion estimation was obtained in nearly 54 % of the cases, anotably higher rate than with the baseline method. Our proposed method wasshown to have validity.
- (キーワード)
- 俗語 / 文字特徴 / 文脈特徴 / 未知表現
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-981-10-2777-2_25
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-84989337887
(DOI: 10.1007/978-981-10-2777-2_25, Elsevier: Scopus) Zhang Guoliang, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Face Identification based on Deep Learning Using Low Pixel Images,
International Conference on Engineering & Technology, Computer, Basic & Applied Sciences, Jul. 2016. Kazuyuki Matsumoto, Manabu Sasayama, Kohsuke Miyauchi, Minoru Yoshida and Kenji Kita :
Lyric Retrieval System Based on Word's Intimacy Value,
Advances in Engineering Research, Vol.24, 84-87, May 2016.- (キーワード)
- Lyric retrieval / Query expansion / Word intimacy value
An Approach to Refine Translation Candidates for Emotion Estimation in Japanese-English Language,
Proceedings of the 7th International Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management, Vol.2, 74-83, Nov. 2015.- (要約)
- テキストからの感情推定の研究のほとんどは機械学習手法を用いている.機械学習は,大量の事例コーパスを必要とするため,高品質な訓練データをどのように入手するかが,議論すべき主要な問題の一つである.既存の言語資源は,感情コーパスを含む.しかし,言語が異なると,利用できない.我々は,日英対訳感情コーパスを用いて,訓練データを別の言語に変換する手法を提案する.対訳辞書により,各文のすべての単語に対して対訳候補が抽出される.抽出された対訳候補は,感情推定に高く貢献する語に絞り込み,それらを訓練データとして用いる.提案手法により構築された訓練データを用いて,評価実験を行った結果,感情推定の精度はNaive Bayes分類器を用いて66.7%に向上した.
- (キーワード)
- 感情コーパス / 感情推定 / タグ付き対訳コーパス
Slang Analysis Based on Variant Information Extraction Focusing on the Time Series Topics,
the 10th International Conference on Natural Language Processing and Knowledge Engineering, Sapporo, Japan, Oct. 2015. Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Sensibility Estimation Method for Youth Slang by Using Sensibility Co-occurrence Feature Vector Obtained from Microblog,
Proceedings of the 2015 IEEE International Conference on Computer and Communications (ICCC2015), Oct. 2015.- (要約)
- TwitterなどのSNSにおいて,簡潔に個人の思いや意図を伝えるために省略表現や顔文字表現を多用する場面が増加している.こうした表現は,その多くが形態素解析などの既存の辞書に登録されておらず未知表現として解析される.そのため,テキストマイニングにおける評判分析の精度向上の障壁となることが考えられる.また,こうした未知語のクラスタリングに文脈を用いる方法が主流であるが,その多くが分かち書き処理を前提としているため,若者言葉のような未知表現の分割誤りに弱いという欠点がある.本論文では,未知表現が分割誤りを起こす場合においても適切な文脈を取得し,そこから感性を推定する手法を提案する.また,取得した文脈ベクトルは膨大な次元数に上るため,低次元で簡潔な表現として感性語との共起をもとに素性ベクトルを生成する手法を提案する.提案手法の評価実験の結果,分割誤りが生じる若者言葉に対し,分割誤りが生じない若者言葉と同等の感性推定精度が得られることが明らかになった.
- (キーワード)
- 俗語 / マイクロブログ / ツイッター / 感情計算 / 感性分類
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/CompComm.2015.7387618
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-84963939887
(DOI: 10.1109/CompComm.2015.7387618, Elsevier: Scopus) Kazuyuki Matsumoto, Kyosuke Akita, Minoru Yoshida, Kenji Kita and Fuji Ren :
Estimate the Intimacy of the Characters Based on Their Emotional States for Application to Non-Task Dialogue,
Proceedings of the 6th International Conference on Affective Computing and Intelligent Interaction (ACII2015), 327-333, Xi'an, Sep. 2015.- (要約)
- 非タスク型対話においては,ユーザとの会話を円滑かつ柔軟にするための工夫が必要となる.たとえば,ユーザの現実世界での人間関係を考慮することで,システムとユーザという閉じた人間関係から一歩踏み出すことが可能と考える.本稿では,演劇台本を題材に,対話中の2者間の人間関係を「親密度」という尺度により表現することを試みる.親密度に関わると考えられる要素として,発話の応答回数や発話中の態度などがある.本論文では,そのなかでも発話中の感情状態に着目することで,高精度な親密度推定の実現を試みる.評価実験の結果,発話役割に基づく従来手法を上回る高精度な親密度推定を実現することが出来た.
- (キーワード)
- 親密度推定 / 演劇台本コーパス / 感情認識
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/ACII.2015.7344591
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-84964027376
(DOI: 10.1109/ACII.2015.7344591, Elsevier: Scopus) Kazuyuki Matsumoto, Minoru Yoshida, Qingmei Xiao, Luo Xin and Kenji Kita :
Emotion Recognition for Sentences with Unknown Expressions based on Semantic Similarity by Using Bag of Concepts,
Proceedings of the 12th International Conference on Fuzzy Systems and Knowledge Discovery (FSKD'15), 1428-1433, Aug. 2015.- (要約)
- 従来研究では,感情表現,文構造の辞書や感情コーパスのようなテキストからの感情推定のための様々な手法を用いていた.しかし,既存の形態素解析辞書に含まれている表現に着目したものがほとんどで,それらは,未知語,とくに新しく作られた語への対応が不十分であった.日本では,weblogやSNSが普及において,10代から20代のweblogユーザが頻繁に新語を用いる.我々の研究では,新語を含んだweblogテキストから作成した感情コーパスを分析し,これらのテキストからの感情推定手法を提案する. とくに,我々は,単語の意味的な類似性に着目し,さらに,感情を含む表現に対して重み付けすることを考えた.また,若者言葉をはじめとする俗語は,意味的な分類があいまいであるため,既存のシソーラス等への辞書に登録することは困難である.こうした語に対処するため,我々が収集した大規模なTwitterコーパスから単語間の意味的な類似性を計算する.提案手法では,単語を意味のクラス番号に変換することで,学習データに含まれない語への対処を実現する.複数の機械学習による分類器を適用した評価実験の結果,提案手法は,ベースライン手法であるBag of wordsによる感情推定よりも高精度な感情推定がおこなえることがわかった.
- (キーワード)
- Bag of concepts / emotion recognition / unknown expression / semantic similarity
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/FSKD.2015.7382148
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-84966470618
(DOI: 10.1109/FSKD.2015.7382148, Elsevier: Scopus) Minoru Yoshida, Kazuyuki Matsumoto, Qingmei Xiao, Xielifuguli Keranmu, Kenji Kita and Hiroshi Nakagawa :
Extracting Corpus-Specific Strings by Using Suffix Arrays Enhanced with Longest Common Prefix,
Proceedings of the 10th Asia Information Retrieval Society Conference (AIRS 2014), LNCS 8870, 360-370, Kuching, Dec. 2014.- (要約)
- すべての部分文字列を候補とする新しい用語抽出手法を提案する.提案手法は,接尾辞配列を用いることにより,接尾辞木の節点を辿る操作をエミュレートする.言語的切れ目の良さを表すスコアと,分野特有度を表すスコアの2種のスコアを,リランキング手法により組み合わせて,候補のランキングを行う.実験により,頻度の高い用語に関しては,前処理で形態素解析を行う従来手法よりも高い精度で用語抽出が行えることを示す.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-319-12844-3_31
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-84912135895
(DOI: 10.1007/978-3-319-12844-3_31, Elsevier: Scopus) Kazuyuki Matsumoto, Sasayama Manabu, Qingmei Xiao, Fujisawa Akira, Minoru Yoshida and Kenji Kita :
Reranking the Search Results for Lyric Retrieval Based on the Songwriters' Specific Usage of Words,
Electronics, Communications and Networks IV Proceedings of the 4TH Internationa Conference on Electronics, Communications and Networks, 12 15 December 2014, Beijing, China, 1045-1052, Beijing, Dec. 2014.- (要約)
- 作詞者がよく用いる語を考慮することで歌詞検索の精度向上を目指す手法を提案する.既存の検索におけるクエリ拡張では,単語の共起関係を大規模テキストデータから得るものが多かった.しかしながら,歌詞の場合は,一般的なテキストデータとは語の共起傾向が異なることが先行研究からも明らかである.本論文で提案する手法は,歌詞においてよく出現するフレーズを分析する.また,検索に用いる歌詞片に人為的にノイズを加えることによる精度低下を抑えるため,誤りを検出する方法を考える.歌詞のtrigramによる曖昧検索に基づく拡張候補語の取得をおこなう.拡張候補語をキーとして,文脈的に類似したキーワードを検索クエリに加えたうえでの歌詞検索結果に対し,作詞者ごとに単語に重み付けすることでランキング結果を改善する.提案手法により,重み付けを行わない手法に比べMRRが向上することが確認できた.
- (キーワード)
- 歌詞検索 / クエリ拡張
Emotion Predicting Method Based on Emotion State Change of Personae according to the Other's Utterance,
Proceedings of the 3rd IEEE International Conference on Cloud Computing and Intelligence Systems(CCIS2014), 427-432, Nov. 2014.- (要約)
- 対話の流れからの相手の感情予測は,我々人間にとって自然なタスクであるが,会話システムやロボットにとっては非常に困難なタスクといえる.その理由として,人間の感情は対話時でも常に変化するものであり,その変化は内部の自我感情状態が外界からの刺激に反応することにより起きていると考えられる.従来の対話研究では,質問応答システムなどへの応用のため,発話の表面的特徴に着目したものがほとんどであり,内部感情と外界刺激との関連に着目したものは少なかった. 本論文ではシナリオにおける会話文に着目する.会話の流れや人間関係を分析する際に役立つ各種情報のタグ付けをコーパスに対しおこない,シナリオ感情コーパスを構築する. このコーパスを分析することで,他者の発話や感情が,感情の変化にどのような影響を及ぼすかについて考察した. この自己感情から相手感情の変化を予測する手法として,感情予測重みに基づいた手法を提案し,評価実験の結果,有効性を確認できた.
- (キーワード)
- emotion prediction / scenario corpus / emotion corpus
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/CCIS.2014.7175773
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-84988227783
(DOI: 10.1109/CCIS.2014.7175773, Elsevier: Scopus) Minoru Yoshida, Kazuyuki Matsumoto, Kenji Kita and Hiroshi Nakagawa :
Unsupervised Analysis of Web Page Semantic Structures by Hierarchical Bayesian Modeling,
Proceedings of the Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD) 2014, Part II, LNAI 8444, 572-583, Tainan, May 2014.- (要約)
- HTML文書レイアウトの意味構造に対するベイズ確率モデルを提案する.HTML文書の意味的階層構造を,各テキストブロック間の依存構造としてモデル化し,サンプリングによって適切な構造を推定する.提案モデルは階層ベイズモデルであり,各ブロックに付けられる「見出し」や「内容」といったラベルから単語やHTMLタグを生成する.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-319-06605-9_47
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-84901278613
(DOI: 10.1007/978-3-319-06605-9_47, Elsevier: Scopus) Akira Fujisawa, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Identifying who drew the illustration focusing on the eyes of the characters,
Proceedings of 20th Korea-Japan Joint Workshop on Frontiers of Computer Vision, 82-89, Feb. 2014.- (要約)
- 本論文では,イラスト画像の作者識別を行うことを目標とする.イラスト画像は作者によって絵柄が大きく異なる. また同一の作者であっても作品によってモチーフや構図などが異なり,一見して同じ作者の作品から共通点を探し出すことは難しい. そこでイラスト画像から作者の描き方の癖を特徴量として抽出し,それを利用して作者識別を行えないか考えた. 識別実験の結果,再現率は平均35%,作者ごとに調べると90%の再現率が得られた作家もいた.このことから,イラスト画像の書き込み具合を特徴量として用いることにより,ある程度作者を識別することができることがわかった.
- (キーワード)
- 画像処理 (image processing) / Identifying / Illustration / Edge / Canny Edge Detection
Improvement of Indexing Methods for Audio Fingerprinting Systems,
International Conference Data Mining, Civil and Mechanical Engineering (ICDMCME'2014), 65-71, Feb. 2014.- (要約)
- オーディオ指紋に基づく楽曲検索において,圧縮接尾辞配列を用いた検索インデックスの圧縮手法を提案した.提案手法では,ソートされたオーディオ指紋データが上位バイトは同じ値になりやすいという性質を利用し,8ビットデータ列に対してランレングス符号化を用いて圧縮を行っている.また,フィボナッチ・ハッシュ関数を用いたオーディオ指紋の検索手法に関しても述べた.
A Fast Retrieval Algorithm Based on Fibonacci Hashing for Audio Fingerprinting Systems,
Proceedings of the 2013 International Conference on Advanced Information Engineering and Education Science, 219-222, Beijing, Dec. 2013.- (要約)
- オーディオ指紋を用いた音楽検索システムでは,膨大な数のサブ指紋をデータベースの格納する必要がある.膨大なサブ指紋データベースの中から,検索楽曲と類似したものを効率的に検索するために,ハッシュ表を用いる手法が既に提案されている.本論文では,フィボナッチ・ハッシュ関数を用いることにより,メモリ容量に応じて,ハッシュ表の大きさを調整できるような検索手法を提案した.また,提案手法の有効性を実験で示した.
Emotion recognition method based on normalization of prosodic features,
Proceedings of the APSIPA Annual Summit and Conference (ASC) 2013, 1-5, Nov. 2013.- (要約)
- 音声からの感情抽出は重要な技術である.従来から感情識別に用いられている韻律的特徴量は,感情による変化だけではなく発話内容そのものによっても大きく変化する.本論文では,平静の感情で同じ発話内容を発話した音声からも特徴量を抽出し,それとの差分に注目することで感情による特徴量の変化のみを抽出する方法を提案する.本論文では,ピッチやパワー等の韻律的特徴に対し,正規化ありと正規化なしのすべての組み合わせの中で,最も性能が向上する組み合わせを探した.
Spoken document retrieval using both word-based and syllable-based document spaces with latent semantic indexing,
Proceedings of the APSIPA Annual Summit and Conference (ASC) 2013, Oct. 2013.- (要約)
- 本論文では,ベクトル空間モデルによる音声ドキュメント検索において,単語音声認識結果と音節認識結果をそれぞれのベクトル空間で表現し距離計算し,それらの距離を統合することにより類似文書検索を行う手法を提案する.これらの空間に対し潜在的意味解析を適用し,その有効性を調査した.有効性の調査には2011 年に行われたNTCIR–9 のドライランおよびフォーマルランを用いた.調査の結果より,音節空間に潜在的意味解析を適用することにより検索精度が向上することがわかった.
Spoken Content Retrieval Using Distance Combination and Spoken Term Detection Using Hash Function for NTCIR10 SpokenDoc2 Task,
Proceeding of the 10th NTCIR Conference, 597-603, Jun. 2013.- (要約)
- 本論文では,NTCIR10 SpokenDoc2タスクで用いられた音声内容検索(SCR)および音声検索語検出(STD)で用いられた手法について説明した.SCRでは,音声認識結果から得られる単語のベクトル空間および音節のベクトル空間で計算される類似度を統合することにより,音声内容検索を行った.STDでは,音声ドキュメントおよび検索質問双方をハッシュ関数によりビットベクトルに変換後,ハミング距離を計算することにより検索語検出を行う手法を提案した.
A Joint Prediction Model for Multiple Emotions Analysis in Sentences,
14th International Conference on Intelligent Text Processing and Computational Linguistics, 149-160, Mar. 2013.- (要約)
- 本研究では,人間の複数の感情状態を中国語で書かれたテキストから認識する手法を提案する.提案手法では,CRFによる確率的なモデルを用いて,単語の感情を予測する.また,出力された単語の感情をもとに,文の感情を推定する.推定には,SVMとLGRによる分類器を用いる.最終的に,複数のモデルをマージすることで,文からの最適な感情推定を実現する.
Spoken document retrieval using combinational use of distances of multiple vector spaces and query expansion with optimized weight parameters,
Proc. NCSP'13, 9-12, Mar. 2013.- (要約)
- 音声ドキュメント検索における距離尺度組み合わせ法を提案する.提案法は音声認識で書き起こされた目標文書を複数のベクトルスペースにマッピングする.それぞれの空間内で検索質問と文書の距離を求め,それを組み合わせて検索する.検索質問拡張において,拡張された検索質問と文書のベクトル間の角度を最小化する重み係数決定法も提案した.提案手法はNTCIR-9のSpokenDocタスクにおいて最良の結果であった.
Recognition of Multiple Emotion States of Words using Multi-engine System,
11th International Conference on Computer Applications 2013, 201-206, Feb. 2013.- (要約)
- 本論文では,複数感情状態の推定をおこなうための複数エンジンによる投票システムを提案する.具体的には,最大エントロピーモデルや条件付き確率場により学習・推定された結果をもとに,文中の単語の表現する感情を1つに決定する.また,不均衡なデータへの対処のため,無感情状態かどうかを決定するための閾値の推定をおこなった.本手法の評価実験により,単独で推定モデルを用いるよりも高精度に単語の感情推定がおこなえることを明らかにした.
- (キーワード)
- Emotion Estimation / Maximum Entropy / Conditional Random Fields
Recognition of Multiple Emotion States of Words using Multi-engine System,
11th International Conference on Computer Applications 2013, 201-206, Feb. 2013. Kazuyuki Matsumoto, Kenji Kita and Fuji Ren :
Emotion Estimation from Sentence Using Relation between Japanese Slangs and Emotion Expressions,
Proceedings of 26th Pacific Asia Conference on Language,Information and Computation, 377-384, Nov. 2012.- (要約)
- 本論文では,日本語俗語(若者言葉)を含んだ発話文の感情を推定するために,若者言葉を特徴とした感情推定手法を提案する.低頻度の若者言葉においては,コーパスを用いた機械学習による感情推定では,特徴としては有効ではないため,Webから自動収集したコーパスにおいて低頻度若者言葉と同一の文に出現する感情表現を素性として用いることを検討する.本手法により,単純な形態素N-gramを素性として用いた場合よりも20%の精度改善が認められた.
- (キーワード)
- Emotion Corpus / Japanese Slang / Out of Vocabulary
Judgment of Depressive Tendency from Emotional Fluctuation in Weblog,
Proceedings of the 16th International Conference on Knowledge-Based and Intelligent Information & Engineering Systems - KES2012, 545-554, Sep. 2012.- (要約)
- 本研究では,うつ傾向のあるブログ作者を検出するための手法を提案する.多くのブログ作者は,日々の健康状態や心的状態について,自分の言葉で書きつづる.本研究は,うつ傾向の検出が目的であるため,うつ傾向が顕著な場合に,どのような語が高頻度で出現するかについても,検討する必要がある.単語の感情極性と,その出現頻度の時間的変化に着目することで,あるブログ作者のブログと,類似する感情変化パターンを持つブログ作者のうつ傾向属性を同じ感情極性であると判別することにより,従来の単語素性に基づく機械学習手法よりも高精度なうつ傾向判別を目指す.
- (キーワード)
- Weblog / Emotional Fluctuation / Depressive Tendency
Learning Distance Metrics with Feature Space Performance for Image Retrieval,
2012 Third International Conference on Mechanic Automation and Control Engineering (MACE '12), 3579-3583, Jul. 2012. Le Zhang and Kenji Kita :
Skeleton Extraction and Pruning based on Multi-scale Turning Angle Descriptor,
18th Korea-Japan Joint Workshop on Frontiers of Computer Vision, 256-262, Feb. 2012.- (要約)
- 画像のスケルトン(骨格)は,画像解析などにおいて形状を表す上で重要な特徴量である.本論文では,まずユークリッド距離で順序付けられた細線化アルゴリズムを提案した.次に,スケルトンは輪郭上のノイズに敏感であるため,輪郭上から重要なスケルトン点を同定するための特徴としてマルチスケール回転角記述子を提案した.
Region-Based Image Annotation Using Gaussian Mixture Model,
2012 International Conference on Information Technology and Software Engineering, 503-510, 2012. Wu Yunong, Kenji Kita, Fuji Ren, Kazuyuki Matsumoto and Kang Xin :
Exploring Emotional Words for Chinese Document Chief Emotion Analysis,
Proceedings of 25th Pacific Asia Conference on Language, Information and Computation(PACLIC2011), 597-606, Dec. 2011.- (要約)
- 本研究では,文書の感情分析モデルを,感情的な語のアノテーション機能を用いて開発する.8種類の基本感情カテゴリを選択し,単語と文書レベルでの感情分析をおこなう.我々は,2つのパラメータとして,単語と感情の間の関連性と,文書と感情の関連性のパラメータを導入した.評価実験結果により,異なる感情状態において,文書の感情分析モデルの有効性を示した.
- (キーワード)
- emotional words annotation / document emotion analysis / term relevance / term frequency
Exploring Emotional Words for Chinese Document Chief Emotion Analysis,
The 25th Pacific Asia Conference on Language, Information, and Computation (PACLIC25), 597-606, Dec. 2011. Wu Yunong, Kenji Kita, Fuji Ren, Kazuyuki Matsumoto and XIN KANG :
Exploring Emotional Words for Chinese Document Chief Emotion Analysis,
The 25th Pacific Asia Conference on Language, Information, and Computation (PACLIC25), 597-606, Dec. 2011. Kazuyuki Matsumoto, Kenji Kita and Fuji Ren :
Emotion Estimation of Wakamono Kotoba Based on Distance of Word Emotional Vector,
Proc. IEEE International Conference on Natural Language Processing and Knowledge Engineering, 214-220, Tokushima, Nov. 2011.- (要約)
- 本研究では,日本語俗語に対する感情カテゴリ付与のための手法を提案する.日本語俗語のなかでも,種類が多く,日々増え続けては使い捨てられていく若者言葉に着目する.提案手法は若者言葉の共起語を共起語ベクトルとして表現し,それぞれの語に2次元の感情極性ベクトルを付与することで,より正確な類似度の計算を実現する.本研究で提案した手法により,EMDを用いることで,従来の単語重要度を用いた類似度計算法より高精度に感情推定がおこなえることを明らかにした.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/NLPKE.2011.6138197
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-84857271107
(DOI: 10.1109/NLPKE.2011.6138197, Elsevier: Scopus) Yunong Wu, Kenji Kita, Fuji Ren, Kazuyuki Matsumoto and XIN KANG :
Modification Relations based Emotional Keywords Annotation using Conditional Random Fields,
The 4th International Conference on Intelligent Networks and Intelligent Systems (ICINIS2011), 81-88, Nov. 2011. Wu Yunong, Kenji Kita, Fuji Ren, Kazuyuki Matsumoto and XIN KANG :
Modification Relations based Emotional Keywords Annotation using Conditional Random Fields,
The 4th International Conference on Intelligent Networks and Intelligent Systems (ICINIS2011), 81-88, Nov. 2011. Qingmei Xiao, Motoyuki Suzuki and Kenji Kita :
Fast Hamming Space Search for Audio Fingerprinting Systems,
Proc. International Conference on Music Information Retrieval, 133-138, Oct. 2011.- (要約)
- 楽曲検索では,ノイズ等による楽曲の劣化や,検索質問曲の演奏開始位置が不明であることから,一般に膨大な検索空間を探索する必要がある.多くの楽曲検索システムでは,楽曲の音響的・知覚的な特性に基づくオーディオ指紋(audio fingerprint) を特徴量として用いているが,本稿では,オーディオ指紋に適した高速検索手法を提案する.また,8,740 曲の楽曲データベースを用いた評価実験を行い,提案手法の有効性を示した.
Modification Relations Based Emotional Keywords Annotation Using Conditional Random Fields,
Proceedings of 2011 Fourth International Conference on Intelligent Networks and Intelligent Systems, 81-84, Oct. 2011.- (要約)
- 本研究では,修飾語素性の感情キーワード付与においての有効性について述べる.中国語感情コーパスを用いて,8種類の感情カテゴリを選択し,Conditional Random Fieldsにより,単語の感情を推定する.提案手法の評価実験の結果,修飾語素性が感情キーワード付与に有効であることを明らかにした.
- (キーワード)
- modification features / emotional keywords annotation / CRFs
An Improved Method to Select Candidates on Metric Index VP-tree,
Proceedings of the International Conference on Knowledge Discovery and Information Retrieval (KDIR 2011), Oct. 2011.- (要約)
- VP木は,距離空間に対する効率的なインデックス手法であるが,葉ノードにおける距離計算が多いという欠点がある.本論文では,VP木の葉ノードにおける距離計算を削減する手法を提案する.提案手法は,検索質問の近傍点を用いて三角不等式による絞り込みを行うことで,葉ノードにおける距離計算を削減する.
Music Retrieval Method Based on Filter-bank Feature and Earth Mover's Distance,
7th International Conference on Natural Computation, 1872-1876, Jul. 2011.- (要約)
- 本論文では,フィルタバンク特徴量とEarth Mover's Distance(EMD)を用いた音楽検索手法を提案した.提案手法は,音楽データから抽出されるMFCCをクラスタリングし求められた各クラスタのセントロイドおよび各クラスタに属するMFCCの個数を特徴量とし,特徴量間の距離尺度にEMDを用いるものである.
Security Clustering Algorithm Based on Reputation in Hierarchical Peer-to-Peer Network,
4th IEEE International Conference on Computer Science and Inforymation Technology, 222-225, Jun. 2011. Luo Xin, Chen Mei, Pan Qiao, Wu Guowen and Kenji Kita :
Optimum Distance Metric Based on Image Feature Space,
4th IEEE International Conference on Computer Science and Information Technology, 258-263, Jun. 2011. Zhang Wenbin, Lu Haoze, Horiuchi Yasuo, Satoru Tsuge, Kenji Kita and Shingo Kuroiwa :
Text-Independent Speaker Identification Based on Reducing Inter-Session Variability of Speech Feature Using PCA Transformation,
2011 International Workshop on Nonlinear Circuits, Communication and Signal Processing, 421-424, Mar. 2011.- (要約)
- テキスト独立な話者認識において,音声変動やセッション間変動は話者認識の精度に大きな影響を与える.本論文では,PCA変換を用いることにより,音声データのセッション間変動を削減することを提案する.提案手法を用いることにより,MFCCを用いる従来手法に比べ,誤認識率を42.6%削減でき,MFB-PCAに基づく手法に比べ,誤認識率を27.2%削減できた.
Instance Search Experiments for TRECVID 2010,
Proceedings of TREC Retrieval Evaluation 2010 (TRECVID2010), Mar. 2011.- (要約)
- TRECVID 2010において,我々の研究グループはインスタンス検索タスクに参加した.特に,SIFT特徴量を用いた顔検索システムを開発し,評価を行った.我々の検索システムの大まかな流れを示す.まず,顔検出器を用いて各フレーム画像から顔領域を検出する.次に学習データとSVMを用いて,誤検出した顔領域を排除する.その後,各顔領域からSIFT特徴量を検出し,データベースに格納する.クエリーについても同様にSIFT特徴量を検出し,ユークリッド距離に基づいて類似性を計算する.
A Method to Improve Metric Index VP-tree for Multimedia Databases,
Proc. of 17th Korea-Japan Joint Workshop on Frontiers of Computer Vision (FCV2011), 55-60, Feb. 2011. Chen Mei, Wu Guowen, Luo Xin, Kenji Kita and Yang Liqin :
First Coming Clustering Algorithm Based on Reputation in Peer-to-Peer Network,
2010 WASE International Conference on Information Engineering, Aug. 2010. Zhang Le, He Qing, Shin-ichi Ito and Kenji Kita :
Euclidean Distance-Ordered Thinning for Skeleton Extraction,
Proc. of the 2nd International Conference on Education Technology and Computer, ICETC'10, Vol.1, 311-315, Shanghai, Jun. 2010.- (要約)
- 画像のスケルトン(骨格)は,画像解析などで形状を表す上で重要な特徴量である.本論文では,スケルトン抽出のための,ユークリッド距離で順序付けらえた細線化アルゴリズムを提案した.提案したアルゴリズムにより,元の物体のトポロジーを正確に反映した連続した1ピクセル幅のスケルトンを抽出できた.また,抽出されたスケルトンの位置は正確であり,輪郭ノイズの影響を受けないことを示した.
A Skeleton Extraction and Pruning Algorithm Based on Bisector Angle,
16th Korea-Japan Joint Workshop on Frontiers of Computer Vision, 327-335, Feb. 2010.- (要約)
- 画像のスケルトン(骨格)は,画像解析などで形状を表す上で重要な特徴量である.本論文では,与えらえた点がスケルトン点であるか否かという基準に基づき,スケルトンを高速かつ正確に抽出アルゴリズムを提案する.また,スケルトンは輪郭ノイズから影響を受けやすので,終端枝角の二等分線に基づく,スケルトンの枝刈りアルゴリズムを提案する.提案したアルゴリズムは,余分な突出を削除することにより,元の形状を保持した正確なスケルトンを抽出できる.
A Research of Distance Transform based Peeling Algorithm for Overlapped Fibers Separation,
International Conference on Computational Intelligence and Software Engineering, Dec. 2009.- (要約)
- 繊維の横断面解析において,重なった繊維の分離は重要な課題である.ここでは,距離変換に基づいた剥離アルゴリズムを提案する.提案したアルゴリズムにより,さまざまな形状の重なった繊維を正確に分離できることを示した.
A Fast Retrieval Algorithm for the Earch Mover's Distance Using EMD Lower Bounds and the Priority Queue,
IEEE NLP-KE 2009, Dalian, China, Sep. 2009.- (要約)
- Earth Mover's Distance(EMD)は2つの分布間の距離尺度であり,画像検索を始めとするさまざまなマルチメディア情報検索において用いられている.我々は,EMDに基づく大規模データ検索を高速かつ効率的に行うためのライブラリfastEMDを開発した.本論文では,fastEMDの実装に用いられている技術およびfastEMDの性能評価実験について述べた.
Two-Level Content-based Endoscope Image Retrieval,
Fourth International Conference on Natural Computation, 208-212, Oct. 2008.- (要約)
- 内視鏡画像の解析に基づき,新しい色の定量化手法を提案し,これにより画像から特徴量として,改良されたCCVおよび形状不変モーメントを抽出する手法を提案した.
A Fast Retrieval Algorithm for the Earch Mover's Distance Using Lower Bounds,
IEEE International Conference on Information Reuse and Integration, 445-450, Jul. 2008.- (要約)
- EMDは特徴量間の最適な距離尺度としてコンピュータービジョンの分野に導入され,マルチメディアデータベースに頻繁に用いられている.特にEMDを距離尺度に用いた類似画像検索は高精度な結果が得られることが紹介されている.しかしながら,EMDはシンプレックス法に代表される線形計画問題により計算されるため,計算コストが非常に高く,大規模なデータには不向きであった.この問題に対して,我々はEMDの下限値を用いて,EMDを高速に計算するアルゴリズムを提案する.
A Method to Retrieve Telops Based on the Distance of Character Image Features between Query and Telop,
Proceedings of 14th Korea-Japan Joint Workshop on Frontiers of Computer Vision (FCV2008), 25-30, Oita, Jan. 2008.- (要約)
- 本論文では,テロップ内に出現する文字に基づく字幕検索手法を提案する.本手法では,テロップ内に出現する字幕文字とクエリーを構成する文字群(1グラム,2グラム)との間の画像特徴量の類似性に着目して検索を行う.実際に91個の検索クエリーを用いた実験を行った結果,1グラム特徴量用いた場合には98.61%,2グラム特徴量を用いた場合には99.59%の検索精度が得られた.更に,2グラム特徴量を用いた場合には約0.5秒以内で検索され,高速かつ高精度な映像シーン検索システムを実現できた.
A Fast Retrieval Method for the Earth Mover's Distance in Multimedia Databases,
Proceedings of 14th Korea-Japan Joint Workshop on Frontiers of Computer Vision (FCV2008), 35-40, Oita, Jan. 2008. Mitsuhiro Ozawa, Satoru Tsuge, Masami Shishibori, Kenji Kita, Minoru Fukumi, Fuji Ren and Shingo Kuroiwa :
Automatic Utterance Segmentation Tool for Speech Corpus,
IEEE NLP-KE2007, 401-406, Beijing, Aug. 2007.- (要約)
- We collect the speech data for investigating an intra-speakers' speech variability over a short and long time. In general, to reduce the load of speakers, the speech data are collected as one file from collecting start to collecting end. Hence, there are some noises, non-speech sections and mistaken sections in this file. Consequently, we must segment this file into individual utterances and select the useful utterances. This process requires a lot of time and efforts. In this paper, we propose an automatic utterance segmentation tool for dividing the collected speech data. The proposed tool is composed of four processes, which are a voice activity detection, speech recognition, a DP matching, and a correct of speech section. For evaluating the proposed tool, we conduct the evaluation experiments using a female speaker's speech data in our corpus. Experimental results show that the proposed method can reduce a filing time by 90% compared to a manual filing. In This paper, first, we introduced the large speech corpus. This speech corpus contains is the speech data collected by specific speaker over long and short time periods. And, we explained the automatic utterance segmentation tool which we made in the case of corpus build. And inspected the validity. As a result, it was demonstrated that the automatic utterance segmentation tool was high-performance. Furthermore, it was demonstrated that speech corpus build became simple by using the automatic utterance segmentation tool.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/NLPKE.2007.4368062
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-47749136580
(DOI: 10.1109/NLPKE.2007.4368062, Elsevier: Scopus) Satoru Tsuge, Keiji SEIDA, Masami Shishibori, Kenji Kita, Fuji Ren, Minoru Fukumi and Shingo Kuroiwa :
Analysis of Variation on Intra-Speakers Speech Recognition Performances,
IEEE NLP-KE2007, 387-392, Beijing, Aug. 2007.- (要約)
- Even if a speaker uses a speaker-dependent speech recognition system, speech recognition performance varies. However, the relationships between intra-speaker's speech variability and speech recognition performance are not clear. To investigate these relationships, we have been collecting speech data since November 2002. In this paper, we analyze the relationships between intra-speaker's speech variability and the phoneme accuracy by a correlation analysis. Analyzed results showed the strong negative correlation between the phoneme accuracy and the speaking rate. The correlation coefficient indicated -0.77. Moreover, we can see that the phoneme accuracy is correlated with the temperature in the recording room and the humidity difference.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/NLPKE.2007.4368060
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1109/NLPKE.2007.4368060
(DOI: 10.1109/NLPKE.2007.4368060) Masaki Naito, Kazumori Matsumoto, Masami Shishibori, Kenji Kita, Marco Cuturi, Tomoko Matsui, Shin'ichi Sato, Keiichiro Hoashi, Fumiaki Sugaya and Yasuyuki Nakajima :
Shot Boundary Detection and High-Level Feature Extraction Experiments for TRECVID 2006,
Proceedings of TREC Retrieval Evaluation 2006 (TRECVID2006), Washington, D.C., Mar. 2007. Satoru Tsuge, Minoru Fukumi, Masami Shishibori, Fuji Ren, Kenji Kita and Shingo Kuroiwa :
Study of Relationships Between Intra-Speaker's Speech Variability and Speech Recognition Performance,
2006 International Symposium on Intelligent Signal Processing and Communication Systems (ISPACS 2006), 41-44, Tottori, Japan, Dec. 2006.- (要約)
- Even if a speaker uses a speaker-dependent speech recognition system, speech recognition performance varies. For this reason, speech quality is varied by some factors, including emotion, background noise, and so on, even though the speaker and utterance remain constant. However, the relationships between intra-speaker's speech variability and speech recognition performance are not clear. Hence, we focus on the intra-speaker's speech variability which affects the speech recognition performances. To investigate these relationships, we have been collecting speech data since November 2002. Using a part of the speech corpus, we conducted speech recognition experiments. In this paper, we analyze the relationships between intra-speaker's speech variability and the phoneme accuracy by using the correlation analysis. For factors of the correlation analysis, we use a number of errors, a speaking rate, a likelihood. Analysis results show a strong correlation between the number of the substitution errors and the phoneme accuracy although the correlations of the number of the deletion and the insertion errors are low. Therefore, it is considered that there are overlaps between phonemes since the feature parameters vary at each speaking rate. For improving the phoneme accuracy, it is needed that we study a method which discriminates phonemes. On the other hand, although the correlation between the phoneme accuracy and the speaking rate seems to be low, a strong correlation between the speaking rate and the number of deletion errors and insertion errors are found. Since the number of the insertion errors and the number of the deletion errors were in the counterbalance relation, the correlation between the speaking rate and the phoneme accuracy was low. However, we consider that it is needed to normalize the speaking rate because the speaking rate influences on the number of the deletion and the insertion errors.
Study of Intra-Speaker's Speech Variability over Long and Short Time Periods for Speech Recognition,
Proc. of 2006 IEEE International Conference on Acoustic, Speech, and Signal Processing (ICASSP2006), Vol.1, 397-400, Toulouse, France, May 2006.- (要約)
- In this paper, we describe a Japanese speech corpus collected for investigating the speech variability of a specific speaker over short and long time periods and then report the variability of speech recognition performance over short and long time periods. Although speakers use a speaker-dependent speech recognition system, it is known that speech recognition performance varies pending when the utterance was uttered. This is because speech quality varies by occasion even if the speaker and utterance remain constant. However, the relationships between intra-speaker speech variability and speech recognition performance are not clear. Hence, we have been collecting speech data to investigate these relationships since November 2002. In this paper, we introduce our speech corpus and report speech recognition experiments using our corpus. Experimental results show that the variability of recognition performance over different days is larger than variability of recognition performance within a day.
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-33947625663
(Elsevier: Scopus) Kazumori Matsumoto, Masaru Sugano, Masaki Naito, Keiichiro Hoashi, Haruhisa Kato, Masami Shishibori, Kenji Kita, Fumiaki Sugaya and Yasuyuki Nakajima :
Shot Boundary Detection and Low-Level Feature Extraction Experiments for TRECVID 2005,
Proceedings of TREC Retrieval Evaluation 2005 (TRECVID2005), 155-167, Washington, D.C., Mar. 2006. Kazumori Matsumoto, Keiichiro Hoashi, Masaki Naito, Masami Shishibori and Kenji Kita :
Report on TRECVID 2005,
Proceedings of 12th Korea-Japan Joint Workshop on Frontiers of Computer Vision (FCV2006), 65-70, Tokushima, Feb. 2006. Nobuki Nishikawa, Masami Shishibori, Satoru Tsuge and Kenji Kita :
A Method to Retrieve Video Scenes based on the Distance of Character Image Features between Query and Telop,
Proceedings of 12th Korea-Japan Joint Workshop on Frontiers of Computer Vision (FCV2006), 211-216, Tokushima, Feb. 2006.- (要約)
- 本論文では,映像テロップ内に出現する文字に基づく映像シーン検索手法を提案する.テロップに基づく映像シーン検索を実現するために,我々は映像テロップ内に出現する文字種別に着目した.特に,適切な映像シーンを検索するためには,テロップ内に出現するすべての文字を認識する必要はなく,検索クエリーを構成する文字に対してのみの類似度が得られれば,適切な映像シーンが検索できる.そのため本手法では,テロップ文字とクエリー文字との画像特徴量間の類似度を比較することで,高速かつ高精度な検索システムを実現した.
Estimation of the Camera Motion based on Movement of Interest Points between Images,
Proceedings of 12th Korea-Japan Joint Workshop on Frontiers of Computer Vision (FCV2006), 145-150, Tokushima, Feb. 2006.- (要約)
- 本論文では,映像内の各フレーム画像から検出された特徴点の変化に着目し,カメラモーションを効率的に推定する手法を提案する.まず,各フレーム画像から特徴点を検出し,隣接画像間にて特徴点の対応関係を決定する.その後,特徴点の動き変化に基づいて,カメラモーションの種別(ズーム,パン,チルト等)を推定する.推定方法としては,特徴点の動き変化を特徴ベクトル化し,学習用データからSVMを用いて判別モデルを作成する.
Feedback Retrieval using the Image Knowledge Database on WWW Image Retrieval Systems,
Proceedings of 12th Korea-Japan Joint Workshop on Frontiers of Computer Vision (FCV2006), 205-210, Tokushima, Feb. 2006.- (要約)
- 本論文では,WWW画像検索システムにおける画像知識データベースを用いたフィードバック検索手法を提案する.画像知識データベースにはキーワードと対応する画像の特徴量が登録されており,登録済みキーワードに対しては,画像特徴量の類似性から,より適切な画像を絞り込む.未登録のキーワードに関しては,検索画像の特徴量をクラスタリングし,各クラスタの中心を構成する画像特徴量と対応するキーワードを画像知識データベースにフィードバックすることで,未登録キーに対する検索を可能にする.
Automatic Meta-Data Annotation of Image Region,
Proceedings of 2005 IEEE International Conference on Natural Language Processing and Knowledge Engineering (IEEE NLP-KE'05), 835-838, Wuhan, Oct. 2005.- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/NLPKE.2005.1598852
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-33847307648
(DOI: 10.1109/NLPKE.2005.1598852, Elsevier: Scopus) Masami Shishibori, Daichi Koizumi, Kazuaki Ando, Satoru Tsuge and Kenji Kita :
Development of a WWW Image Retrieval System Using the Image Knowledge Database,
Proceedings of 2005 IEEE International Conference on Natural Language Processing and Knowledge Engineering (IEEE NLP-KE'05), 506-510, Wuhan, Oct. 2005.- (要約)
- 本論文では,画像知識データベースを用いた新しいWWW画像検索システムを提案する.本システムは,既存のWWW画像検索システムの検索結果をフィルタリングすることで,より適切な画像をユーザに提示することができる.画像知識データベースにはキーワードと対応する画像の特徴量が登録されており,登録済みキーワードに対しては,画像特徴量の類似性から,より適切な画像を絞り込む.実際の検索用キーワードを用いた検索実験を行った結果,既存のシステムよりも精度向上が得られた.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/NLPKE.2005.1598790
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-33847298544
(DOI: 10.1109/NLPKE.2005.1598790, Elsevier: Scopus) Satoru Tsuge, Masami Shishibori, Fuji Ren, Kenji Kita and Shingo Kuroiwa :
Data Collection for Investigating Speech Variability in a Specific Speaker Over Long and Short Time Periods,
Proceedings of 2005 IEEE International Conference on Natural Language Processing and Knowledge Engineering (IEEE NLP-KE'05), 152-157, Wuhan, Oct. 2005.- (要約)
- In this paper, we describe a Japanese speech corpus collected for investigating the speech variability of a specific speaker over short and long time periods. Although speakers use a speaker-dependent speech recognition system, it is known that speech recognition performance varies pending when the utterance was uttered. This is because speech varies even if the speaker utters a specific sentence. However, the relationship between intra-speaker speech variability and speech recognition performance is not clear. We have not seen a corpus of Japanese speech data of a specific speaker over a long time period. Hence, since 2002, we have been collecting speech data for investigating the relationships between speech variability and speech recognition performance. In this paper, we introduce our speech corpus and conduct speech recognition experiments. Experimental results show that the variability of recognition performance over different days is larger than variability of recognition performance within a day.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/NLPKE.2005.1598725
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-33847334792
(DOI: 10.1109/NLPKE.2005.1598725, Elsevier: Scopus) Satoru Tsuge, Masami Shishibori, Fuji Ren, Kenji Kita and Shingo Kuroiwa :
Frequency Characteristic Normalization Method using Blind Equalization Technique with Multiple References for DSR,
Proceedings of 10th International Conference SPEECH and COMPUTER (SPECOM2005), Vol.1, 103-106, Patras, Greece, Oct. 2005.- (要約)
- In this paper, we propose a blind equalization method with multiple references for ETSI standard Distributed Speech Recognition (DSR) front-end. The proposed method compensates for acoustic mismatch caused by input devices. In ETSI advanced DSR front-end, the blind equalization method is introduced to compensate for acoustic mismatch. This method estimates the bias, which compensates for the mismatch, using one reference vector. If the input speech is short or contains many similar phonemes, there is concern that this method might not estimate the accurate bias. The proposed method estimates the bias using multiple references instead of one reference. Using multiple references, the proposed method estimates the bias more accurately. In addition, we represent the references by combining the VQ centroids used in the data compression process of ETSI standard DSR front-end. This limits increases in memory size and computation costs on the front-end. As a result, we can carry out this method in real-time on the DSR front-end. Experimental results on a Japanese newspaper dictation task indicate that the proposed method gave better performance under acoustic mismatched conditions than the conventional blind equalization method.
Image Feedback Retrieval Based on Vector Space Model Transformation,
Information Retrieval Technology, 616-625, Oct. 2005.- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/11562382_58
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1007/11562382_58
(DOI: 10.1007/11562382_58) Satoru Tsuge, Shingo Kuroiwa, Masami Shishibori, Kenji Kita and Fuji Ren :
Evaluation of frequency characteristic normalization method with multiple reference cepstrum on the Japanese newspaper article sentences speech corpus,
Proceedings of the third International Conference on Information, 199-202, Tokyo, Nov. 2004.- (要約)
- 本論文では,分散型音声認識システムにおける入力系の周波数特性の違いによる音声認識精度の低下を抑制するため,複数の参照ケプストラムを用いた周波数特性正規化手法を提案した.提案手法は,フレーム同期で駆動し,各フレームで最近の参照ケプストラムを探し,周波数特性を正規化するバイアスを計算する手法である.提案手法の有効性を検証するため日本語連続音声認識実験を行った結果,提案手法は入力系の周波数特性が変動しても,音声認識精度の低下は少なく,有効であることがわかった.
Evaluation of ETSI Advanced Front-end and Bias Removal Method on the Japanese Newspaper Article,
Proceedings of EUROSPEECH2003, 2145-2148, Geneva, Sep. 2003.- (要約)
- 本論文では,分散型音声認識システムにおける入力系の周波数特性の違いによる音声認識精度の低下を抑制するため,入力系の周波数特性を正規化する手法を提案した.提案手法は,実時間で駆動し,各フレームで最近の平均音素パラメータを探し,周波数特性を正規化するバイアスを計算する手法である.提案手法の有効性を検証するため日本語連続音声認識実験を行った結果,提案手法は入力系の周波数特性が変動しても,音声認識精度の低下は少なく,有効であることがわかった.
To define the feature function in extracting Japanese-Chinese bilingual word pairs using maximum entropy modeling,
IEEE International Conference on Systems, Man and Cybernetics, Vol.3, 291-294, Tunisia, Oct. 2002.- (要約)
- 本論文では,多言語処理における機械翻訳システムにとって重要な翻訳辞書を構築する新しいアプローチを提案する.提案したアプローチでは,最大エントロピー·モデリングを使用して,並列コーパスからの2か国語の単語ペアを学習してモデル化される技術を開発した日中翻訳コーパスにより実験を行った結果から本手法の有効性を分かった.
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-0038345949
(Elsevier: Scopus) Tai Xiaoying, Fuji Ren and Kenji Kita :
Long-term Relevance Feedback using Simple PCA and Linear Transformation,
13th International conference and workshop on Database and Expert Systems Applications, 261-265, France, Sep. 2002.- (要約)
- 情報検索の代表的なモデルであるベクトル空間モデルを対象に,ユーザからのフィードバック情報を長期的に検索システムに反映させる方法を提案した.
Robust Feature Extraction in a Variety of Input Devices on the Basis of ETSI Standard DSR Front-end,
7th International Conference on Spoken Language Processing, 2221-2224, Denver, USA, Sep. 2002.- (要約)
- 本論文では,分散型音声認識システムにおける入力系の周波数特性の違いによる音声認識精度の低下を抑制するため,入力系の周波数特性を正規化する手法を提案した.提案手法は,入力音声の特徴パラメータの平均と伝送の際に使用されるVQセントロイドの平均を一致させる手法である.
Development of Image Keyword Registration System for Cross-media Information Retrieval between Texts and Images,
International Conference on Information-2002, Series of Information & Management Sciences, Vol.3, 166-171, Beijing, Jul. 2002.- (要約)
- テキスト·コンテンツと画像コンテンツに対するクロス·メディア検索を実現するためには,画像コンテンツ中の対象物を表すキーワードや画像から連想される感性語が付与された大規模画像知識データベースが必要となる.本論文では,使いやすいインタフェース機能と,ネットワークを介して複数のユーザがデータベースに高速にアクセスできる機能を有した画像キーワード登録システムの開発について述べる.
Latent Semantic Indexing Based on Simple Principal Component Analysis,
International Conference on Information-2002, Series of Information & Management Sciences, Vol.3, 172-177, Beijing, Jul. 2002.- (要約)
- 特異値分解(SVD)を用い次元数を削減した空間で類似度を計算する潜在的意味インデキシング(Latent Semantic Indexing; LSI)は文書検索の分野で有効性の高い手法として知られている.本稿では 1) SVDに比べより少ない演算量で基底ベクトルを求めることが可能,かつ,2) 2分割クラスタリングを繰り返すことにより基底ベクトルを求める手法でありSVDに比べ高い検索精度が期待できる,Simple Principal Component Analysis(SPCA)を次元削減に適用する.また,SPCAの繰り返し演算を制御する手法を提案する.MEDLINEコレクションを用いた検索実験を行った結果,SVDと同等以上の検索性能をSPCAにより達成した.
An Evaluation of Japanese Speech Recognition Using ETSI Standard DSR Front-end,
International Conference on Information-2002, Series of Information & Management Sciences, Vol.3, 372-376, Beijing, Jul. 2002.- (要約)
- 本論文では,日本語音声データベースを用いETSIが勧告している分散型音声認識フロントエンドの評価を行った.ETSIが勧告している分散型音声認識フロントエンドは,欧州言語により開発されている.そこで,このフロントエンドが日本語言語に対し有効であるかどうか検証した.検証は日本語連続音声データベースを用い行い,従来のフロントエンドと比較してほぼ同等の認識精度を示すことがわかった.しかし,ETSIが勧告している分散型音声認識フロントエンドは特徴量伝送のためVQによる圧縮を行っている.その圧縮部の影響で,入力系の周波数特性が分散型音声認識精度を劣化させることがわかった.
Extracting Japanese-Chinese Bilingual Word Paris with Maximum Entropy Model,
Series of Information & Management Sciences, Vol.3, 33-37, Beijing, Jul. 2002.- (要約)
- 本論文では,機械翻訳のような多言語自然言語処理中で広く使用される翻訳辞書を構築するために新しいアプローチを提案する.これは最大エントロピー·モデリングを使用して,対訳コーパスから2か国語の単語ペアを抽出する方法である.本論文はこのアプローチの概要を述べ,日中対訳コーパスから抽出実験の結果を報告する.
Dimensionality Reduction Using Non-negative Matrix Factorization for Information Retrieval,
Natural Language Processing and Knowledge Engineering Mini Symposium, IEEE SYSTEMS, MAN, AND CYBERNETICS 2001 (NLPKE), 960-965, Tucson, Oct. 2001.- (要約)
- ベクトル空間情報検索モデルを用いた全文検索を行う場合,各文書を表現する索引語ベクトルがスパースになることが問題となる.そこで,本論文ではベクトル空間モデルの次元削減により情報検索精度を向上させる.次元削減には,非負行列である文書行列に対する次元削減手法として,Non-negative Matrix Factorization (NMF)を適用した.NMFは非負行列を2つの非負行列へ分解を行う手法である.提案手法は,NMFを用い非負行列である索引語文書行列を分解し,その一方の行列へ索引語文書行列を射影することにより,次元削減を行う手法である.MEDLINEを用いた情報検索実験で提案手法の有効性を示した.また,この検証結果より同一次元では従来の手法SVDを用いた手法と同等の検索精度を示すことがわかった.
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-0035725021
(Elsevier: Scopus) Fuji Ren, Li Shigang and Kenji Kita :
Automatic Abstracting Important Sentences of Web Articles,
IEEE International Conference on System, Man, and Cybernetics, Vol.3, 1705-1710, Tucson, Oct. 2001.- (要約)
- インターネットの飛躍的な発展に従って我々の生活の各側面に変わっている.例えば,我々はインターネット経由で便利に情報を得て送ることができる.しかしながら,ウェブ中の情報爆発で,自動的にウェブのアーティクルから重要な文を抽出する手段を開発することは極めて重大な課題である.本論文では,統計的な情報と文章構造的な情報を総合的に利用した新しい方法を提案する.実験結果は,本論文で提案された手法の有効性を証明した.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/ICSMC.2001.973531
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-0035720436
(DOI: 10.1109/ICSMC.2001.973531, Elsevier: Scopus) Minoru Sasaki and Kenji Kita :
Information Retrieval System Using Concept Projection based on PDDP Algorithm,
Proceedings of PACLING2001 (Pacific Association for Computational Linguistics 2001), 243-249, Fukuoka, Oct. 2001.- (要約)
- ベクトル空間情報検索モデルでは,文書は高次元かつスパースなベクトルにより表現される.本論文では,ベクトル空間モデルの次元圧縮法として,PDDPアルゴリズムにより得られる概念ベクトルを用いた次元圧縮法を提案した.
Dimensionality reduction of vector space model based on Simple PCA,
Proc. Knowledge-Based Intelligent Information Engineering Systems & Allied Technologies (KES), Vol.2, 362-366, Osaka, Sep. 2001.- (要約)
- ベクトル空間モデル(VSM)は情報検索における代表的な検索モデルである.同モデルでは文書が単語の出現頻度に基づくベクトルで表現されるため,そのベクトル空間は一般にスパースかつ高次元となりメモリや検索時間の増大を招くとともに,文書中に含まれる無意味な単語がノイズ的な影響を及ぼし検索精度を低下させるという問題を生じる.これに対し特異値分解(SVD)を用い次元数を削減した空間で類似度を計算する潜在的意味インデキシング(Latent Semantic Indexing; LSI)が提案され,その効果が報告されている.本稿ではSVDに比べより少ない演算量で近似的に主成分分析を行うことが可能なSimple Principal Component Analysis(SPCA)を次元削減に適用する.
Dimensionality Reduction of Vector Space Information Retrieval Model based on Non-negative Matrix Factorization,
Proc. Knowledge-Based Intelligent Information Engineering Systems & Allied Technologies (KES), 367-371, Osaka, Sep. 2001.- (要約)
- 本論文では,Non-negative Matrix Factorization (NMF)を用いた,ベクトル空間情報検索モデルの次元削減手法を提案した.NMFは非負行列を2つの非負行列へ分解を行う手法である.提案手法は,NMFを用い非負行列である索引語文書行列を分解し,その一方の行列へ索引語文書行列を射影することにより,次元削減を行う手法である.
Relevance Feedback with Support Vector Machine for Information Retrieval,
Proceedings of International Conference on Computer Processing of Oriental Languages (ICCPOL), 35-40, Seoul, May 2001.- (要約)
- 本論文では,ベクトル空間情報検索モデルを用いた全文検索精度の向上を目指した.本論文では,サポートベクターマシンを用いた適合性フィードバック手法を提案した.提案手法は,利用者からの適合·不適合の情報をもとにサポートベクターマシンを学習させ,利用者が要求する検索文書を識別し,不適合文書を利用者に提示しない手法である.日本語全文検索テストコレクションを用い,提案手法の有効性を検証する実験を行い,提案手法が全文検索に有効であることを示した.
Vector Space Information Retrieval Using Concept Projection,
Proceedings of the 19th International Conference on Computer Processing of Oriental Languages, 73-76, Seoul, May 2001.- (要約)
- ベクトル空間モデルに基づく情報検索では,文書ベクトルが高次元かつスパースとなるため,検索時間の増大や必要とするメモリ容量の増大という問題が生じる.本論文では,ベクトル空間モデルの次元圧縮法として,コンセプト·プロジェクション(concept projection)と呼ぶ新しい手法を提案した.コンセプト·プロジェクションでは,文書集合をクラスタリングし,各クラスタのセントロイドを文書ベクトル表現のための基底として用いることにより,次元圧縮と同時に意味概念に基づいた文書検索を実現できるという特徴がある.
以媒体概念作為基礎的多媒体教育課程的考察(以 CD-ROM 為基礎的教育),
Proceedings of the Second International Conference on New Technologies in Teaching and Learning Chinese, 147-151, Guilin, China, 2000年12月. Yasuhito Tanaka, Takashi Hirai, 北 研二 :
以媒体概念作為基礎的多媒体教育課程的考察(以 CD-ROM 為基礎的教育),
Proceedings of the Second International Conference on New Technologies in Teaching and Learning Chinese, 147-151, Guilin, 2000年12月. Satoru Tsuge, Toshiaki Fukada and Kenji Kita :
Frame-Period Adaptation for Speaking Rate Robust Speech Recognition,
Proceedings of the 6th International Conference on Spoken Language Processing, 718-721, Beijing, Oct. 2000.- (要約)
- 音声認識システムにおいて,発声ごとの発話速度の変動は認識精度の変動につながる原因の一つである.発話速度が平均の発話速度より遅い場合と速い場合が認識精度が低下することが知られている.そこで,本論文では発話速度が変動しても変動の少ない特徴量抽出手法である,フレーム周期正規化手法を提案した.提案手法の有効性を検証するため,自然発話音声データベースを用いた音声認識実験を行った.提案手法では,発話速度の遅い発声の認識精度を向上させることが可能であった.
Improvement of Vector Space Information Retrieval Model based on Supervised Learning,
Proceedings of the Fifth International Workshop on Information Retrieval with Asian Languages, 69-74, Hong Kong, Sep. 2000.- (要約)
- ユーザによる検索結果の適合性判断をベクトル空間モデルに基づく情報検索システムに反映させ,検索システムの精度を改善する方法について述べた.
Vector Space Information Retrieval Model Using Supervised Learning,
7th Joint International Computer Conference, 442-448, China, 2000.- (要約)
- 本論文では,少数の検索質問に対し,どの文書が検索結果として正解であるかという情報を用いて,ベクトル空間モデルに基づく情報検索の精度を改善する手法を提案した.
Multilingual Parallel Corpus of Major East Asian Languages,
Proceedings of the MAL'99 (Multi-lingual Information Processing and Asian Language Processing), 125-134, Beijing, Nov. 1999.- (要約)
- 主要な東アジア系言語である日本語,中国語,韓国語と英語から成る多言語パラレルコーパスの開発について述べた.我々の開発した多言語コーパスは,多言語に対する同じ内容の文が収録されているばかりではなく,言語間での文の対応付けがなされており,コンピュータ処理が容易になっているという利点を持っている.
JCKE Multilingual Corpus of Major Asian Languages,
Proceedings of the Fifth International Congress on Terminology and Knowledge Engineering, 660-670, Innsbruck, Aug. 1999.- (要約)
- アジア系言語の多言語処理応用システムのための基礎データとなるJCKE多言語コーパスの構築について述べた.JCKEコーパスは,日本語,中国語,韓国語,英語のパラレル·コーパスであり,同一内容の文をこれら4ヶ国語で記述している.論文では,言語データの収集方法,コーパスの構成等について説明している.
Automatically Compiling Multilingual Translations from the World Wide Web,
Proceedings of the International Conference on Machine Translation and Computer Language Information Processing, 516-521, Beijing, Jun. 1999.- (要約)
- World Wide Web上には,膨大なテキスト情報が蓄積されており,同一の内容を複数の言語で提供しているページも数多く存在する.本論文では,WWW上の対訳ページを自動的に見つけ,対訳コーパスを自動的に構築する方法について論じた.
A Character-Based Japanese Word Segmenter Using PPM*-Based Langauge Model,
Proceedings of the 18th International Conference on Computer Processing of Oriental Languages, 527-532, Tokushima, Mar. 1999.- (要約)
- 日本語や中国語のように単語間に切れ目のない言語に適した単語分割手法を提案した.提案した手法では,Nグラムモデルおよび確率·統計的テキスト圧縮法の1つであるPPM*を自然言語の文字連鎖の確率モデルとして用いることにより,単語分割を高精度で行う.
Modern Japanese Processing Problems --- Problems of "Kata-Kana" Appeared in Loan Words ---,
Proceedings of the 18th International Conference on Computer Processing of Oriental Languages, 305-308, Tokushima, Mar. 1999.- (要約)
- 日本の近代文を計算機処理する上での問題点,特に欧米語からの借用語に現れるカタカナ表記の問題について論じた.
JCKE Multilingual Corpus of Major Asian Languages,
Proceedings of the First ASIALEX Regional Symposium, 296-305, Guangzhou, Jan. 1999.- (要約)
- 主要なアジア系言語である日本語,中国語,韓国語と英語から成る多言語コーパスの開発について述べた.我々の開発した多言語コーパスは,多言語に対する同じ内容の文が収録されているばかりではなく,言語間での文の対応付けがなされており,コンピュータ処理が容易になっているという利点を持っている.
Automatic Text Categorization based on Hierarchical Rules,
Proceedings of IIZUKA'98, 935-938, Fukuoka, Oct. 1998.- (要約)
- 本論文では,規則学習アルゴリズムに基づく,文書の自動分類の手法を提案した.
Rule-Based Text Categorization Using Hierarchical Categories,
Proceedings of the 1998 IEEE International Conference on Systems, Man and Cybernetics, 2827-2830, San Diego, Oct. 1998.- (要約)
- 本論文では,規則学習アルゴリズムであるRIPPERを用いて,文書の自動分類を行う問題を取り上げた.このために,元々のRIPPERアルゴリズムが作成する規則に加え,階層的な規則を自動的に作成するようにRIPPERアルゴリズムを拡張した.
Rule-Based Hierarchical Document Categorization for the World Wide Web,
Web Technologies and Applications: Proceedings of Asia Pacific Web Conference (APWeb98), 269-273, Beijing, Sep. 1998.- (要約)
- 文書分類は,World Wide Webの爆発的な進展にともない,重要な課題となってきている.本論文では,規則学習アルゴリズムに基づき,文書集合を階層的に分類するための効率的なアルゴリズムを提案した.実際のWorld Wide Web上のデータを用いた実験により,提案したアルゴリズムの有効性を示した.
Machine-Readable Dictionary Headwords,
Proceedings of the 12th Pacific Asia Conference on Language, Information and Computation, 310-315, Singapore, Feb. 1998.- (要約)
- 機械翻訳をはじめとする自然言語処理応用システムでは,機械可読辞書の使用が不可欠であり,機械可読辞書の整備が重要な問題となっている.本論文では,機械可読辞書の見出し語の収集,選別,情報付与について述べた.
基於概率模型的語言的集類方法: 根据多語種語料庫進行語言系統樹的再構造,
JSCL-97, 109-114, Beijing, 1997年8月. Kenji Kita, Yoshikazu Fukui, Masaaki Nagata and Tsuyoshi Morimoto :
Automatic Acquisition of Probabilistic Dialogue Models,
International Conference on Spoken Language Processing, 196-199, Oct. 1996. Kenji Kita, Yoshikazu Fukui, Masaaki Nagata and Tsuyoshi Morimoto :
Dialogue Knowledge Acquisition from Annotated Corpora,
IEEE International Conference on Systems, Man and Cybernetics, 556-561, Beijing, Oct. 1996.- (要約)
- 話者と発話タイプの付けられたコーパスから,エルゴード的隠れマルコフモデル(HMM)および確率オートマトン学習アルゴリズムであるALERGIAアルゴリズムを用いて,発話タイプ系列を確率的にモデル化する手法について述べた.
Improvement of a Probabilistic CFG Using a Cluter-Based Language Modeling Technique,
4th International Conference on Soft Computing, 929-932, Oct. 1996.- (要約)
- 学習データを幾つかのクラスタに分割し,各クラスタから学習した確率文脈自由文法を 組み合わせることにより,場面·状況依存の言語モデルを構築することについて述べた.
Automatic Acquisition of Probabilistic Dialogue Models,
4th International Conference on Soft Computing, 925-928, Oct. 1996.- (要約)
- コーパスに基づく確率的言語モデルとしては,従来は主に語彙統語論的なモデルが扱われてきており,より高次の言語情報である対話に対するモデルはなかった.本論文では,陳述·命令·約束などの発話行為タイプが付与された対話コーパスから,エルゴードHMMおよび状態マージング手法に基づいた学習アルゴリズムを用いて,対話の確率的言語モデルを自動的に生成する手法を提案した.
Probabilistic Language Modeling Based on Mixture Probabilistic Context-Free Grammar,
ROCLING VIII, 127-136, Taipei, Aug. 1995.- (要約)
- 自然言語の確率·統計的モデルとして,混合確率文脈自由文法という新しい言語モデルを提案した.混合確率文脈自由文法では,学習データを幾つかのクラスタに分割し,各クラスタから学習した確率文脈自由文法を組み合わせることにより,場面·状況依存の言語現象を取り扱うことができるという利点がある.
Error Correction of Speech Recognition Outputs Using Generalized LR Parsing and Confusion Matrix,
ROCLING VIII, 101-110, Taipei, Jul. 1995.- (要約)
- 一般化 LR 構文解析法と音素認識結果の混同行列を用いて,音声認識結果の誤り訂正を行う手法について述べた.
VOICEDIC: A Practical Application of Speech Recognition Technology,
Sixth International Conference on Human-Computer Interaction, 535-540, Yokohama, Japan, Jul. 1995.- (要約)
- 音声認識技術の現実的な応用として音声による辞書検索システム VOICEDIC について述べるとともに,VOICEDICの概要と利点を示した.
Continuous Speech Recognition Based on LR-Parser-Driven One-Pass Search Algorithm and Hidden Markov Modeling of Speech: Towards Real-Time Intelligent Human-Computer Interaction by Voice,
SPICIS '94, B347-B352, Singapore, Nov. 1994.- (要約)
- 文脈自由文法に基づく構文的制約を用いて,効率的に連続音声認識を行う手法として,LR パーザ制御の One-Pass 型探索アルゴリズムと隠れマルコフモデル(HMM)を用いた連続音声認識について述べた.日本語の実験的な音声認識システムを試作し,提案した音声認識手法と他の手法の比較を行った.
One-Pass Continuous Speech Recognition Directed by Generalized LR Parsing,
1994 International Conference on Spoken Language Processing, 13-16, Yokohama, Sep. 1994.- (要約)
- 言語の統語的制約に基づき,効率的に連続音声認識を行う手法として,一般化 LR パーザ制御による One-Pass 型連続音声認識アルゴリズムの提案を行った.従来,言語制約に基づく連続音声認識では,有限オートマトン制御のものが主流であったが,一般化 LRパーザ制御を用いることにより,文脈自由文法レベルでの構文制約まで扱うことを可能とした.
Application of Corpora in Second Language Learning, --- The Problem of Collocational Knowledge Acquisition ---,
Second Annual Work Shop on Very Large Corpora, 43-56, Kyoto, Aug. 1994.- (要約)
- 第二外国語学習は,コーパスに基づく自然言語処理の応用として有望な分野であると考えられる.本論文では,第二外国語学習の際に有用な連語表現(コロケーション)をコーパスから自動的に収集する手法として,相互情報量に基づく手法と仕事量基準に基づく手法の2つについて論じた.
An Unknown Word Model for Unrestricted Japanese Texts Based on Generalized Mutual Information Statistics of Characters,
Neural Nets and Soft Computing, 217-218, Iizuka. Japan, Aug. 1994.- (要約)
- 自然言語処理や音声処理等においては,辞書にない単語(未知語)をどのように扱うかという問題が発生する.本論文では,文字の一般化相互情報量統計に基づいた未知語の確率·統計的モデルを提案した.
Natural Language Speech Recognition Using Finite-State Approximation for Context-Free Grammars,
Neural Nets and Soft Computing, 537-538, Iizuka. Japan, Aug. 1994.- (要約)
- 文脈自由文法を有限状態オートマトンで近似したLR状態遷移表を用いた連続音声認識手法を提案した.また,前向き探索を有限オートマトン制御で行い,後ろ向き探索を文脈自由文法制御で行う連続音声認識手法の提案も行った.
CFG-Based One Stage Dynamic Programming Algorithm for Connected Word Recognition,
Neural Nets and Soft Computing, 535-536, Iizuka. Japan, Aug. 1994.- (要約)
- 文脈自由文法制御の動的計画法に基づき連続単語認識を行うアルゴリズムを提案した.提案したアルゴリズムにより,与えられた音声信号の中から最適な認識仮説を効率的に見つけることが可能となる.
Automatically Extracting Collocations from Corpora for Language Learning,
International Conference on Teaching and Language Corpora, 53-64, Lancaster, U.K., Apr. 1994.- (要約)
- 大規模言語データであるコーパスから,言語学習にとり有用な連語表現(コロケーション)の自動獲得の問題を取り上げ,(1)言語学習における連語表現の重要性,(2)コーパスから連語表現を抽出するための尺度,(3)それぞれの尺度の特徴,などについて論じた.
Corpus-based Language Learning: Towards Prctical Language Learning Systems,
ICCE '93, 355-357, Taipei, Dec. 1993.- (要約)
- 新しい言語学習のパラダイムである「コーパスに基づいた言語学習」を提案した.コーパスに基づいた言語学習は,既存のAIに基づいた方法の欠点であるドメインの狭さなどを,ある程度,解消できるため,有用かつ現実的な言語学習システムを構築できる.最初のステップとして,大規模言語データであるコーパスからの知識獲得について述べた.
A Spoken Language Translation System: ASURA,
13th International Joint Conference on Artificial Intelligence, 1705, Chambery, France, Aug. 1993.- (要約)
- 日本語音声を英語またはドイツ語に翻訳することのできる音声翻訳実験システムASURAについて紹介した.
ATREUS: A Speech Recognition Front-end for a Speech Translation System,
Eurospcch'93, 1287-1290, Berlin, Germany, 1993.- (要約)
- ATR自動翻訳電話研究所で研究開発した日本語·英語の音声翻訳実験システムの音声認識部ATREUSについて述べた.音声認識アルゴリズムには,環境依存音素モデル,拡張LRパーザ,話者/環境適応のためのベクトル場平滑化を用いたSSS-LR/VFSというアルゴリズムを用いている.
Continuously Spoken Sentence Recognition by HMM-LR,
International Conference on Spoken Language Processing, 305-308, Oct. 1992.- (要約)
- HMM-LR 音声認識システムを拡張し,発声方式に制限のない連続発声の文認識が扱えるようにした.拡張点は,(1)HMMの学習を単語発声データだけではなく連続発声データも用いた点,(2)文に対する文法を開発した点,(3)確率的な言語モデルを導入した点である.確率的言語モデルとして,文脈依存の言語現象を扱うために有効なモデルとして,生成規則の bigram モデルを提案し,このモデルが確率文脈自由文法よりも優れていることを示した.
Continuous Mixture HMM-LR Using the A* Algorithm for Continuous Speech Recognition,
International Conference on Spoken Language Processing, 301-304, Oct. 1992.- (要約)
- 本論文では,HMM-LR音声認識システムに混合型HMMを採用したシステムについて述べた.また,A* アルゴリズムとハイブリッド最良優先探索を用いた2種類の探索方式について提案し,従来のビームサーチ法を用いた手法と比較した.A*アルゴリズムに基づく探索を用いることにより,認識性能をほとんど劣化させずに,音声認識の大幅な高速化を達成することができた.
Hardware Implementation of Realtime 1000-Word HMM-LR Continuous Speech Recognition,
International Conference on Spoken Language Processing, 237-240, Oct. 1992.- (要約)
- 音声認識と言語解析を統合したHMM-LR音声認識アルゴリズムのハードウエア化について述べた.ハードウエア化することにより,文の長さによらず,発声終了から2∼3秒程度の遅れという,ほぼリアルタイムで日本語の音声認識を行なうことが可能になった.
Poneme-Context-Dependent LR Parsing Algorithms for HMM-Based Continuous Speech Recognition,
Second European Conference on Speech Communication and Technology, 1397-1400, Sep. 1991.- (要約)
- 連続音声認識が困難である原因の一つに,連続音声では様々な音韻環境の要因により 音韻パターンの変形, 変動が生じることがあげられる.このような,音韻変形を扱うために,音韻環境に依存した解析を行なう ことのできる LR 解析アルゴリズムを提案した.
Linguistic Constraints for Continuous Speech Recognition in Goal-Directed Dialogue,
IEEE International Conference on Acoustics, Speech and Signal Processing, 801-804, Toronto, Canada, May 1991.- (要約)
- 連続音声認識における言語モデルの適用について,認識精度を向上させるためには,いかなる種類の言語的制約が有効であるかについて論じた.日本語の対話データベースに基づき話し言葉のための構文規則を作成し,この規則を用いて様々な条件のもとで行なった文発声の音声認識実験の結果を 考察した.
Incorporating LR Parsing into Sphinx,
IEEE International Conference on Acoustics, Speech and Signal Processing, 269-272, Toronto, May 1991.- (要約)
- カーネギーメロン大学で開発された英語の連続音声認識システム Sphinx に, LR 構文解析法に基づく言語解析部を組み入れた研究について述べた.
Processing Unknown Words in Continuous Speech Recognition,
International Workshop on Parsing Technologies, 136-142, Cancun, Mexico, Feb. 1991.- (要約)
- 音声認識における未知語処理方法として, タスクを記述する通常の文法と,音韻間の制約を記述した文法の 2 つを 用いることにより,未知語の部分を音韻のつながりとして認識する 方法を提案した.
Continuous Speech Recognition Using Two-Level LR Parsing,
International Conference on Spoken Language Processing, 905-908, Kobe, Japan, Nov. 1990.- (要約)
- 日本語の音声認識に適した方法として,文節内および文節間の 2 つのレベルの文法を段階的に用いる 2 段階 LR 解析法を提案し,評価実験を行なった.
HMM Continuous Speech Recognition Using Stochastic Language Models,
IEEE International Conference on Acoustics, Speech and Signal Processing, 581-584, Albuquerque, Apr. 1990.- (要約)
- 言語的な尤度を計算するのに有効な確率的言語モデルとして, 日本語音節の連鎖統計情報,確率文脈自由文法,文脈自由文法の生成規則の連鎖統計情報 の 3 つのモデルを音声認識に適用し,各モデルの有効性を示した.
ATR HMM-LR Continuous Speech Recognition System,
IEEE International Conference on Acoustics, Speech and Signal Processing, 53-56, Albuquerque, Apr. 1990.- (要約)
- HMM 音韻認識と拡張 LR 構文解析法を統合化した HMM-LR 連続音声認識システムの改良について述べた.音韻認識において,複数コードブックの使用,HMMの継続時間長制御,ファジィベクトル量子化を行うことにより,精度の改善を行った.
Parsing Continuous Speech by HMM-LR Method,
International Workshop on Parsing Technologies, 126-131, Pittsburgh, Aug. 1989.- (要約)
- 隠れマルコフモデル(HMM)と LR 構文解析法を融合した新しい音声認識手法(HMM-LR 法) について述べた.
HMM Continuous Speech Recognition Using Predictive LR Parsing,
IEEE International Conference on Acoustics, Speech and Signal Processing, 703-706, Glasgow, England, May 1989.- (要約)
- 拡張 LR 構文解析法を音韻予測に用い,予測された音韻照合を HMM (Hidden Markov Model) により行う連続音声認識手法を提案した.
Speech Recognition Research at ATR,
The Second Symposium on Advanced Man-Machine Interface through Spoken Language, Hawaii, Nov. 1988.- (要約)
- ATR自動翻訳電話研究所における音声認識活動について概略を述べた.特に,隠れマルコフモデル(HMM)に基づく音韻モデルの精緻化を行い,LR予測パーザと組み合わせることにより,日本語の音節認識に適用することに成功した.
<シンポジウム>リキッドバイオプシーによる食道扁平上皮癌の診断~AI を用いたmicroRNA 診断モデルの構築~.,
第31回日本がん予防学会総会(日本がん予防学会学術大会2024徳島), 2024年9月. 宇田 陽斗, 松本 和幸, 吉田 稔, 北 研二 :
テキストデータ拡張による感情分類精度向上の検討,
第37回人工知能学会全国大会講演論文集, 1-4, 2023年6月.- (要約)
- Recently, SNSs have facilitated the collection of a wide variety of text data. However, SNS text data has problems such as short sentences with abbreviations and colloquial expressions, which make labeling difficult, and the difficulty of collecting a large amount of data in a short period of time. To solve this problem, data expansion is an effective method for efficiently preparing large-scale, high-quality labeled text data for machine learning. In this research, we aim to improve the learning accuracy of sentiment classification by extending the data to Japanese texts. EDA (Easy Data Augmentation) was used as the data expansion method. In particular, the use of various models for text manipulation in the EDA increased the range of data expansion. The expanded text generated by data expansion was evaluated based on the semantic similarity and the degree of textual change. The optimal data for training was selected by determining a threshold value. The WRIME corpus was used as the dataset to ensure the reliability of the labels. In this presentation, we report the results of learning accuracy in sentiment classification using data expansion.
- (キーワード)
- データ拡張 / easy data augmentation / sentiment analysis
コロナ禍前後におけるTwitterユーザの性格別感情変化の分析,
言語処理学会 第29回年次大会 発表論文集, 2365-2369, 2023年3月.- (要約)
- 2019 年末から始まったコロナ禍も 3 年が経過し,徐々に行動制限が緩和され,日々,状況は変化しつつある.現在も,生活様式の劇的な変化に伴い心身へのストレスなど人々に大きな影響を与え続けている.本研究は,コロナ禍前後での Twitter 上での発言内容から感情分析を行い,特徴的な表現を抽出して比較分析することにより,人々の発言,思考,行動に起きた変化を分析する.また,ユーザの性格タイプ別での感情の変動について考察する.
- (キーワード)
- ソーシャルメディア / 感情推定 / コロナ禍 / MBTI
音声対話ロボットを用いた健康維持支援システムの開発,
HAI シンポジウム2023 講演論文集, 2023年3月.- (要約)
- 生活習慣病は医療費全体の3 割,死亡者の6 割を占めている.よい生活習慣を送ることが健康を守るうえで重要である.また,近年音声で入力できるサービスや機器が増えてきている.音声認識を使えば,より手軽に計算機を扱えるようになる.本研究では,対話ロボットとの対話内容を分析して生活習慣などを提示するWeb アプリケーションを用いて,生活習慣の改善を助けるシステムを開発する.開発したシステムを用いて実際に生活習慣を収集し,生活習慣の分析とシステムの評価を行った.
- (キーワード)
- 健康維持支援システム / 音声対話ロボット / 生活習慣
登場人物の感情の動きを考慮した物語におけるハイライト文抽出,
HCGシンポジウム2022発表予稿集, C2-7, 2022年12月.- (要約)
- 本研究では,小説における登場人物の感情の大きさや変化を数値化することによる重要文の抽出要約手法を提案する.研究対象として青空文庫から5作品の小説を選び,それぞれの小説に提案手法による自動要約を行った.評価に関しては,人手で抽出した登場人物の感情が大きく表れている個所を正解データとし,上位 10 文における適合率と平均適合率を用いて評価を行った.
- (キーワード)
- 自然言語処理 (natural language processing) / 抽出型要約 / 感情 (emotion)
インタビュー対話に基づく個性を反映した対話モデルの構築,
令和4年度 電気・電子・情報関係学会 四国支部連合大会講演論文集, 139, 2022年9月.- (要約)
- 人間が AI とより親しみのあるコミュニケーションをするための要素の一つとして「個性」が挙げられる.AI に必要とされる個性は場面や状況に応じて異なるので,対話する相手に応じて個性を切り替えられるような仕組みが求められる.本研究では,日本語Transformer encoder-decoder対話モデルを使用し,インタビュー対話において異なる個性を持つ対話データごとにファインチューニングすることで対話モデルの個性に違いや特徴が出るかどうかを評価することを目的とする.
- (キーワード)
- 対話システム / 対話モデル / インタビュー対話
感情辞書を用いた物語のハイライト抽出,
第19回テキストアナリティクス・シンポジウム, 2022年9月. 網谷 嶺志, 松本 和幸, 吉田 稔, 北 研二 :
流行要因分析のための投稿テキスト・リプライ・画像からの感性分析及び可視化,
第21回情報科学技術フォーラム講演論文集(ハイブリッド開催), Vol.2, 63-68, 2022年9月.- (要約)
- 本研究ではTwitter上で起こるバズ現象について,ツイート及び添付された画像,ツイートに対して寄せられたリプライの感性を分析することにより探る.Twitter に投稿されるテキストの文字数には制限があるが,テキストのみで表現することが難しい情報には画像を添付することで視覚的に伝えやすくなる.また,バズ現象を分析するという観点からも,画像付きのツイートはテキストのみのツイートよりも分析に使える情報量が増えるため,より詳細な分析が可能になると考えられる.ツイートの事後情報であるリプライテキストも分析に用いることができる.リプライは,ツイート投稿後に,そのツイートに対する反応として投稿されるものであるため,具体的なバズ現象の要因分析につながると考えた.本研究では,画像付きツイートについて,ツイートテキスト,画像,リプライテキストからそれぞれ抽出した感性情報を分析することで,バズ現象の要因分析を検討する.
- (キーワード)
- buzz factor / information diffusion / Twitter / affective analysis
コメントデータと歌詞に基づく楽曲動画検索システム,
2022年度 人工知能学会全国大会講演論文集, 4O1-GS-4-05, 2022年6月.- (要約)
- 現在,YouTubeに代表される動画共有サービスが多くの人に利用されている.これらのサービスでは,キーワード検索が主流となっている.キーワード検索の場合,適切な単語を用いなければ,ユーザの興味に合った動画を探し出すことは困難である.そこで本研究では,YouTube上の音楽動画に対して視聴者がつけたコメントデータと歌詞を解析することで,印象の似た音楽動画を検索する手法を提案する.提案手法では,コメントと歌詞をWord2Vecによりベクトル化し,Fuzzy c-meansによるクラスタリングにより,印象の類似した音楽動画を検索する.平均相互順位(MRR)スコアによると,上位3曲の中で同じ印象を持つ音楽ビデオが出力されていることが明らかになった.
- (キーワード)
- 楽曲動画 / word2vec / ファジィクラスタリング
多変量解析と機械学習を用いたカラーイメージスケールの再構成に関する一検討,
第17回日本感性工学会春季大会, 35-38, 2022年3月.- (キーワード)
- カラーイメージスケール / 機械学習 (machine learning) / 多変量解析 / 次元削減
SNS の投稿内容に基づく生活習慣病発症リスクの分析,
言語処理学会 第28回年次大会 発表論文集, 1946-1950, 2022年3月.- (要約)
- 国内における死亡原因は,がん・循環器疾患・糖尿病などで全体の約 6 割を占めている.これらの病気はいずれも食事・運動・睡眠などの生活習慣と深い関りがあり,生活習慣病と呼ばれている.生活習慣病には自覚症状がほとんどないため,病気の悪化に気づきにくいという特徴がある.本研究では,より簡易的に生活習慣病を予防するシステムの構築を目指し,ソーシャル・ネットワーキング・サービス(SNS)を用いて,ユーザの投稿内容から食事・運動・体調・精神状態に関するツイートの分析を行った.調査の結果,本研究の成果がユーザの投稿内容から生活習慣病発症の危険因子を検出するシステムの構築につながることが分かった.
- (キーワード)
- ソーシャルネットワーク / 生活習慣病 (lifestyle-related disease) / SNS / BERT / 潜在的ディリクレ配分法
登場人物の感情表現文の抽出による物語のハイライト生成,
電子情報通信学会2022年総合大会 情報・システムソサイエティ特別企画 ジュニア&学生ポスターセッション予稿集, 2022年3月.- (要約)
- 電子書籍の普及により数多くの文学作品をインターネット上で読むことが可能になった.しかし,読者がそれらの中 から読む作品を選ぶことは容易ではない.本稿では物語について登場人物の感情が表現されている文を抽出することによる指示的要約の手法を提案する.
- (キーワード)
- 感情表現 / ハイライト生成 / 物語 / 自動要約 (automatic abstracting)
BERTを用いたSNS上における攻撃的文章訂正システム,
情報処理学会第84回全国大会講演論文集, 2022年3月.- (要約)
- 現代社会において SNS の発展は凄まじく,ほとんどの人が使用しているという状況に置かれている.それに伴い,誹謗中傷や炎上などの被害にあう件数も増加している.2020 年には,某テレビ番組における出演者の行動や言動に対して,Twitter 上で誹謗中傷が多数投稿されたことから,自殺に追い込んでしまうといった事件が起きている.本研究では,SNS ユーザが発言を投稿する前に,投稿文の攻撃性を判定し,攻撃性を緩和した文章に変換して提示するシステムの構築を目指す.
- (キーワード)
- 自然言語処理 (natural language processing) / BERT / Social Networking Site / 有害表現 / toxic expressions
投稿文および画像といいね数との関係に基づく流行要因分析,
HCG シンポジウム2021, 2021年12月.- (要約)
- 本研究ではソーシャルメディアの動向を調査し,Twitterでのバズ現象を支える要因を探るための分析手法を提案することを目的とする.Twitterに投稿されたテキスト内容だけではバズ現象の原因を特定できない場合があるため,画像が添付されたツイートに限定し,テキストと画像のそれぞれの特徴に関連性があるかどうか,また,これらの特徴の関連性が,人気の指標である「いいね」や拡散の規模を表す「RT」の数とどのように関連するかを調べた.画像とテキストから抽出した特徴量を入力とし,いいね数とRT数を出力した後,2つの入力(画像とテキスト)から同じ次元数の特徴ベクトルを中間層から抽出するためにマルチタスク学習型のニューラルネットワークを学習する.これらの特徴ベクトル間の距離といいね数との関係を分析した結果,BERTによる分散表現とInceptionResNetV2の特徴量がいいね数とRT数を予測する要因となり得ることがわかった.
- (キーワード)
- Multi-task learning / Buzz classification / Social media / Trend analysis
AI技術を用いたパノラマ歯科X線画像診断支援システムの開発,
歯科放射線61巻増刊号(第2回秋季学術大会), Vol.61, 31, 2021年10月.- (キーワード)
- 人工知能 (artificial intelligence) / パノラマX線画像 / 診断支援 / 歯科診断支援
闘病ブログコーパスからの生活習慣の抽出,
令和3年度 電気・電子・情報関係学会 四国支部連合大会 講演論文集, 187, 2021年9月.- (要約)
- 闘病ブログは,患者の生活に関する行動情報(病状・食事・運動)について書かれているものがあり,疾患への理解や納得を得られるものも見られ,同病者の励 みとなっている.闘病ブログコーパスとは,闘病ブログを収集し,記事のタグ付けを行ったものである.本研究では年々増加傾向にある2 型糖尿病患者による闘病ブログコーパスから,闘病活動に関わる生活習慣の分析を行う.この分析結果より,病状悪化の危険因子や病状改善の手がかりとなる要素を,非医療従事者が自然言語処理および機械学習手法を用いて発見し,闘病者や糖尿病予備軍の人々に助言できるシステムの構築を目指す.
- (キーワード)
- 闘病ブログ / 生活習慣分析 / 生活習慣病 (lifestyle-related disease) / 2型糖尿病 / テキストマイニング (text mining)
深層ニューラルネットワークを用いた歯科インプラントの同定,
令和3年度電気・電子・情報関係学会四国支部連合大会, 14-4, 2021年9月.- (キーワード)
- インプラント (implant) / 深層学習 (deep learning) / 人工知能 (artificial intelligence)
発言内容と画像に基づくバズツイート分類,
JSKE 第23回日本感性工学会講演論文集, 1-5, 2021年9月.- (要約)
- As the information diffusion on social networking sites has become more common, content buzzes have become a frequent occurrence on the Internet via social networking sites. In marketing, it is important to know what is trending, and it is necessary to have a means of quickly detecting buzz on SNS. In this study, we define buzz tweets based on the number of likes and RTs on a tweet, and analyze the content of the tweets to obtain the characteristics unique to buzz tweets, so that we can predict buzz tweets in advance. In this study, we propose a classification method to predict whether a tweet is a buzz tweet or not, based on the statement of the tweet and the attached image. The results of the classification experiments show that the classification accuracy is higher when the statement of the tweet and the image are used as features than when only the content of the tweet and the image are used as features, indicating the effectiveness of the proposed method.
- (キーワード)
- buzz tweet / information diffusion / multitask learning / social networking site
感情分類を用いた単語分散表現からの感性情報抽出,
第20回情報科学技術フォーラム(FIT2021)講演論文集, Vol.2, 41-46, 2021年8月.- (要約)
- 近年,自然言語処理の分野では単語の一般的ではない用法の検出など,単語分散表現から意味推定を行う技術が研究されている.それらの研究では分散表現全体から単語の情報を抽出しており,感性以外の情報が多く含まれている.本研究では感性情報のみを抽出することでその精度上昇を目指す.その手法として単語分散表現から感情分類を行うニューラルネットワークを作成し,ネットワークが学習した重みから感性情報が強く表れている次元の情報を抽出する.評価方法としては,コサイン類似度を用いて抽出次元同士が類似した単語の比較を行う.
- (キーワード)
- emotional information / distributed representation / neural networks
Facts analysis of food tweets,
情報処理学会 第83回全国大会, Mar. 2021. 喜島 涼太, 松本 和幸, 吉田 稔, 北 研二 :
MBTI性格推定モデルの構築における感性情報の有効性,
日本感性工学会春季大会(JSAEE2021)講演論文集, 1-6, 2021年3月.- (要約)
- 本研究は性格推定システムの精度向上を図るため分類モデルの学習時の特徴量としてツイート文から抽出した文ベクトルだけではなく,ツイート文から推定した感性情報も特徴量として利用する.ツイート文から感情推定モデルをもとに感性情報ベクトルを取得し新たな特徴として用いることを試みる.性格推定において,ツイート文から抽出した文ベクトルを用いて性格推定モデルを学習させた場合と,文ベクトルと感性情報ベクトルを複合させたものを特徴量として学習させた場合の結果を比較分析し,Bag of WordsとSVDに基づく従来手法と比較し,性格推定モデルの構築の際に感性情報が有効であることを明らかにした.
- (キーワード)
- MBTI / ツイッター / 感情 (emotion)
AI-based ESCC miRNA diagnosis model: retro-prospective multinational cohort study.,
第74回日本食道学会学術集会, 2020年12月. 原 和樹, 鳥井 浩平, 松本 和幸, 吉田 稔, 西村 良太, 鶴木 次郎, 小林 健一郎, 北 研二 :
Mask R-CNNを用いたパントモ画像からの 歯牙検出及びセグメンテーション,
令和2年度電気・電子・情報関係学会四国支部連合大会, No.15-9, 2020年9月.- (要約)
- 歯科診断における日本の診断項目数は海外と比べてかなり多く,歯科医師が 1 から歯式を書くこ とは手間がかかるため,歯科医師の診断負担軽減 が必要である.診断,歯の健康状態の把握,治療 計画の立案にはまずパントモ画像の解釈が不可欠 であることから,パントモ画像の処理は自動化の 重要な課題である. 本研究では自動でパントモ画像から歯牙検出・ セグメンテーションを行う.本稿では,その方法 について述べる.
- (キーワード)
- 医用画像 (medical image) / 深層学習 (deep learning)
深層学習を用いたコミックの分析に関する研究,
令和2年度電気・電子・情報関係学会四国支部連合大会 講演論文集, Vol.15-7, 1, 2020年9月.- (要約)
- 日本のサブカルチャーである漫画の楽しみ方が近年変化している.市場の売り上げ推移を見ると 紙の書籍ではなく電子端末で閲覧する電子書籍が 普及しつつあることがわかる.しかしスマートフ ォンを始めとする画面の小さい端末では携帯性が 高く扱いやすい反面,通常文庫判∼A5 判である漫 画をページ単位で表示するには小さすぎる. コマの抽出及び並び替えが可能であるなら読者にとって最適な読書環境を提供できる可能性があ る.そこで,本研究ではこの問題を解決するべくコ マ領域の検出について検証する.
異なるタイプの画像コーパスからの転移学習とデータ拡張に基づくアスキーアートのカテゴリ分類,
JSKE 第22回日本感性工学会大会講演論文集, 1-7, 2020年9月.- (要約)
- In this paper, we propose an ASCII art category classification method based on transfer learning and data augmentation.ASCII art is one of the nonverbal expressions that visually express emotions and intentions.There are similar expressions such as emoticons and pictograms. However, most of them are either represented by a single characteror embedded in the statement as an inline expression. ASCII art is expressed in various styles, including dot art illustration and lineart illustration. Basically, ASCII art can represent almost any object, therefore the category of ASCII art is very diverse. Many existing image classification algorithms use color information, however, since most ASCII art is written in character sets, there is no color information available for categorization. Create an ASCII art category classifier using the grayscale edge image and the ASCII art image transformed from the image as a training image set. We also use VGG16, ResNet-50, Inception v3 and Xception's pretrained networks to fine-tune our categorization. As a result of the experiment of fine tuning by VGG16 and data augmentation, an accuracy of 80% or more was obtained in the "human" category.
- (キーワード)
- ASCII art / Transfer learning / Fine tuning / Data augmentation / Domain adaptation
テレビ番組視聴者のツイートからのキーワード抽出および分類,
2020年度人工知能学会全国大会(第34回), 2020年6月.- (要約)
- 近年,若者を中心にテレビ離れが進んでいる. その主な理由としては,長時間番組であったり,視聴者の視聴時間が限られているためである.また,近年,ソーシャルメディアの発達に伴い,テレビ番組の視聴において,リアルタイムに意見や感想を述べる機会が増加した.実際にTwitter上では,いわゆる実況ツイートが盛んに行われている.そこで,本研究では,テレビ番組実況ツイートを用いてテレビ番組のイベントシーンに関するキーフレーズを抽出する手法を提案し,効率的なテレビ番組視聴を目指したシーン検索システムを提案する.実験の結果,番組時間に対して約5%∼10%の誤差で番組内容を推定した.また,抽出されたキーフレーズをt-SNEアルゴリズムによってイベントシーンカテゴリごとに視覚化した.
- (キーワード)
- 自然言語処理 / 情報検索 / Twitter
深層学習モデルによる音響ベクトル系列から文書ベクトル系列へのメディア横断マッピング,
情報処理学会全国大会講演論文集, No.4Q-05, 2-181-2-182, 2020年3月.- (要約)
- 本研究では,音響特徴量と文書ベクトルとの対応付けを可能とするモデルの構築を行った.提案手法では,時系列データの学習にRNN-LSTMを用いてクロスメディアでのマッピングを可能としている.構築したモデルを用いて評価実験を行ったところクローズドテストではうまくマッピングされることが確認された.今後はオープンテストでの調査を行い,汎化性能の検討を行う.
ツイート内容による夜間活動休止時間の推定に関する研究,
情報処理学会第82回全国大会講演論文集, 469-470, 2020年3月. 高野 翔吾, 松本 和幸, 吉田 稔, 北 研二 :
文書分散表現を用いた音楽アーティストの特徴分類に関する研究,
情報処理学会第82回全国大会講演論文集, 477-478, 2020年3月. 松本 和幸, 篠山 学, 寺園 嶺, 吉田 稔, 北 研二 :
インタビュー対話コーパスにおける発話の意図および感性の分析,
日本感性工学会春季大会, 1-6, 2020年3月.- (要約)
- In this study, we analyze interview dialogue corpora taken from an interview-type TV program, aiming at realizing aninterview dialogue system that brings out the best of the users of the system. After defining a tag set that classifies intention of utterance,these tags were added to six types of interview dialogue corpora, then we conducted utterance intention estimation using utterancesentence vectors obtained by using a pre-trained model. In the experiments, we analyze the expressions that are strongly related to theutterance intention, other important expressions, and the tendency of utterances of both the interviewers and the interviewees.
- (キーワード)
- Interview Dialogue System / Dialogue Act Prediction / Kansei Analysis / Corpus Analysis
深層ニューラルネットワークに基づくテキストと画像間のクロスメディア検索,
電子情報通信学会2020年総合大会学生ポスターセッション, No.ISS-A-076, 2020年3月.- (キーワード)
- 深層学習 (deep learning) / クロスメディア検索
深層学習を用いたパントモ画像からのインプラント体検出,
電子情報通信学会2020年総合大会学生ポスターセッション, No.ISS-A-060, 2020年3月.- (キーワード)
- 深層学習 (deep learning) / パントモ画像 / インプラント (implant) / インプラント検出
人工知能(AI)による機械学習解析を用いた食道扁平上皮癌の血中microRNA新規AI診断モデルの構築.,
JDDW2019(第27回日本消化器関連学会週間), 2019年11月. 佐久田 祐子, 津野邉 純一, 松本 和幸, 吉田 稔, 北 研二 :
Earth Mover's Distance を用いた画像の印象推定,
第21回日本感性工学会大会, No.13A2-02, 2019年9月. 津野邉 純一, 佐久田 祐子, 松本 和幸, 吉田 稔, 北 研二 :
深層学習に基づく配色イメージの感性マッピング,
第18回情報科学技術フォーラム (FIT2019), No.J-004, 2019年9月. 藤野 尚也, 松本 和幸, 吉田 稔, 北 研二 :
Word Mover's Distanceを用いたコーパス拡張による感情推定精度向上の検討,
言語処理学会第25回年次大会(NLP2019), 129-131, 2019年3月.- (要約)
- 近年,深層学習をはじめとする機械学習はテキストマイニングや画像認識などの様々な研究分野で利用されている.今後の技術発展において必要不可欠であり,莫大な費用を投じている企業も少なくない.また,感情推定技術は人間とコンピュータ同士の円滑なコミュ ニケーションの実現に重要な役割を果たす.そういった中,よく問題点として挙げられるのが訓練データ量の不足や質の低下である.データ量の不足,質の低下は機械学習そのものの質の低下に直結する.本研究では,代表的な SNS の一つである Twitter に投稿され るテキストである「ツイート文」に着目し,そこに投稿されるツイート文を感情推定の対象とする.また,コーパス拡張が感情推定モデルの精度にどのような影響を及ぼすかを分析し考察する.
- (キーワード)
- ツイッター / Word Mover's Distance / 感情推定 / データ拡張
リプライを用いたバズツイートの分類,
言語処理学会第25回年次大会(NLP2019), 237-240, 2019年3月.- (要約)
- 近年 SNS の発達により,多数のユーザ間で口コミの拡散や共有が盛んにおこなわれるようになった.これによりインターネット上でコンテンツの流行が度々起こるようになった.ユーザ同士のコミュニケーションによっておこる流行のことを「バズる」と呼ぶ.この「バズる」ことを利用したマーケティングが重要視されており,いち早くバズに気づき取り入れることが今後のマーケティングで重要になってくると考えられる.既存研究において,時系列での拡散のされ方などから流行を検知するものがあるが,それらの手法 では拡散された要因までは知ることができないという問題点がある.本研究では,Twitter においてバズったツイートに寄せられたリプライをベクトル化し,ツイートに対するリプライ全体を特徴ベクトルとすることで,「バズっている」特徴の定義を目指すとともにバズツイート内におけるタイプ別の分類分けの可能性について検討する.
- (キーワード)
- ツイッター / リプライ / ソーシャルメディア / バズ
Comment Mover's Distanceを用いた類似動画検索,
IDRユーザフォーラム 2018, 2018年11月.- (キーワード)
- 動画コメント / Comment Mover's Distance / 類似動画検索
深層畳み込みニューラルネットワークによるアスキーアートの分類,
平成30 年度電気関係学会四国支部連合大会 講演論文集, 155, 2018年9月.- (要約)
- 近年のSNS でのテキストコミュニケーションにおいて,顔文字,絵文字,スタンプといった非言語表現は感情伝達において重要であり,ショートテキストで円滑なコミュニケーションを行う際には欠かせないものとなっている.非言語表現のうち,アスキーアート(ASCII Art; 以下AA)は使用されている文字が特に意味を持たないことが多く,その配置や形状により視覚的に感情や意図を伝達,表現できる.しかし,それ故に使用されている文字を手がかりとした分類が難しい.本研究では,AA を画像化し深層学習を用いて分類する手法を提案する.
- (キーワード)
- アスキーアート / 分類 (classification) / 深層畳み込みニューラルネットワーク
アスキーアート分類手法の比較検討,
第32回人工知能学会全国大会講演論文集, 1-4, 2018年6月.- (要約)
- 近年,ソーシャルメディアにおいて数多くの非言語表現が使用されている.そのなかでも,アスキーアート(AA)は,文字を用いた視覚的な技法による表現の一つである.本論文では,文字特徴と画像特徴によるアスキーアート分類手法を比較検討し,アスキーアートのカテゴリ分類に効果的な手法を評価実験により明らかにする.評価実験では,1) 文字頻度,2) 文字重要度,3) 画像特徴量,4) 文字の画像特徴量 の4種類を比較する.この4つの特徴量を用いて,ニューラルネットワークの学習によりカテゴリ分類器を作成する.実験の結果,文字単位での画像特徴を用いて学習させたフィードフォーワードニューラルネットワークによる分類器が,全体的な精度が優れていることが分かった.
- (キーワード)
- アスキーアート / 画像特徴 / 文字特徴 / ニューラルネットワーク (neural network)
Emotion Recognition from Emoticons based on Deep Neural Netwotks,
2018年電子情報通信学会総合大会ISS特別企画学生ポスターセッション予稿集, Mar. 2018.- (要約)
- Text communication has been developed in recent years, all kinds of daily contacts are through the SNS regardless of age, gender and active. As an advantage of text-based communication via the Internet. There is a point that you can quickly respond to anyone wherever you are. In this paper, by letting the deep convolution neural network learn the image features of emoticons. We propose a method to classify by emotion expressed by emoticons. By treating emoticons as images, it is possible to capture visual features and think that natural identification can be made rather than handling as character strings.
- (キーワード)
- 顔文字 / 感情認識 / 深層ニューラルネットワーク
絵文字を手がかりとした俗語感情コーパスの拡張,
言語処理学会 第24回年次大会 発表論文集, 797-800, 2018年3月.- (要約)
- 絵文字が含まれていない文からでも,絵文字を推定することができれば,感情推定が可能になると考える.本論文では,俗語と絵文字を両方含む多量のコーパスを文字レベルで学習させ,絵文字推定器を作成し,俗語を含んだ発話文コーパスへの感情タグ付け手法を提案する.
- (キーワード)
- 絵文字 / 俗語 / 感情 / コーパス (corpus)
プロフィール情報を用いたテキストの視点分類,
情報処理学会研究報告, Vol.2017-NL-234, No.11, 1-5, 2017年12月.- (要約)
- 同一トピックに関する Twitter への投稿を,視点によって分類する手法を提案する.提案手法は,ユーザーのプロフィール情報を援用し,各投稿内容の分散表現を学習することで,類似する視点からの投稿をまとめる.
ユーザの性別と感情表出傾向との関連,
第31回人工知能学会全国大会予稿集, 1-4, 2017年5月.- (要約)
- 感情表現や俗語表現の使用傾向は,発話者の性別の違いによって傾向があると考えられる.本研究では,性別に適応させた感情推定モデルの構築を行い,その有効性を検証する.さらに,提案モデルにより得られた感情表出傾向に基づき,口語文においてよく用いられる俗語表現の使用傾向が感情表出傾向とどのように関連があるかを,男女別で比較分析する.
- (キーワード)
- ツイッター / 感情認識 / 属性
楽曲に特徴的なコメントに基づく作業用BGMからのインデックス作成,
第31回人工知能学会全国大会予稿集, 1-2, 2017年5月.- (要約)
- 作業用BGMとは,何らかの作業中に流す音楽のことである.本研究では,ニコニコ動画に投稿されている複数の楽曲が収録された作業用BGM動画を対象とし,楽曲ごとに固有の特徴的なコメントに基づく作業用BGMのインデックス作成を目的としている.提案手法では,動画に投稿されたコメントデータの増減と,楽曲固有の特徴的なコメントおよび感嘆表現(記号なども含む)に基づき,BGMの終了・開始位置を検出する.
- (キーワード)
- インデックス生成 / ニコニコ動画 / 特徴コメント
画像特徴量を用いた大型アスキーアートの分類手法の提案,
第31回人工知能学会全国大会予稿集, 1-2, 2017年5月.- (要約)
- アスキーアート(AA)について,従来,顔文字のような小型のものを対象とした研究は多くあり,それら小型AAを単語として捉えた様々な抽出・分類手法が提案されてきた.しかし,複数行にわたる大型のAAも存在し,視覚的に類似しているAAであっても使用文字が異なるものが多数存在している.本研究ではAAを画像化し,画像特徴量を用いることで大型のAAに適した分類手法を提案する.
- (キーワード)
- アスキーアート / 画像特徴 / 分類 (classification)
感情表出傾向の分析による対話破綻検出,
言語処理学会第23回年次大会発表論文集, 158-161, 2017年3月.- (要約)
- 本研究では,ユーザの感情の変化に合わせてシステム自身の感情を表出させることができないために起こる対話破綻について,発話文から推測可能な感情傾向の比較により検出する手法を提案する.具体的には,発話文の分散表現ベクトルをもとに感情が表出されている強度 を推定するモデルを用い,直前の 2 発話における推定結果との類似度の計算を行うことで,そのパターンを特徴量として対話破綻のラベルを推定する.評価実験では,提案手法を用いた対話破綻ラベルの推定をおこない,文の分散表現ベクトルの類似度パターンによる手法との比較をおこなう.
- (キーワード)
- 対話破綻検出 / 感情推定 / 分散表現
Twitter を用いた感染症発生動向の視覚化,
人工知能学会インタラクティブ情報アクセスと可視化マイニング研究会(第15回), 48-53, 2017年3月.- (要約)
- The purpose of this research is to extract comments on infectious diseases from Twitterand to create an infection map.As a method,we check the facts of the extracted utterance,extractthe past tweets of the infected person from the result,and estimate the place where the personlives.We used SVMs both for the fact check and place estimation.
- (キーワード)
- Twitter / 可視化 / 感染症発生動向
分散表現を用いた有害表現判別に基づく炎上予測,
人工知能学会インタラクティブ情報アクセスと可視化マイニング研究会(第15回), 1-6, 2017年3月.- (要約)
- In recent years, flaming on social media has been a problem. To avoid flaming, it is useful for the system to automatically check the sentences whether they include the expressions that are likely to trigger flaming or not before posting messages. In this research, we target two harmful expressions. There are insulting expressions and the expressions that are likely to cause a quarrel. Firstly, we constructed a harmful expression dictionary. Because a large cost requires to collect the expressions manually, we constructed the dictionary semi-automatically by using word distributed representations. The proposed method used distributed representations of the harmful expressions and general expressions as features, and constructed a classier of harmful/general based on those features. An evaluation experiment found that the proposed method could extract harmful expressions with accuracy of approx. 70%. On the other hand, it was found that the proposed method could also extract unknown expressions, however, it wrongly extracted non-harmful expressions at a rate of approx. 40%.
- (キーワード)
- 有害表現 / 分散表現 / サポートベクターマシン / 炎上予測
表形式からの分散表現獲得,
情報処理学会自然言語処理研究会研究報告, Vol.2016-NL-229, No.19, 1-6, 2016年12月.- (要約)
- 表形式における単語埋め込み手法について考える.通常の文章を対象とした学習手法に比べ,表形式においては,単語の周辺文脈として,縦方向 ・ 横方向の二種類の文脈が考えられる.本稿では,これら同時に考慮した,二次元的なモデルを提案し,一次元的なモデルとの比較を行う.
8bit 音源に対する自動採譜システムに関する研究,
平成28年度電気関係学会四国支部連合大会講演論文集, 17-5, 2016年9月.- (要約)
- 本研究では,自動採譜分野において 8Bit 音源の特徴に着目して研究をする.8bit 音源とは,三角波と矩形波が二つの三和音とノイズからなる,一般的な音楽を形成するにあたる最低限の要素で構成された,シンプルな音源である. つまり,8bit 音源の採譜ができればベースやメロディーの動きが明らかになりその楽曲の骨組みが分かるようになる. 従来は,自動採譜の分野の研究において,一般的なクラシックやポップスなど,大量の楽音が混在した楽曲データを対象としていた.1)それに対し,本実験では 8-bit 音源を対象にし,その最低限の和音のみで構成されたものを対象にすることによる影響について考察した.
- (キーワード)
- 8bit音源 / 自動採譜
深層学習に基づく顔画像によるアニメキャラクタの分類,
平成28年度電気関係学会四国支部連合大会講演論文集, 178, 2016年9月.- (キーワード)
- アニメキャラクタ / 深層学習 / 顔画像 / 分類 (classification)
Deep Convolutional Neural Network による顔画像からの表情識別,
第15回情報科学技術フォーラム講演論文集, Vol.3, 293-294, 2016年9月.- (キーワード)
- 深層学習 / 顔表情 / 深層畳み込みニューラルネットワーク
出現頻度の低い色に注目した作風に基づくイラスト画像の分類,
第15回情報科学技術フォーラム講演論文集, Vol.3, 87-88, 2016年9月.- (キーワード)
- イラスト画像 / IF-hist / 作風
Twitterを用いた病気の事実性解析及び知識ベース構築,
人工知能学会全国大会2016講演論文集, 2016年6月. 藤岡 亮太, 吉田 稔, 松本 和幸, 北 研二 :
Twitterから抽出したユーザの発言に基づく健康状態の推定,
人工知能学会全国大会2016発表予稿集, 2016年6月. 田中 聡, 松本 和幸, 吉田 稔, 北 研二 :
情報推薦のための Twitter ユーザの性格分析手法,
人工知能学会全国大会2016発表予稿集, 1-4, 2016年6月.- (キーワード)
- 性格分析 / エゴグラム / ツイッター / 情報推薦
画像特徴量を用いたアスキーアートからの顔文字検出,
人工知能学会全国大会2016講演論文集, 1-2, 2016年6月.- (キーワード)
- アスキーアート / 顔文字 / 画像特徴量 / HOG特徴量 / SIFT特徴量
表形式のトピックモデルとその数値単位推定への応用,
情報処理学会自然言語処理研究会研究報告, Vol.2016-NL-226, No.16, 1-6, 2016年5月.- (要約)
- 表形式中の数値表現について単位が省略されている場合に,その単位を推定するための手法を提案する.Wikipedia 表形式中の,数値のみを含むセルを対象に,一行目のセル等の 「周辺文脈」 を利用し,適切な単位を推定する.また,表形式の外側の文章を利用するために,表形式と文章を同時にモデル化するためのトピックモデルを提案し,トピックの推定結果を単位推定に利用することで精度の向上を図る.
Twitterユーザの属性別感情推定の検討,
言語処理学会第22回年次大会講演論文集, 2016年3月. 村上 侑希, 吉田 稔, 松本 和幸, 北 研二 :
深層畳み込みニューラルネットワークを用いた顔認識の精度評価,
2016年電子情報通信学会総合大会学生ポスターセッション, 2016年3月. 松岡 雅也, 松本 和幸, 吉田 稔, 北 研二 :
トピック変動の分析による俗語の特徴抽出,
情報処理学会研究報告, Vol.2016-NL-225, No.4, 1-5, 2016年1月.- (要約)
- 本研究では俗語の使われ方が時間経過によって変化することに着目した.俗語の含まれたツイート文の集合を潜在的ディリクレ配分法により分析し時間ごとのトピックを得る.このトピックにおけるトピック重要語の集合について隣接する時間(月単位)での類似度を計算し,トピックの変化を抽出し,俗語の特徴となるものを検討する.
- (キーワード)
- 俗語 / トピック変動 / 潜在的ディリクレ配分法
2次元図面の形状に基づく検索システム,
電気関係学会四国支部連合大会講演論文集, 256, 2015年9月. 松尾 高志, 吉田 稔, 松本 和幸, 北 研二 :
ロゴ検出における最適パラメータ推定,
電気関係学会四国支部連合大会講演論文集, 256, 2015年9月. 橋本 佳祐, 吉田 稔, 松本 和幸, 北 研二 :
オーディオ指紋に基づくゲーム音楽の検索手法に関する研究,
電気関係学会四国支部連合大会講演論文集, 256, 2015年9月. 宮本 竜次, 吉田 稔, 松本 和幸, 北 研二 :
ボーカル音を含んだ混合音テンプレートによる多重奏の音源同定,
電気関係学会四国支部連合大会講演論文集, 268, 2015年9月. 清水 隼人, 松本 和幸, 吉田 稔, 北 研二 :
ニコニコ動画におけるコメント分布の相関に着目した不正動画検出,
第14回情報科学技術フォーラム講演論文集, Vol.2, 229-230, 2015年9月.- (キーワード)
- ニコニコ動画 / 動画共有サイト / 不正動画 / 時系列相関分析
影響力の範囲を考慮したTwitter における影響力推定手法,
第14回情報科学技術フォーラム講演論文集, Vol.2, 227-228, 2015年9月.- (キーワード)
- Twitter / 影響力 / Twitter API / フォロワー / リツイート
掲示板における炎上分析のためのノイズ除去手法,
第14回情報科学技術フォーラム講演論文集, Vol.2, 219-220, 2015年9月.- (キーワード)
- 掲示板 / ノイズ除去 / 炎上
分割誤りに頑健な新語のカテゴリ分類,
第14回情報科学技術フォーラム講演論文集, Vol.2, 243-244, 2015年9月.- (キーワード)
- カテゴリ分類 / 新語 / 分割誤り
ニコニコ動画におけるコメント分布の時間に基づく相関に着目した動画の不正検出,
信学技報, Vol.115, No.177, 97-101, 2015年7月.- (要約)
- 近年,YouTubeやニコニコ動画をはじめとする動画共有サイトは,プライベートの公開や企業の宣伝活動,最新のニュースなど,個人・法人を問わず様々な用途で活用されており,動画の広告報酬等で収益を上げているユーザも少なくない.しかし,再生数などをもとに動画の評価が行われるため,恣意的に再生数・コメント数を増やすといった不正な方法により,動画の注目度上げることができてしまう. 本研究では再生数やコメント数の多さではなく,ニコニコ動画に対して投稿されたコメントの時間的な分布の相関に着目し,動画の不正検出手法を提案する.ベースラインとして,動画が不正かそうでないかを,動画に対して投稿されたコメント中の単語を素性とした機械学習による二値分類に基づく手法を用い,検出精度について提案手法との比較を行う.
- (キーワード)
- ニコニコ動画 / コメント分布 / 時系列相関
音喩表現に基づく書体デザインの自動生成に関する研究,
情報処理学会全国大会講演論文集, 4-767-4-768, 2015年3月. 前川 和輝, 松本 和幸, 吉田 稔, 北 研二 :
書き込みのエントロピー に着目した速報スレッド における 盛り上がり要因の分析,
言語処理学会第21回年次大会発表論文集, 620-623, 2015年3月.- (キーワード)
- 掲示板 / 速報スレッド / エントロピー (entropy)
顔文字のパーツの種類と表情の強弱に着目した顔文字表情推定,
言語処理学会第21回年次大会発表論文集, 449-452, 2015年3月. 松本 和幸, 土屋 誠司, 吉田 稔, 北 研二 :
若者言葉の意味と感性を考慮した標準語への変換手法,
言語処理学会第21回年次大会発表論文集, 529-532, 2015年3月.- (キーワード)
- 若者言葉 / 俗語 / 印象 / 変換
歌詞検索に必要な内容語数の分析およびクエリ拡張手法の提案,
電気関係学会四国支部連合大会講演論文集, 2014年9月.- (要約)
- 本研究は間違いの含まれる入力クエリの検索可能最低クエリ数を調べることにより検索システムの効率化や柔軟で強固な検索システムの作成の参考になるデータをとることを目的とした.誤り歌詞片を用いた評価実験の結果,必要な最小内容語数は平均4単語となった.
- (キーワード)
- 歌詞検索 / クエリ拡張
LDPC符号とハミング符号を用いた補助情報を伴う符号化システムの性能評価,
情報・システムソサイエティ・学生ポスターセッション予稿集, ISS-P-255, 2014年3月.- (要約)
- 近年, インターネットの普及により通信する情報量 が増加しているため, 情報を効率良く送信されるため の情報圧縮技術が求められている. その中で, 1975年 にWyner[1], Ahlswede and Körner[2]らが補助情報 を伴う符号化システムの許容伝送率領域の証明した. しかし, 彼らの論文において誤り訂正符号などを実際 に使用しての実験は行なわれていない. そこで本稿は, 補助情報を伴う符号化システムにお いて主符号化器にLDPC符号, 副符号化器にハミング 符号を使用した場合の性能評価を行なう.
- (キーワード)
- LDPC符号 / ハミング符号
知覚ハッシュに よ る 類似画像検索,
情報・システムソサイエティ・学生ポスターセッション予稿集, ISS-P-256, 2014年3月.- (要約)
- 近年,インターネットの普及により個人が触れることのできる画像データの量が膨大に増えている.それに伴い,画像から類似している画像を検索する類似画像検索の需要も増している.本研究では知覚ハッシュを使い,従来手法のグレースケールの代わりに3チャンネルのカラー情報を用いることで,人間の感性に近い類似画像検索を目標としている.
- (キーワード)
- 知覚ハッシュ / Block Mean Value Hash / 画像検索
ナイーブベイズ法を用いたTwitterによる性格推定,
言語処理学会第20年次大会予稿集, 2014年3月.- (要約)
- 本研究ではTwitterを利用し,Web上のツールを用いてエゴグラム分析を行ったユーザアカウントを対象に投稿内容を収集し,投稿内容に出現する単語を素性としてナイーブベイズ法による機械学習をおこない,投稿内容から性格の自動分類することを目的とする.
- (キーワード)
- ナイーブベイズ法 / Twitter / 性格推定
アーティスト評判分析に有効な特徴表現の抽出,
言語処理学会第20回年次大会予稿集, 2014年3月.- (要約)
- 本研究では,n-gram出現頻度に基づき,アーティストに関するつぶやきデータから,評判分析に有効な特徴表現を抽出する.さらに,特徴表現に後続する単語を素性として,Support Vector Machine による機械学習によるカテゴリ分類をおこなう.評価実験の結果,アーティスト/カテゴリごとに差は出たものの,約80%の正解率で分類できることがわかった.
- (キーワード)
- テキストマイニング (text mining) / マイクロブログ / Twitter / 評判分析
歌詞における聞き慣れない表現と誤りとの関連性の分析,
言語処理学会第20回年次大会予稿集, 2014年3月.- (要約)
- 本稿では,歌詞において特徴的な表現について,歌詞コーパスとWeb コーパスにおける出現頻度を比較することで分析する.また,聞き慣れない表現と誤りが起こるフレーズとの関連を,実際に楽曲の歌詞の書き起こしをおこなうことで得た歌詞片を用いることにより調査し,歌詞に特徴的な表現との比較もおこなう.
- (キーワード)
- 歌詞 / 単語親密度
種々のテキスト検索モデルの頑健性向上による音声ドキュメント検索の高精度化,
音声ドキュメント処理ワークショップ, 2014年3月.- (要約)
- 音声ドキュメント検索には様々なテキスト検索モデルが適用できる.それらについて,音節検索の併用や検索語彙の拡張などの手法を適用して高精度化を図り,最新の技術として比較検討を行った.
キャラクタの顔を用いたイラスト画像の作者識別,
HCGシンポジウム2013, Vol.HCG2013-I-2-1, 523-530, 2013年12月.- (要約)
- 本研究では,キャラクターを描いたイラスト画像に対し,顔部分に着目し,特に,目の部分からエッジ特徴量(Line Percent: LP)を抽出し,その書き込み具合をもとに,イラストレーター特有の特徴を見出して作者識別を行う. 人による識別と,LPに基づく自動識別実験をおこない比較した結果,人による識別と同等とまではいかないが,ある程度の識別率を得ることができた.このことから,イラスト画像における部分的な書き込み具合を特徴量として用いることで,ある程度の精度での作者識別が可能なことがわかった.
- (キーワード)
- 画像処理 (image processing) / イラスト画像 / エッジ / Canny法
返答率に基づく演劇中の登場人物間の親密度推定,
HCGシンポジウム2013, Vol.HCG2013-I-1-16, 511-515, 2013年12月.- (要約)
- 本稿では,台本の会話文に着目し,演劇の登場人物間の人間関係を獲得することを試みた.一般に,我々は登場人物のセリフや行動を基に,人物像や人間関係を理解する.演劇の場合,一つにはその構造上の理由から,登場人物の感情は,映画やテレビドラマに比べるとより明白に表現される.舞台の上で演じる役者にとって,全観客に表情を使って感情を伝えるのが難しいからである.そのため,人間関係や人物像を得るために台詞中の感情表現を用いることが考えられる.人間同士の会話には感情表現以外の要素が多く含まれており,それらは,人間関係を推測するのに役立つ.本研究では,人間関係に最も重要であると考えられる「親密度」を,台詞から抽出する手法を検討する.登場人物間の会話文に対して,発話頻度と返答数に基づく返答率を計算することにより,登場人物間の親密度を得た.シナリオから対話文を収集したコーパスを構築し,提案手法により計算した親密度の有効性を分析した.
- (キーワード)
- シナリオ会話文 / 返答率 / 親密度
意味情報を考慮した歌詞検索のためのAndroidアプリ,
平成25年電気関係学会四国支部連合大会講演論文集, 2013年9月.- (要約)
- 我々は,入力する歌詞クエリの誤りに頑健な歌詞検索システムを開発することを目的とする.これまでに意味的なクエリの拡張を行い ,意味的な類似度の高い順に歌詞を表示するシステムを実装した.本稿では多くのユーザに評価してもらうためユーザが利用しやすい Androidアプリを作成する.まず意味的情報を考慮したクエリの拡張について説明し,作成したアプリの構成について説明する.
- (キーワード)
- 歌詞検索 / Androidアプリ / 意味情報 / クエリ拡張
俗語の出現頻度と文末表現の関連性に関する分析,
平成25年度電気関係学会四国支部連合大会講演論文集, 2013年9月.- (要約)
- 近年,スマートフォンなどの携帯型端末の爆発的な普及に伴い,Twitterやfacebookを始めとするSNSやブログサービスなどの利用者が増加している傾向にある.それにより,現在ネット上にはSNSなどから得られる膨大なテキストデータが存在している.これらのテキストデータでは,俗語と呼ばれているくだけた表現が多く用いられている.そのため,俗語が使用されているテキストデータを分析して情報抽出を行う場合,形態素解析誤りが影響し,信用できる結果が得にくい.しかし,現代の言葉を理解する研究は評判分析など様々な場所で応用できるものとして非常に重要であると考えられる.そのため,現代の言葉の特徴である俗語を分析し理解する研究は非常に重要であると考えられる.本論文では,ブログにおける文章の文末表現の混合率および変移率に着目し,俗語が表れやすい文章がどのような特徴を有するのかを分析する.
- (キーワード)
- 俗語 / 文末表現 / 混合率 / 変移率
コスト付き符号化を用いたステガノグラフィ,
電子情報通信学会技術研究報告, Vol.113, No.153, 5-9, 2013年7月.- (要約)
- 近年, ネットワーク通信の発展に伴い, 安全に通信を行う技術が重要になっている. この要求に対して暗号技術が必ずしも満たすとは限らない. この対策として, 通信秘匿技術であるステガノグラフィがあり, 一般的な手法にLSB法が知られている. しかし, LSB法は誤りビットの発生について考慮されていないため, これまでにLSB法を基に誤りビットを考慮した多くの手法が提案されてきた. 本論文では, コスト付き符号化を用いて埋め込む情報を誤りパターンに変換し, 排他的論理和によって埋め込むステガノグラフィを提案する. また, 数値計算によって理論限界$R= H(Delta)$まで漸近的に近づけることができることを示す.
- (キーワード)
- 情報ハイディング / ステガノグラフィ / コスト付き符号化 / 誤りパターンによる埋め込み法
文字種と画数を用いた未知若者語の抽出,
言語処理学会第19回年次大会(NLP2013)予稿集, 2013年3月.- (要約)
- 本研究では若者語は日常的に使用されやすい語を用いて生成されるという仮定に基づいて,語の表層的な特徴より文中の若者語を抽出することを検討する.文中からの抽出には条件付き確率場(以下CRF)を用いて確率モデルで文字列が若者語である確率の高い言葉を推定することにより行う.
- (キーワード)
- 単語抽出 / 条件付確立場 / 文字種 / 画数 / 俗語
対話における感情変化と脳波変化との関連性分析に関する研究,
平成24年度電気関係学会四国支部連合大会講演論文集, 95, 2012年9月.- (要約)
- 脳波等の患者から発信される情報が重要なのはいうまでもないが,患者からの情報のみに頼るのではなく,介護を行う側の意識を変化させることが,より重要だと考える.本研究の最終目的は言葉が被介護者の感情にどのように影響するかを言語情報から予測することである.このような予測が可能になれば,患者の心を傷つけるような言葉を未然に防ぐことができる.本研究では,共感を分析しやすい対象として,演劇シナリオを用いることにした.演劇シナリオは,一般的な対話と比較すると,演出を重視しているためか,感情的な表現が多用されている特徴がある.介護場面などでは,演劇口調で話すことはほとんどないと考えられるが,本研究ではこうした感情表現の多用により,脳波に明確な変化が起きることを期待する.
- (キーワード)
- 対話分析 / 脳波変化
聞き間違いと記憶間違いに着目した歌詞検索システムの研究,
平成24年度電気関係学会四国支部連合大会講演論文集, 357, 2012年9月.- (要約)
- 現在普及している楽曲検索において,アーティスト・曲名検索,歌詞入力検索ならば前者が主流である.実際には歌詞入力検索も同等の性能であると考えられるが,聞き間違いや記憶間違いを原因とした誤入力が検索精度を低下させる.本研究では,従来の言語研究のデータから使用者の入力ミス等の影響を最小限に抑え歌詞入力検索の精度の低下を防ごうと考えている.本研究では,歌詞の聴取実験により収集した誤り歌詞データを用いた分析をおこない,歌詞の誤りにどのように対処していくかを議論する.
- (キーワード)
- 歌詞検索
シナリオ対話感情コーパスの構築と分析,
第11回情報科学技術フォーラム(FIT2012)講演論文集, Vol.2, 242-243, 2012年9月.- (要約)
- 従来,言語・音声・画像といった情報からの感情推定を目的とした研究が多くの研究者によって行われてきたが,感情を表面的な情報から得るには限界がある.この理由として,感情は内在的な反応であるため,表情や行動を伴わないことも多いことがあげられる.しかし,発話者同士が親密な関係であればある程,感情の変化に伴う相手の言葉遣いの微細な変化に気付くことがある.このような言葉遣いの細やかな変化を検出できれば,対話における感情推定精度を向上できる可能性がある.徳久らは,発話文の文末表現に着目したが,言葉遣いの細やかな変化は,文末表現のみに表れるものではないと考えられる.たとえば,相手が普段使用しないような単語や慣用句を使用する場合でも,何かしら相手の心境の変化を察することもある.本研究では,話者の発話時における感情と,発話役割や文体との関係を調べる準備段階として,対話を記述したコーパスに感情,発話役割,文体タグの付与を行なった.このコーパスを分析することで,相手発話のどのような要素が影響して感情が変化するかを考察する.
- (キーワード)
- シナリオコーパス / 対話処理 / 感情推定
楽曲検索インデックスのコンパクト化,
第11回情報科学技術フォーラム(FIT2012)講演論文集, Vol.2, 181-182, 2012年9月.- (要約)
- 楽曲の曲名やアーティスト名,アルバム名などの楽曲情報を得るときには,楽曲検索システムが利用されている.マイクから楽曲の一部を読み込み,楽曲情報を得る技術にも使われている.多くの楽曲検索システムでは,オーディオ指紋(audio fingerprint)が使われている.オーディオ指紋は,楽曲の特定に用いられる特徴である.オーディオ指紋を楽曲情報データベースと共に用いることにより,楽曲の一部から楽曲情報を得ることができる.また,オーディオ指紋は楽曲を識別できることから,楽曲検索のみではなく,ネットワーク上に流通している著作権を侵害した楽曲の検出も可能である.効率的なオーディオ指紋検索には,接尾辞配列を利用した手法がある.これは,楽曲データベースの増大に比例して空間コストが増加する欠点を持つ.本稿では,データベースのインデックスを圧縮することにより,空間コストの削減を行う.
- (キーワード)
- オーディオ指紋 (audio fingerprint) / 情報検索 (information retrieval) / 音楽検索
うつキーフレーズと感情変動に基づくブログからのうつ検出手法,
言語処理学会第18回年次大会講演論文集, 1126-1129, 2012年3月.- (要約)
- 我々は,ブログの書き手に,うつ傾向があることを自覚させることにより,うつ病の早期発見・早期治療に役立てることができると考えた.まず,うつ傾向の有無を,ブログ内容から推定することができるか否かをテキスト分類手法を用いた実験により明らかにし,どのような特 徴がうつ判定に有効であるかを調査する.また,人間の心の変化をとらえるための特徴として,時間経過に伴う記述内容の変化から読み取れる感情状態の変化がある.多くのブログが,毎日の出来事や心情を時系列順に書き記したものであるため,そこから時間的変化を得ること が出来る.本稿では,うつ特有の言葉遣いを収集したうつキーフレーズ辞書に基づくうつ検出手法と,感情状態の変化に基づいたうつ検出手法を提案する.
- (キーワード)
- 自然言語処理 (natural language processing) / うつ検出 / ブログ
印象尺度に基づいた文章言い換え手法,
言語処理学会第18回年次大会講演論文集, 425-426, 2012年3月.- (要約)
- 本稿では文中の単語を,同じ意味の,別の印象を持つ単語に置き換えることで,印象の違った文に変換する手法を提案する.友人や家族とコミュニケーションをとる際に用いるような単語の印象を,Casual(柔かい表現),目上の人とコミュニケーションをとる際に用いるような単語の印象をFormal(堅い表現)の尺度と定義し,新聞記事とブログを基に,単語のCasual/Formalの印象付与を自動で行う.新聞記事は短い文で的確にニュースのポイントを読者に伝えるため,会話では使用されることが少ない漢字を多く用いる.このことから,新聞記事で多く用いられる単語をFormalな単語として分類する.ブログは個人的な体験や日記を掲載し,臨場感を出すためにくだけた会話表現を多く用い る傾向がある.このことから,本実験では,ブログで多く用いられる単語はCasualな単語として分類する.
- (キーワード)
- 自然言語処理 (natural language processing) / 言い換え / 印象
コーパスに基づく雑談を目的とした発話役割同定,
言語処理学会第18回年次大会講演論文集, 109-110, 2012年3月.- (要約)
- 我々は,コーパスに基づく雑談を目的とした発話役割の同定の研究を行っている.西原らは発話役割の一部は助詞・助動詞の組み合わせで表されるとし,助詞・助動詞の意味を用いたルールによって発話役割の同定を行った.そこで本稿では品詞情報を用いた雑談の発話役割に有効な重みを模索し,コーパスに基づく雑談を目的とした発話役割の同定手法を提案する.
- (キーワード)
- 自然言語処理 (natural language processing) / 発話役割 / 雑談 / コーパス (corpus) / 形態素2-gram
脳波を用いた類似画像検索手法,
電気関係学会四国支部連合大会講演論文集, 4, 2011年9月.- (要約)
- 本研究では,感性的画像検索を実現するため,脳波から抽出した相互相関係数を,感性特徴量として用いる.感性特徴量と画像特徴量を組み合わせて画像を検索することで,ユーザの感性に適合した検索結果を提示することを目標とする.
- (キーワード)
- 脳波 (electroencephalogram) / フィルタリング (filtering) / 情報検索 (information retrieval) / 感性的画像検索 / 情報検索システム (information retrieval system)
言語情報と韻律情報を用いた音声からの感情識別,
日本音響学会研究発表会講演論文集, 285-288, 2011年9月. 李 楊, 松本 和幸, 北 研二, 任 福継 :
日中機械翻訳のためのスーパー関数抽出における対訳辞書自動構築,
第10回情報科学技術フォーラム講演論文集, Vol.2, 221-222, 2011年9月.- (要約)
- 本研究ではスーパー関数を用いた日英機械翻訳の利点と問題点を考察し,スーパー関数に基づく機械翻訳を用いて日中機械翻訳システムの試作を行う.また,新たに提案したSFの変数の拡張についても述べる.提案手法では変数となる品詞の種類が多くなるため,訳語を適切に選択するために,参照する単語辞書の自動作成手法を提案する.最後に,提案手法による自動翻訳実験を行い,スーパー関数に基づく日中機械翻訳の精度を向上するには,対象とする例文に応じた対訳単語辞書が必要であることを明らかにする.
- (キーワード)
- 機械翻訳 (machine translation) / スーパー関数 / 日中機械翻訳 / 訳語選択 / 辞書構築
用例間の類似度に基づく若者言葉の感情推定手法,
第10回情報科学技術フォーラム講演論文集, Vol.2, 281-284, 2011年9月.- (要約)
- 若者言葉は,既存の語の言い換えたものであったり,省略表現も多いが,複合的な意味を持つ語や,既存の概念には属さない語も多 い.こうした語のために,新語義を定義する必要があるが,その定義方法について未解決の問題が多い.我々の研究の目標は,若者言葉を含む文からの感情推定である.若者言葉を特徴として感情推定を行う際に,若者言葉を,その意味や用法,さらには感情などで分類することができれば感情推定の精度向上につながると考えられる.そこで,本稿では,若者言葉の用例に基づき,感情表現に関する情報を抽出することで,若者言葉の感情を推定する手法を提案する.
- (キーワード)
- 感情認識 / 感性コンピュータ (sentience computer) / 若者言葉
クラスタリングに基づくGMM学習法による話者のモデル構築,
電子情報通信学会技術研究報告, Vol.SP2011, 2011年7月. 大西 正志, 獅々堀 正幹, 北 研二 :
時系列アクティブ探索による類似音楽検索システムの改良,
第3回データ工学と情報マネジメントに関するフォーラム(DEIM2011), 2011年3月. 丸西 立起, 獅々堀 正幹, 北 研二 :
SIFT特徴量を用いた映像データに対する人物検索システムの開発,
第3回データ工学と情報マネジメントに関するフォーラム(DEIM2011), 2011年3月. 西野 裕一, 獅々堀 正幹, 北 研二 :
Earth Mover's Distanceを用いたSIFT特徴量に基づく類似画像検索手法,
第3回データ工学と情報マネジメントに関するフォーラム(DEIM2011), 2011年3月. 辻 紗千, 獅々堀 正幹, 北 研二 :
ハミングを入力とする類似音楽検索システムにおける自動採譜手法の検討,
第3回データ工学と情報マネジメントに関するフォーラム(DEIM2011), 2011年3月. 岸本 諭, 楠本 祐介, 多田 圭佑, 獅々堀 正幹, 北 研二 :
感性特徴と画像特徴の相関関係に関する研究,
電気関係学会四国支部連合大会講演論文集, 151, 2010年9月. 山川 義介, 北 研二 :
類似画像検索システム『SUDACHI』を用いた商品レコメンデーション,
第10回日本感性工学会大会, 2008年9月. 山川 義介, 北 研二 :
ECサイトにおける画像の類似性判定∼『SUDACHI』の開発と商品推薦エンジンへの応用∼,
日本行動計量学会第36回大会, 5-6, 2008年8月. 北條 奈緒美, 獅々堀 正幹, 北 研二 :
WWW検索エンジンを用いた質問文内の用語特定手法,
平成19年度電気関係学会四国支部連合大会, 246, 2007年9月. 中出 訓規, 獅々堀 正幹, 柘植 覚, 北 研二 :
関連語を用いたWWW検索結果のフィルタリング手法,
平成19年度電気関係学会四国支部連合大会, 247, 2007年9月. 柘植 覚, 清田 啓二, 獅々堀 正幹, 北 研二, 任 福継, 福見 稔, 黒岩 眞吾 :
音声認識精度を変動させる話者内音声変動の要因分析,
日本音響学会 春季研究発表会, 165-166, 2007年3月. 柘植 覚, 小澤 光広, 獅々堀 正幹, 福見 稔, 任 福継, 北 研二, 黒岩 眞吾 :
特定話者長期間音声データベースの構築,
日本音響学会2006年秋季研究発表会, 277-278, 2006年9月. 柘植 覚, 獅々堀 正幹, 任 福継, 北 研二, 黒岩 眞吾 :
特定話者音声認識における精度変動要因の分析,
日本音響学会 春季研究発表会, 157-158, 2006年3月. 宮城 暖, 小泉 大地, 獅々堀 正幹, 柘植 覚, 北 研二 :
WWW検索システムにおける分野別URLデータベースを用いたナイーブ・ベイズ選定手法,
言語処理学会第12回年次大会, 652-655, 2006年3月. 竹安 真紀夫, 獅々堀 正幹, 柘植 覚, 北 研二 :
WWW画像検索システムにおける再検索型検索質問拡張に基づくフィードバック検索,
言語処理学会第12回年次大会, 785-788, 2006年3月. 柘植 覚, 獅々堀 正幹, 任 福継, 北 研二, 黒岩 眞吾 :
長・短期間の話者内音声変動による音声認識率の変化抑制法に関する検討,
日本音響学会 春季研究発表会, 221-222, 2005年9月. 大西 泰代, 獅々堀 正幹, 柘植 覚, 北 研二 :
距離尺度にEarth Mover's Distanceを用いたハミングによる類似音楽検索手法,
FIT2005, 271-272, 2005年9月. 小泉 大地, 獅々堀 正幹, 中川 嘉之, 柘植 覚, 北 研二 :
WWW画像検索システムにおける有害画像フィルタリング手法,
FIT2005, 45-46, 2005年9月. 獅々堀 正幹, 柘植 覚, 北 研二 :
WWW画像検索システムにおける検索質問拡張に基づくフィードバック検索,
FIT2005, 43-44, 2005年9月. 柘植 覚, 獅々堀 正幹, 北 研二, 任 福継, 黒岩 眞吾 :
長·短期間における音声の話者内変動に関する検討,
日本音響学会 春季研究発表会, 129-130, 2005年3月. 小泉 大地, 大西 正裕, 柘植 覚, 獅々堀 正幹, 北 研二 :
言語メタデータに基づく画像コンテンツの検索,
言語処理学会第11回年次大会, 2005年3月. 柘植 覚, 原 一眞, 北 研二, 黒岩 眞吾 :
分散型音声認識のための複数参照ケプストラムを持つBlind Equalizationの検討,
日本音響学会 春季研究発表会, 169-170, 2004年3月. 北 研二, 獅々堀 正幹, 岩田 稔久 :
写真特徴に基づく顔画像検索,
日本鑑識科学技術学会誌, Vol.8, No.Supplement, 153, 2003年11月. 原 一眞, 柘植 覚, 獅々堀 正幹, 北 研二, 黒岩 眞吾 :
実時間分散正規化手法の検討,
日本音響学会 秋季研究発表会, 151-152, 2003年9月. 柘植 覚, 原 一眞, 北 研二, 黒岩 眞吾 :
分散型音声認識のための実時間周波数特性正規化手法,
日本音響学会 秋季研究発表会, 111-112, 2003年9月. 光宗 朋宏, 柘植 覚, 黒岩 眞吾, 獅々堀 正幹, 北 研二 :
話者情報を用いた映像検索システム,
情報科学技術フォーラム(FIT)2003, 261-262, 2003年9月. 柘植 覚, 原 一眞, 黒岩 眞吾, 北 研二 :
日本語音声コーパスを用いたETSI STQ DSR Advanced Front-endの評価,
日本音響学会 春季研究発表会, 57-58, 2003年3月. 井内 厚志, 柘植 覚, 黒岩 眞吾, 北 研二 :
発話様式の変動に頑健な音声認識に関する研究,
平成14年度電気関連学会四国支部連合大会, 303, 2002年10月. 原 一眞, 柘植 覚, 黒岩 眞吾, 北 研二 :
判別分析手法を用いた音声認識精度向上に関する研究,
平成14年度電気関連学会四国支部連合大会, 302, 2002年10月. 柘植 覚, 黒岩 眞吾, 北 研二 :
ETSI標準分散音声認識フロントエンドのための回線特性正規化手法,
日本音響学会 秋季研究発表会, 117-118, 2002年9月. 柘植 覚, 黒岩 眞吾, 北 研二 :
ETSI標準分散音声認識フロントエイドのための回線特性正規化手法,
日本音響学会2002年秋季研究発表会, 117-118, 2002年9月. 柘植 覚, 黒岩 眞吾, 任 福継, 北 研二 :
ETSI標準分散音声認識フロントエンドを用いた音声認識実験,
日本音響学会 春季研究発表会, 171-172, 2002年3月. 柘植 覚, 黒岩 眞吾, 任 福継, 北 研二 :
音素依存線形判別分析の検討,
日本音響学会 秋季研究発表会, 177-178, 2001年10月. Paliwal Kuldip, 柘植 覚, Singer Harald, 深田 俊明, 北 研二 :
自然発話音声認識における音響分析の比較,
日本音響学会 秋季 研究発表会, 5-6, 1997年9月. 北 研二, 尾本 貴志, 福井 義和, 矢野 米雄 :
一般化相互情報量を用いた日本語形態素解析の予備検討,
平成5年度電気関係学会四国支部連合大会, 303, 1993年10月. 北 研二, 芦辺 和彦, 矢野 米雄 :
逆文法のLR状態遷移表を用いた構文制-One-Pass DP連続音声認識アルゴリズム,
平成5年度電気関係学会四国支部連合大会, 302, 1993年10月.
- 研究会・報告書
- 大賀 亮汰, 松本 和幸, 吉田 稔, 北 研二 :
ニコニコデータセットを用いた視聴者の感情を考慮した動画推薦アルゴリズムの提案,
IDRユーザフォーラム 2022, 2022年12月.- (キーワード)
- 自然言語処理 (natural language processing) / 人工知能 (artificial intelligence) / 分類 (classification) / 深層学習 (deep learning)
個性を反映した対話モデルにおける発話文の感情及び性格推定,
信学技報, 34-38, 2022年10月.- (要約)
- 人間がAIとより親しみのある対話をするための要素の一つとして個性が挙げられる.AIに必要とされる個性は場面や状況によって異なるので,対話する相手に応じて個性を切り替えられるような仕組みが求められる.本研究では日本語Transformer Encoder-decoder対話モデル(japanese-dialog-transformers)を使用し,インタビュー対話データでファインチューニングすることで,対象となる人物の個性を反映した対話モデルの構築を目指す.提案する対話モデルから出力される発話文をMBTI推定モデルや感情分析モデルによって分析することで性格の一貫性の評価及び対話モデル間の差異や共通点について考察する.
- (キーワード)
- インタビュー対話 / 個性 / 性格推定 / 対話モデル / 感情分析
ビット演算に基づく高速な音声ドキュメント検索語検出,
第8回音声ドキュメント処理ワークショップ, 2014年3月. 北 研二, 肖 清梅 :
オーディオ指紋検索に適した高速なハミング空間検索,
情報処理学会音楽情報科学研究会, 2011年5月. 柘植 覚, 三好 真人, 肖 清梅, 北 研二 :
フィルタバンク特徴量とEarth Mover's Distanceを用いた音楽検索,
情報処理学会音楽情報科学研究会, 2011年2月. 山本 一晴, 獅々堀 正幹, 柘植 覚, 北 研二 :
出現URLの類似性に着目したWWW空間からの関連語自動収集手法,
情報処理学会研究報告, No.2005-NL-170, 127-134, 2005年11月. 竹安 真紀夫, 獅々堀 正幹, 柘植 覚, 北 研二 :
WWW画像検索システムを用いた関連語の自動収集手法,
情報処理学会研究報告, No.2005-NL-170, 45-51, 2005年11月. 小泉 大地, 大西 正裕, 柘植 覚, 獅々堀 正幹, 北 研二 :
画像領域に対する言語メタデータ自動付与手法,
画像の認識・理解シンポジウム(MIRU2005), 1436-1441, 2005年7月. 西川 伸紀, 獅々堀 正幹, 柘植 覚, 北 研二 :
検索質問と字幕との文字画像特徴量間の距離に基づく映像シーン検索手法,
画像の認識・理解シンポジウム(MIRU2005), 707-714, 2005年7月. 柘植 覚, 黒岩 眞吾, 原 一眞, 北 研二 :
周波数特性の変動に頑健な実時間分散音声認識手法,
音声言語情報処理研究会, Vol.49, No.3, 13-18, 2003年12月. 大谷 貴志, 柘植 覚, 獅々堀 正幹, 北 研二 :
HTML形式の表構造の内容解析手法とその応用に関する研究,
自然言語処理学会 研究報告, 137-144, 2003年3月. 好田 勲, 柘植 覚, 獅々堀 正幹, 北 研二 :
Non-negative Matrix Factorization を用いた情報検索モデルの次元圧縮および検索質問拡張,
自然言語処理学会 研究報告, 17-22, 2003年3月. 黒岩 眞吾, 柘植 覚, 田仁 宏典, Tai Xiaoying, 獅々堀 正幹, 北 研二 :
Simple PCAを用いたベクトル空間情報検索モデルの次元削減,
電子情報通信学会技術報告, Vol.NLC2001-17, 61-66, 2001年7月. 柘植 覚, 獅々堀 正幹, 北 研二 :
Non-negative Matrix Factorization を用いた情報検索,
情報処理学会研究報告, Vol.NL142, No.1, 1-6, 2001年3月. 柘植 覚, 獅々堀 正幹, 北 研二 :
サポートベクターマシンによる適合性フィードバックを用いた情報検索,
情報処理学会研究報告, Vol.NL141, No.14, 83-88, 2001年1月. 辻井 潤一, 金沢 誠, 石崎 雅人, 伝 康晴, 北 研二, 徳永 健伸 :
【座談会】言語と計算をめぐって,
UP, Vol.28, No.12, 1-16, 1999年12月. 北 研二 :
意味空間への情報マッピングに基づくクロスメディア検索に関する研究,
2005∼2008年度科学研究費補助金研究成果報告書(基盤研究(B)), 2009年5月. 黒岩 眞吾, 北 研二, 任 福継, 柘植 覚 :
分散型話者照合方式に関する研究,
平成14年度∼平成16年度科学研究費補助金(基盤研究(B)(2))研究成果報告書, Vol.14350204, 1-227, 2005年5月.
- 特許
- 北 研二, 柘植 覚, 武田 一哉, 渡邉 恵理子 : ハミング空間検索装置,ハミング空間検索方法,ハミング空間検索プログラムおよび記録媒体, 特許第5599363号 (2012年8月). Nagai Akito and Kenji Kita : SPEECH PROCESSING USING AN EXPANDED LEFT TO RIGHT PARSER, 6,058,365 (May 2000). 北 研二, 増川 佐知子 : 画像処理装置, 特願P2020-129514 (2020年7月), 特許第P6860254号 (2021年3月). 北 研二, 柘植 覚 : ハミング空間検索装置,ハミング空間検索方法,ハミング空間検索プログラムおよび記録媒体, 特願P2014-168401 (2014年8月), 特開P2014-238884A (2014年12月), 特許第JP6031475B号 (2016年11月). 獅々堀 正幹, 北 研二, 柘植 覚 : 類似音楽検索装置,類似音楽検索方法,類似音楽検索プログラム及びコンピュータで読み取り可能な記録媒体, 特願2007-175607 (2007年7月), 特許第2007-175607号 (2007年7月). 獅々堀 正幹, 北 研二 : クライアントデータベース構築方法,データ検索方法,データ検索システム,データ検索フィルタリングシステム,クライアントデータベース構築プログラム,データ検索プログラム,データ検索フィルタリングプログラム及びプログラムを格納したコンピュータで読み取り可能な記録媒体並びに記録した機器, 特願2006-071844 (2006年3月), 特許第2006-071844号 (2006年3月). 北 研二, 幸山 秀雄 : 情報検索方法,情報検索装置,情報検索プログラム及びコンピュータで読み取り可能な記録媒体並びに記録した機器, 特願2004-352080 (2004年12月), 特許第2004-352080号 (2004年12月). 持橋 大地, 北 研二, 菊井 玄一郎 : データ検索方法及びコンピュータプログラム, 特願2004-210243 (2004年7月), 特許第2004-210243号 (2004年7月). Kenji Kita, Masami Shishibori and Shunichiro Oe : Method for retrieving data, apparatus for retrieving data, program for retrieving data, and medium readable by machine, US20050086210A1 (Mar. 2004), US20050086210A1 (Mar. 2004). 北 研二, 獅々堀 正幹, 大恵 俊一郎 : データ検索方法,データ検索装置,データ検索プログラムおよびコンピュータで読み取り可能な記録媒体, 特願2003-174078 (2003年6月), 特許第2003-174078号 (2003年6月). 北 研二, 獅々堀 正幹 : データマッチング方法,データマッチング装置,データマッチングプログラムおよびコンピュータで読み取り可能な記録媒体, 特願2002-204306 (2002年7月), 特許第2002-204306号 (2002年7月). 永井 明人, 北 研二, 嵯峨山 茂樹 : 連続音声認識装置, (1990年11月), (1992年6月), 特許第1874952号 (1994年9月). 坂野 俊哉, 北 研二 : 音声認識候補絞り込み方式, 特願003991 (1990年1月), 特開208098 (1991年9月), 特許第2120567号 (1996年3月). 北 研二, 川端 豪, 森元 逞 : 音声認識装置におけるビーム制御方式, 特願121945 (1989年), 特許第1915563号 (1995年7月). 北 研二, 川端 豪, 斎藤 博昭 : 連続音声認識装置, 特願266472 (1988年), 特許第1917600号 (1995年3月).
- 作品
- 研究者総覧に該当データはありませんでした。
- 補助金・競争的資金
- 数値および専門性と話題性に着目したSNSからの科学的知識抽出に関する研究 (研究課題/領域番号: 21K12141 )
異なるコミュニティにおいて誤解されやすい表現の感性的言語変換に関する研究 (研究課題/領域番号: 20K12027 )
言語と非言語の混在するWWW上の生活習慣・健康情報の統合的解析 (研究課題/領域番号: 18K11549 )
WWW上の医療・健康情報マッチングのための統合的メディア解析 (研究課題/領域番号: 15K00425 )
画像検索技術を用いた習字教育支援システムの開発 (研究課題/領域番号: 24501136 )
ロボットの心の創造・開発・介護ロボットへの応用 (研究課題/領域番号: 22240021 )
教育用映像素材に対する字幕検索システムの開発 (研究課題/領域番号: 21500940 )
脳波に基づく生体情報を利用した意味的・感性的マルチメディア検索に関する研究 (研究課題/領域番号: 21300036 )
拡張サフィックス・アレイを用いた語学学習用作文支援システムに関する研究 (研究課題/領域番号: 20650143 )
統計的手法を用いた知識情報モデルに基づく知的信号処理手法に関する研究 (研究課題/領域番号: 17656128 )
映像解析技術を用いたプレゼン映像資料に対する全文検索システムの開発 (研究課題/領域番号: 17500644 )
時期差・時間差・気分による音声変動の解明と分散型話者認識への応用に関する研究 (研究課題/領域番号: 17300065 )
意味空間への情報マッピングに基づくクロスメディア検索に関する研究 (研究課題/領域番号: 17300036 )
意味共起関係を利用した感情表現の解析法と感性情報検索への応用に関する研究 (研究課題/領域番号: 15300072 )
スーパー関数とコーパス知能化技術に基づく英作文支援システムに関する研究 (研究課題/領域番号: 14380166 )
分散型話者照合方式に関する研究 (研究課題/領域番号: 14350204 )
自然言語処理技術を用いた理科教授学習システムに関する研究 (研究課題/領域番号: 14022237 )
インターネット画像検索のための進化的ニューラルネットへの知識埋込と抽出 (研究課題/領域番号: 13680448 )
文字クラスに基づいた言語モデルとその汎用日本語形態素解析への応用に関する研究 (研究課題/領域番号: 10680383 )
文書量に依存しない高速n-gram全文検索法の実現と大規模文書への応用 (研究課題/領域番号: 10480082 )
双方向探索に基づく高精度音声認識に関する研究 (研究課題/領域番号: 07680401 )
確率・統計的手法による対話のモデル化とコーパスからの自動生成に関する研究 (研究課題/領域番号: 07221209 )
統計的言語情報を用いた音声認識の精度向上に関する研究 (研究課題/領域番号: 05780292 )
音声認識・合成と人工知能技術を用いた英会話用環境型知的CAIシステムの試作 (研究課題/領域番号: 05558015 )
研究者番号(10243734)による検索
- その他
- 研究者総覧に該当データはありませんでした。
2024年11月15日更新
- 専門分野・研究分野
- 計算機科学 (Computer Science)
情報工学 (Information Engineering)
情報検索 (Information Retrieval)
自然言語処理 (Natural Language Processing)
音声言語処理
メディア情報学 - 所属学会・所属協会
- 情報処理学会
電子情報通信学会
言語処理学会
国際計算言語学会 - 委員歴・役員歴
- 情報処理学会 (四国支部長 [2006年5月〜2008年5月], 四国支部監事 [2008年5月〜2010年5月], 四国支部評議員 [2003年5月〜2005年5月], 代表会員 [2006年4月〜2010年3月])
電子情報通信学会 (論文誌査読委員 [1995年5月], 言語理解とコミュニケーション研究専門委員会専門委員 [1997年5月], ヒューマンコミュニケーショングループ編集幹事 [2004年5月〜2006年5月], 著作権管理委員会委員 [2004年5月〜2006年5月])
言語処理学会 (評議員 [1998年4月〜1999年3月], 査読委員 [1999年4月], 編集委員 [1995年4月]) - 受賞
- 1990年4月, 研究開発賞 (国際電気通信基礎技術研究所)
1993年4月, 注目発明 (科学技術庁)
1994年5月, 技術開発賞 (日本音響学会)
2002年3月, ソフトウェアコンテスト優秀賞 (情報処理学会四国支部)
2007年3月, 源内大賞 (財団法人エレキテル尾崎財団)
2007年7月, データ工学ワークショップ優秀論文賞 (電子情報通信学会)
2016年9月, Best Paper Award of the 2nd INTERNATIONAL CONFERENCE ON SOFT COMPUTING IN DATA SCIENCE 2016 (The 2nd INTERNATIONAL CONFERENCE ON SOFT COMPUTING IN DATA SCIENCE 2016)
2016年12月, Best Paper Award of The 11th International Conference on Natural Language Processing and Knowledge Engineering
2018年8月, 2nd Technological Competency as Caring in the Health Sciences 2018 Poster Presentation Award
2018年11月, IDRユーザーフォーラム2018 ドワンゴ賞 (国立情報学研究所)
2019年9月, Best Presentation Award (2019 International Conference on Natural Language Processing(ICNLP2019)) - 活動
- 国立国語研究所 (非常勤研究員 [1999年10月〜2000年3月])
国際電気通信基礎技術研究所·音声言語コミュニケーション研究所 (客員研究員 [2002年6月〜2005年3月])
独立行政法人日本学術振興会 (科学研究費委員会専門委員 [2006年1月〜12月])
独立行政法人日本学術振興会 (科学研究費委員会専門委員 [2009年12月〜2010年11月])
大阪大学サイバーメディアセンター (大阪大学サイバーメディアセンター運営委員会委員 [2008年4月〜2010年3月])
2024年11月10日更新
2024年11月9日更新
Jグローバル
- Jグローバル最終確認日
- 2024/11/9 01:20
- 氏名(漢字)
- 北 研二
- 氏名(フリガナ)
- キタ ケンジ
- 氏名(英字)
- Kita Kenji
- 所属機関
- 徳島大学 教授
リサーチマップ
- researchmap最終確認日
- 2024/11/10 01:30
- 氏名(漢字)
- 北 研二
- 氏名(フリガナ)
- キタ ケンジ
- 氏名(英字)
- Kita Kenji
- プロフィール
- リサーチマップAPIで取得できませんでした。
- 登録日時
- 2002/7/4 00:00
- 更新日時
- 2024/9/24 11:58
- アバター画像URI
- https://researchmap.jp/K_Kita/avatar.jpg
- ハンドル
- リサーチマップAPIで取得できませんでした。
- eメール
- リサーチマップAPIで取得できませんでした。
- eメール(その他)
- リサーチマップAPIで取得できませんでした。
- 携帯メール
- リサーチマップAPIで取得できませんでした。
- 性別
- リサーチマップAPIで取得できませんでした。
- 没年月日
- リサーチマップAPIで取得できませんでした。
- 所属ID
- 0344015000
- 所属
- 徳島大学
- 部署
- 大学院社会産業理工学研究部
- 職名
- 教授
- 学位
- 博士(工学)
- 学位授与機関
- 早稲田大学
- URL
- リサーチマップAPIで取得できませんでした。
- 科研費研究者番号
- リサーチマップAPIで取得できませんでした。
- Google Analytics ID
- リサーチマップAPIで取得できませんでした。
- ORCID ID
- リサーチマップAPIで取得できませんでした。
- その他の所属ID
- リサーチマップAPIで取得できませんでした。
- その他の所属名
- リサーチマップAPIで取得できませんでした。
- その他の所属 部署
- リサーチマップAPIで取得できませんでした。
- その他の所属 職名
- リサーチマップAPIで取得できませんでした。
- 最近のエントリー
- リサーチマップAPIで取得できませんでした。
- Read会員ID
- リサーチマップAPIで取得できませんでした。
- 経歴
- 受賞
- Misc
- 論文
- 講演・口頭発表等
- 書籍等出版物
- 研究キーワード
- 研究分野
- 所属学協会
- 担当経験のある科目
- その他
- リサーチマップAPIで取得できませんでした。
- Works
- 特許
- 学歴
- 委員歴
- 社会貢献活動
- リサーチマップAPIで取得できませんでした。
2024年11月9日更新
- 研究者番号
- 10243734
- 所属(現在)
- KAKEN APIで取得できませんでした。
- 所属(過去の研究課題
情報に基づく)*注記 - 2017/4/1 – 2022/4/1 : 徳島大学, 大学院社会産業理工学研究部(理工学域), 教授
2016/4/1 : 徳島大学, 大学院理工学研究部, 教授
2012/4/1 – 2015/4/1 : 徳島大学, ソシオテクノサイエンス研究部, 教授
2014/4/1 : 徳島大学, 大学院ソシオテクノサイエンス研究部, 教授
2010/4/1 – 2011/4/1 : 徳島大学, 大学院・ソシオテクノサイエンス研究部, 教授
2002/4/1 – 2009/4/1 : 徳島大学, 高度情報化基盤センター, 教授
2007/4/1 : 徳島大学, 高度情報基盤センター, 教授
2004/4/1 : 徳島大学, 高度情報基盤処理センター, 教授
2003/4/1 : 徳島大学, 工学部, 教授
2003/4/1 : 徳島大学, 高度情報化基盤処理センター, 教授
2000/4/1 – 2001/4/1 : 徳島大学, 工学部, 教授
1993/4/1 – 1999/4/1 : 徳島大学, 工学部, 助教授
- 審査区分/研究分野
-
研究代表者
複合領域 / 情報科学 / 知能情報学
総合・新領域系 / 総合領域 / 情報学 / メディア情報学・データベース
総合・新領域系 / 総合領域 / 科学教育・教育工学 / 教育工学
総合系 / 情報学 / 情報学フロンティア / ウェブ情報学・サービス情報学研究代表者以外
総合・新領域系 / 総合領域 / 情報学 / 知覚情報処理・知能ロボティクス
理工系 / 工学 / 電気電子工学 / 通信・ネットワーク工学
総合・新領域系 / 総合領域 / 科学教育・教育工学 / 教育工学
総合・新領域系 / 総合領域 / 情報学 / 感性情報学・ソフトコンピューティング
複合領域 / 科学教育・教科教育学 / 教育工学
複合領域 / 情報科学 / 情報システム学(含情報図書館学)
複合領域 / 情報科学 / 知能情報学
工学 / 電気電子工学 / 情報通信工学
人文・社会系
小区分62020:ウェブ情報学およびサービス情報学関連
小区分61060:感性情報学関連
- キーワード
-
研究代表者
音声認識 / 確率・統計的言語モデル / 確率文脈自由文法 / 生成規則のマルコフ連鎖 / コーパス / 定型表現 / 相互情報量 / 仕事量基準 / 対話モデル / 隠れマルコフモデル / 状態マージング / ALERGIAアルゴリズム / オートマトン / 発話行為タイプ / 情報検索 / マルチメディア / クロスメディア / 情報システム / 機械学習 / 教育工学 / 外国語学習 / サフィックス・アレイ / 脳波情報 / 双方向探索 / One-Passアルゴリズム / 音響モデル / 言語モデル / 有限オートマトン / speech recognition / bi-directional search / hidden Markov model / one-pass algorithm / acoustic model / language model / finite-state automaton / context-free grammar / 自然言語処理 / 日本語処理 / 形態素解析 / 単語分割 / 確率的言語モデル / PPM^*モデル / 文字クラス / クラスタリング / PPMモデル / natural language processing / Japanese language processing / morphological analysis / word segmentation / probabilistic language model / PPM* model / character class / clustering / ウェブインテリジェンス / 医療・健康情報 / 事実性解析 / ソーシャルメディア / テキストの事実性解析 / ディープラーニング / テキストからの位置推定
研究代表者以外
自然言語理解 / 教授学習システム / 音声合成技術 / コーパス / スーパー関数 / 教授戦略 / 理科 / IT / 音声学 / 話者認識 / 話者識別 / 話者照合 / 音声データベース / 分散型音声認識 / 分散型話者認識 / 分散型話者照合 / 音声変動 / 音声認識 / 音声合成 / 知的信号処理 / 認知科学 / HMM音声合成 / 帯域拡張 / 音声強調 / パケットロス / 教材情報システム / 字幕認識 / 字幕検索 / 映像検索 / 映像処理 / 情報検索 / マルチメディア / 人工知能 / 知能ロボティックス / 感性情報処理 / 情報システム / 言語理解 / 感情計算 / 心的状態遷移ネットワーク / 感情ロボット / 感情情報処理 / 心状態遷移ネットワーク / 感情コーパス / 感情分類 / 言語 / 音声 / 顔表情 / 感情認知 / ロボットの心の創造 / 心のモデル化 / 感情認識 / 感情状態 / 介護ロボット / 感情創生 / 感情表出 / 教育支援システム / 画像処理 / 知識処理 / 教育工学 / 画像解析 / 環境型知的CAI / 英会話学習 / 知識獲得 / 会話シミュレーション / 誘導戦略 / ロールプレイング / 動機つけ / 動機付け / 環境型知的CAI, / 英会話教育 / 対話シミュレーション / ナビゲーション / ゲーム形式 / スキル獲得 / Environmental ICAI / English conversation learning / multimedia / skill acquisition / dialogue simulation / navigation strategy / role-playing / motivation / 文書データベース / 検索手法 / キーワード検索 / 文書検索 / 文書データ / 全文検索 / Text database / Retrieval method / Keyword Search / test retrieval / ニューラルネットワーク / 進化手法 / ルール抽出 / 画像 / 知識抽出 / 画像検索 / 学習 / インターネット / 進化的アルゴリズム / Neural Network / Evolutionary Method / Rule Extraction / Image / Knowledge Extraction / Image Retrieval / Learning / Internet / Earth Mover's Distance / ノンパラメトリックモデル / 回線適応 / 音声信号処理 / ノンパラメトリック / セグメント量子化 / 判別分析 / 回線特性正規化 / 時期差 / Speaker Recognition / Speech Database / Distributed Speech Recognition / Distributed Speaker Verification / Nonparametric Modeling / Telephone- Channel Adaptation / Speech Signal Processing / 機械翻訳 / 知識システム / コーパス知能化 / 作文支援システム / 連想 / 知能化 / 関連 / Machine Translation / Information Retrieval / Knowledge System / Intellectual Corpus / Super-Function / Machine-Aided Writing System / Artificial Intelligence / Association / 意味共起 / 感情表現 / 感性情報検索 / 音声対話 / 対話理解 / 自然言語処理 / Semantic collocation / emotion expression / Retrieval for sensibility information / speech dialogue / dialogue understanding / Processing of natural language / プレゼン資料 / プレゼン映像 / e-learning / 映像解析 / 講義資料 / 講義映像 / 映像配信 / Presentation document / Presentation Movie / Video processing / Information retrieval / Full text search / テキスト中の数値表現 / 健康情報検索 / 数値情報解析 / 健康情報解析 / SNS解析 / テキストマイニング / 健康情報 / グラウンディング / 生活習慣分析 / 食事画像分類 / 文書構造解析 / テキスト中の数値解析 / 画像分類 / 健康情報抽出 / 感性言語モデル / 感性的言語変換 / 感性表現 / 言語モデル / 分散表現 / 感性ロボティクス / ミスコミュニケーション / SNS分析 / 画像とテキストの関連分析 / 用語抽出