研究者を探す
吉田 稔
2024年12月20日更新
- 職名
- 講師
- 電話
- 088-656-9689
- 電子メール
- mino@is.tokushima-u.ac.jp
- 学歴
- 研究者総覧に該当データはありませんでした。
- 学位
- 博士(理学) (東京大学) (2003年3月)
- 職歴・経歴
- 2013/4: 徳島大学 講師, 大学院ソシオテクノサイエンス研究部 (-2016.3.)
2016/4: 徳島大学 講師, 大学院理工学研究部 (-2017.3.)
2017/4: 徳島大学 講師, 大学院社会産業理工学研究部
- 専門分野・研究分野
- 情報通信 (Informatics) [知能情報学 (Intelligent informatics)]
2024年12月20日更新
- 専門分野・研究分野
- 情報通信 (Informatics) [知能情報学 (Intelligent informatics)]
- 担当経験のある授業科目
- STEM演習 (学部)
オリエンテーション1年 (学部)
オートマトン (学部)
オートマトン・言語理論 (学部)
ソフトウェア設計及び実験 (学部)
情報数学 (学部)
機械学習 (学部)
理工学特別実習 (大学院)
知能情報システム特別輪講 (大学院)
知能情報概論 (学部)
自然言語処理 (学部)
言語モデル論 (大学院) - 指導経験
- 39人 (学士), 17人 (修士), 4人 (博士)
2024年12月20日更新
- 専門分野・研究分野
- 情報通信 (Informatics) [知能情報学 (Intelligent informatics)]
- 研究テーマ
- 研究者総覧に該当データはありませんでした。
- 著書
- 北 研二, 松本 和幸, 吉田 稔, 獅々堀 正幹, 大野 将樹 :
AI・機械学習のためのデータ前処理 [実践編], --- Pythonでデータサイエンス ---,
科学情報出版, 東京, 2021年8月.- (要約)
- 人工知能(AI)の研究自体は,計算機の黎明期のころから行われてきた.1950年代後半から60年代にかけての「第1次人工知能ブーム」,1980年代から90年代にかけての「第2次人工知能ブーム」とよばれる時期を経て,現在は「第3次人工知能ブーム」の真っただ中である.今回の第3次ブームが,従来の第1次および第2次のブームと大きく違うところは,多くの分野で,人間の能力に迫る知的情報処理システムが出現しているところにある.この背景には,さまざまなことが考えられるが,最も大きな要因は,各種のビッグデータの蓄積とそのビッグデータを利用可能とするIT技術の加速度的な進展,深層学習を始めとする新しい機械学習パラダイムの出現であろう.さて,AIシステムや機械学習システムを成功に導く鍵の1つがデータの前処理である.機械学習の本質は,大量のデータの背後に潜む構造や規則性あるいは普遍性を学習することにより,未知のデータに対する予測や推論を正しく行うところにある.しかし,学習の元となるデータの品質が悪いと,正しく学習することができず,その結果として得られるシステムの精度も芳しくなくなる.高精度なシステムを構築するためには,粗悪なデータを排除するとともに,データを加工し学習しやすい形に変換するという工程が重要となる.これこそがまさしく前処理が担っている部分である.極論すると,前処理の成否が機械学習システム全体の品質を担保しているとさえいえる.一説によると,AIや機械学習システム構築の現場では,エンジニアが作業に携わる時間の6割∼8割はデータの収集と前処理に費やされているといわれている.効率的なシステム開発のためには,前処理技術の習得が必須である.本書は,従来の機械学習やデータサイエンスの書籍では十分に扱われていなかった前処理技術に特に焦点をあて,技術の単なる解説だけではなく,実際に動くプログラムを通して,読者が理解できるような実践的な書を目指した.本書の姉妹編である『基礎編』では,基本的な前処理技術について紹介しているが,本書『応用編』では,さらに高度な前処理技術と,テキスト・画像・音響・音楽等のメディアデータに対する前処理技術について解説した.
- (キーワード)
- 人工知能 (artificial intelligence) / 機械学習 (machine learning) / Python / 前処理 / データ解析 (data analysis) / データマイニング (data mining) / Google Colab / ビッグデータ / 特徴選択 / 次元削減 / NumPy / pandas / scikit-learn / matplotlib / TensorFlow / Keras / データクリーニング / 特徴抽出 / スケーリング / 標準化 / ノーマライゼーション (normalization) / 正規化 / データクレンジング / データ拡張 / ビニング / 離散化 / カテゴリカルデータ / カテゴリ特徴量 / One-hotエンコーディング / One-hotベクトル / ラベルエンコーディング / 頻度エンコーディング / カウントエンコーディング / 順位エンコーディング / ラベルカウントエンコーディング / 特徴量ハッシング / 大局的ハッシュ空間 / 列ごとのハッシュ空間 / MurmurHash3 / エンティティ埋め込み / 分散表現 / 埋め込み / Table2Vec / 不均衡データ / リサンプリング / アンダーサンプリング / ダウンサンプリング / オーバーサンプリング / アップサンプリング / ランダム・オーバーサンプリング / ランダム・アンダーサンプリング / ENN / SMOTE / ADASYN / 時系列データ / 点過程 / 窓付き統計値 / 青空文庫 / 分かち書き / 形態素解析 (morphological analysis) / MeCab / バイグラム / トライグラム / Nグラム / SentencePiece / ストップワード / ストップワードリスト / ベクトル空間モデル (vector space model) / Bag-of-Words / tf-idf / gensim / トピックモデル / 潜在ディリクレ配分法 / ギブスサンプリング / word2vec / スキップグラム / 連続Bag-of-Words / ネガティブサンプリング / 階層ソフトマックス法 / 畳み込みニューラルネットワーク / 順伝搬 / 活性化関数 / 逆誤差伝搬 / 2乗和誤差 / 交差エントロピー / エポック / 勾配降下法 / バッチ学習 / オンライン学習 / ミニバッチ学習 / 反復 (iteration) / 畳み込み層 / プーリング層 / 全結合層 / 特徴マップ / ゼロパディング / 最大プーリング / 平均プーリング / ドロップアウト層 / 確率的勾配降下法 / シアー変換 / ファインチューニング / VGG16 / サンプリング周波数 / 量子化ビット数 / カクテルパーティー効果 / スペクトルサブトラクション / 調波打楽器音分離 / 短時間フーリエ変換 / 逆短時間フーリエ変換 / ウィナーフィルタ / 音源分離
Mining Numbers in Text: A Survey,
IntechOpen, Jul. 2021.- (出版サイトへのリンク)
- ● Publication site (DOI): 10.5772/intechopen.98540
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.5772/intechopen.98540
(DOI: 10.5772/intechopen.98540) Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Analysis of Information Spreading by Social Media based on Emotion and Empathy,
InTechOpen, Sep. 2019.- (要約)
- The number of social media users has increased exponentially in recent times,and various types of social media platforms are being introduced. While socialmedia has become a convenient communication tool, its use has caused varioussocial problems. Some users who cannot imagine the emotions their posts mayinduce in readers cause what is termed as the flaming phenomenon. In somecases, users intentionally repeat strong remarks for self-advertisement. To identifythe cause of this phenomenon, it is necessary to analyze the posted contents or thepersonalities of the users who cause the flaming. However, it is difficult to reach ageneralized conclusion because each case varies depending on the circumstancesand individual. In this chapter, we study the phenomenon of information spreadingvia communication on social media by conducting a detailed analysis of replies andnumber of retweets in Japanese, and we reveal the relation between the feedback onsuch posts and the emotions or empathy they result in.
- (キーワード)
- social media / information diffusion / flaming / buzz / Twitter
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.5772/intechopen.88886
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.5772/intechopen.88886
(DOI: 10.5772/intechopen.88886) Kazuyuki Matsumoto, Hayato Shimizu, Minoru Yoshida and Kenji Kita :
Time-Series Analysis of Video Comments on Social Media,
Worlds largest Science, Technology & Medicine Open Access book publisher, Jul. 2017.- (要約)
- 本研究では,コメント数の時系列分析に着目し,コメントの多数の投稿による不正を検出する手法を提案する.多数のコメント投稿により不正にコメント数を稼ぐ動画のことを,本研究では不正動画と定義する.特に,我々の提案手法では,不正動画と人気動画のコメントの時系列分布の違いに着目する.評価結果として,我々の提案手法は,ベースライン手法よりも高い精度を得ることができた.
- (キーワード)
- video comments / shared videos / comment analysis, / time-series analysis
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.5772/intechopen.68636
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.5772/intechopen.68636
(DOI: 10.5772/intechopen.68636) Kazuyuki Matsumoto, Fuji Ren, Minoru Yoshida and Kenji Kita :
Refinement by Filtering Translation Candidates and Similarity Based Approach to Expand Emotion Tagged Corpus,
Jan. 2017.- (要約)
- テキストからの感情推定において,既存の日英の並列感情コーパスを用いて学習データを異なる言語に変換する方法を提案する.対訳辞書では,コーパスに含まれる各文の単語ごとに翻訳候補が抽出され,抽出された訳語候補を感情推定に大きく寄与する単語の集合に絞り込み,訓練データとして用いた.さらに,単語分散表現を用いて,タグ付けされていないテキストを利用してコーパス拡張を試みた.機械学習アルゴリズムを用いた評価実験の結果,拡張された感情コーパスの有効性を明らかにすることができた.
- (キーワード)
- 感情コーパス / 日英対訳コーパス / 感情推定
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-319-52758-1_15
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85011342735
(DOI: 10.1007/978-3-319-52758-1_15, Elsevier: Scopus) Minoru Yoshida, Torisawa Kentaro and Jun'ichi Tsujii :
Extracting Attributes and Their Values from Web Pages,
2003.- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1142/9789812775375_0010
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1142/9789812775375_0010
(DOI: 10.1142/9789812775375_0010) - 論文
- Keita Kiuchi, Hidehiro Umehara, Koushi Irizawa, XIN KANG, Masahito Nakataki, Minoru Yoshida, Shusuke Numata and Kazuyuki Matsumoto :
An Exploratory Study of the Potential of Online Counseling for University Students by a Human-Operated Avatar Counselor,
Healthcare, Vol.12, No.1287, 2024.- (要約)
- Recently, the use of digital technologies, such as avatars and virtual reality, has been increasingly explored to address university students mental health issues. However, there is limited research on the advantages and disadvantages of counselors using avatars in online video counseling. Herein, 25 university students were enrolled in a pilot online counseling session with a human counselor-controlled avatar, and asked about their emotional experiences and impressions of the avatar and to provide qualitative feedback on their communication experience. Positive emotions during the session were associated with impressions of the avatars intelligence and likeability. The anthropomorphism, animacy, likeability, and intelligent impressions of the avatar were interrelated, indicating that the avatars smile and the counselors expertise in empathy and approval may have contributed to these impressions. However, no associations were observed between participant experiences and their prior communication with avatars, or between participant experiences and their gender or the perceived gender of the avatar. Accordingly, recommendations for future practice and research are provided. Accumulating practical and empirical findings on the effectiveness of human-operated avatar counselors is crucial for addressing university students mental health issues.
- (キーワード)
- avatar counseling / human-operated avatars / university students / digital mental health / empathy / communication / anthropomorphism / animacy / likeability / perceived intelligence
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3390/healthcare12131287
- (文献検索サイトへのリンク)
- ● PubMed @ National Institutes of Health, US National Library of Medicine (PMID): 38998822
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85198398651
(DOI: 10.3390/healthcare12131287, PubMed: 38998822, Elsevier: Scopus) Zipaer Mayinuer, Minoru Yoshida, Kazuyuki Matsumoto and Kenji Kita :
Using Machine Learning to Classify Information Related to Child Rearing of Infants from Twitter,
Advances in Machine Learning & Artificial Intelligence, Vol.4, No.2, 32-40, 2023. Motonobu Yoshida, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
System to Correct Toxic Expression with BERT and to Determine the Effect of the Attention Value,
Communications in Computer and Information Science, Vol.1842, 239-253, 2023.- (要約)
- This paper describes an extended experiment on a system that converts sentences with toxic expressions into safe sentences, along with the evaluation and influence of the system. In recent years, toxicity on social media has created many problems. We evaluated the effectiveness of the proposed system for identifying toxic sentences using a prediction model based on Bidirectional Encoder Representations from Transformers (BERT) and then converting them into safe sentences using attention values and a score that indicates whether the sentences are appropriate after the predictive conversion. Six patterns of methods were tested, with Pattern 6 being the most effective for mitigating toxicity. This pattern is a technique that changes the way to take the top sentences of a beam search for each number of treatments, in addition to converting words with an attention value above a threshold and their adjacent words and phrases and words registered in the toxic dictionary. We used multiple indicators to judge the effectiveness of this method and evaluated its ability to make the text safe while preserving its meaning.
- (キーワード)
- Toxic expression / BERT / 分類 (classification) / Text correction / Attention value
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-031-43471-6_11
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85174230206
(DOI: 10.1007/978-3-031-43471-6_11, Elsevier: Scopus) Kazuyuki Matsumoto, Reishi Amitani, Minoru Yoshida and Kenji Kita :
Trend Prediction Based on Multi-Modal Affective Analysis from Social Networking Posts,
Electronics, Vol.11, No.21, 2022.- (要約)
- 本論文では,SNS上の投稿テキストや添付画像などのマルチモーダル情報を対象に,投稿内容から感情情報を分析し,バズや流行の発生のレベルを予測する手法を提案する.提案手法は,事前予測に用いる場合は投稿時の情報のみを用い,事後分析に用いる場合は時間誤差の情報を用いて,様々な角度から拡散スケールを分析することが可能である.具体的には,事前に学習させた汎用言語モデルBERTを用いてツイートと返信ツイートをベクトル化し,添付画像を学習させた画像認識用ニューラルネットワークモデルを用いて特徴ベクトルに変換する.また,投稿内容の感情情報を解析するために,独自の感情解析モデルを用いて,ツイート,返信ツイート,画像特徴から感情を推定し,感情特徴として入力に追加する.評価実験の結果,ツイートに言語特徴(BERTベクトル)と画像特徴を付加した提案手法は,単一特徴のみを用いた手法と比較して高い性能を達成することができた.感情特徴量の効果を明確に観測することはできなかったが,考察及び分析の結果,ツイートとその返信の一致する感情が多いほど,共感行動が発生し,いいねやRTの値が大きくなる傾向があり,結果的にツイートがバイラル化する可能性が高くなると考えられる.
- (キーワード)
- multi-modal buzz prediction / information diffusion / affective analysis
- (徳島大学機関リポジトリ)
- ● Metadata: 118006
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3390/electronics11213431
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.3390/electronics11213431
(徳島大学機関リポジトリ: 118006, DOI: 10.3390/electronics11213431) 宮下 翼, 松本 和幸, 吉田 稔, 西村 良太, 北 研二 :
糖尿病患者のブログに記述された生活習慣の抽出,
電気学会論文誌C (電子,情報,システム部門誌), Vol.142, No.10, 1144-1155, 2022年.- (要約)
- 本研究は難病患者の闘病活動における生活習慣の維持や管理を支援するシステムを構築するための一歩として,糖尿病患者の生活習慣(食事,睡眠,運動など)や病状(血圧,体調など)に関連したキーワードの抽出を目指す.糖尿病の闘病患者のブログデータを収集し,そこから双方向ゲート付きリカレントユニット(GRU)を用いて生活習慣や病状に関連したキーワードの自動抽出を行う.
- (キーワード)
- 闘病ブログ / 固有表現抽出 / 自然言語処理 (natural language processing)
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1541/ieejeiss.142.1144
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1390293633437552768
- ● Search Scopus @ Elsevier (DOI): 10.1541/ieejeiss.142.1144
(DOI: 10.1541/ieejeiss.142.1144, CiNii: 1390293633437552768) Kazuyuki Matsumoto, Takumi Matsunaga, Minoru Yoshida and Kenji Kita :
Emotional Similarity Word Embedding Model for Sentiment Analysis,
Computacion y Sistemas, Vol.26, No.2, 875-886, 2022.- (要約)
- We propose a method for constructing a dictionary of emotional expressions, which is an indispensable language resource for sentiment analysis in the Japanese. Furthermore, we propose a method for constructing a language model that reproduces emotional similarity between words, which to date has yet not been considered in conventional dictionaries and language models. In the proposed method, we pretrained sentiment labels for the distributed representations of words. An intermediate feature vector was obtained from the pre-trained model. By learning an additional semantic label on this feature vector, we can construct an emotional semantic language model that embeds both emotion and semantics. To confirm the effectiveness of the proposed method, we conducted a simple experiment to retrieve similar emotional words using the constructed model. The results of this experiment showed that the proposed method can retrieve similar emotional words with higher accuracy than the conventional word-embedding model.
- (キーワード)
- Emotion recognition / emotional similarity / neural networks
- (徳島大学機関リポジトリ)
- ● Metadata: 117201
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.13053/CyS-26-2-4266
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.13053/CyS-26-2-4266
(徳島大学機関リポジトリ: 117201, DOI: 10.13053/CyS-26-2-4266) Kazuyuki Matsumoto, Manabu Sasayama, Minoru Yoshida, Kenji Kita and Fuji Ren :
Emotion Analysis and Dialogue Breakdown Detection in Dialogue of Chat Systems Based on Deep Neural Networks,
Electronics, Vol.11, No.5, 2022.- (要約)
- In dialogues between robots or computers and humans, dialogue breakdown analysis is an important tool for achieving better chat dialogues. Conventional dialogue breakdown detection methods focus on semantic variance. Although these methods can detect dialogue breakdowns based on semantic gaps, they cannot always detect emotional breakdowns in dialogues. In chat dialogue systems, emotions are sometimes included in the utterances of the system when responding to the speaker. In this study, we detect emotions from utterances, analyze emotional changes, and use them as the dialogue breakdown feature. The proposed method estimates emotions by utterance unit and generates features by calculating the similarity of the emotions of the utterance and the emotions that have appeared in prior utterances. We employ deep neural networks using sentence distributed representation vectors as the feature. In an evaluation of experimental results, the proposed method achieved a higher dialogue breakdown detection rate when compared to the method using a sentence distributed representation vectors.
- (キーワード)
- 自然言語処理 (natural language processing) / dialogue breakdown / human-computer dialogue system / sentiment analysis / emotion recognition
- (徳島大学機関リポジトリ)
- ● Metadata: 116757
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3390/electronics11050695
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.3390/electronics11050695
(徳島大学機関リポジトリ: 116757, DOI: 10.3390/electronics11050695) Akira Fujisawa, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Emotion Estimation Method Based on Emoticon Image Features and Distributed Representations of Sentences,
Applied Sciences, Vol.12, No.3, 2022.- (要約)
- This paper proposes an emotion recognition method for tweets containing emoticons using their emoticon image and language features. Some of the existing methods register emoticons and their facial expression categories in a dictionary and use them, while other methods recognize emoticon facial expressions based on the various elements of the emoticons. However, highly accurate emotion recognition cannot be performed unless the recognition is based on a combination of the features of sentences and emoticons. Therefore, we propose a model that recognizes emotions by extracting the shape features of emoticons from their image data and applying the feature vector input that combines the image features with features extracted from the text of the tweets. Based on evaluation experiments, the proposed method is confirmed to achieve high accuracy and shown to be more effective than methods that use text features only.
- (キーワード)
- emoticon / emotion estimation / multimodal information
- (徳島大学機関リポジトリ)
- ● Metadata: 116758
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3390/app12031256
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.3390/app12031256
(徳島大学機関リポジトリ: 116758, DOI: 10.3390/app12031256) Kazuyuki Matsumoto, Ryota Kishima, Seiji Tsuchiya, Tomoki Hirobayashi, Minoru Yoshida and Kenji Kita :
Relationship Between Personality Patterns and Harmfulness: Analysis and Prediction Based on Sentence Embedding,
International Journal of Information Technology and Web Engineering, Vol.17, No.1, 1-24, 2022.- (要約)
- This paper hypothesize that harmful utterances need to be judged in context of whole sentences, and extract features of harmful expressions using a general-purpose language model. Based on the extracted features, we propose a method to predict the presence or absence of harmful categories. In addition, the authors believe that it is possible to analyze users who incite others by combining this method with research on analyzing the personality of the speaker from statements on social networking sites. The results confirmed that the proposed method can judge the possibility of harmful comments with higher accuracy than simple dictionary-based models or models using a distributed representations of words. The relationship between personality patterns and harmful expressions was also confirmed by an analysis based on a harmful judgment model.
- (キーワード)
- Deep Neural Networks / Harmful Expression / Internet Flaming Detection / MBTI / Personality
- (徳島大学機関リポジトリ)
- ● Metadata: 116756
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.4018/IJITWE.298654
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1360298336571568640
- ● Search Scopus @ Elsevier (DOI): 10.4018/IJITWE.298654
(徳島大学機関リポジトリ: 116756, DOI: 10.4018/IJITWE.298654, CiNii: 1360298336571568640) Kazuyuki Matsumoto, Seiji Tsuchiya, Minoru Yoshida and Kenji Kita :
Construction and Expansion of Dictionary of Idiomatic Emotional Expressions and Idiomatic Emotional Expression Corpus,
International Journal of Computer & Software Engineering, Vol.6, No.2, 2021.- (要約)
- Objective: In the study of sentiment estimation from language, methods focusing on words, phrases, sentence patterns, and sentence-final expressions have been proposed. However, it is difficult to deal with a wide variety of emotional expressions by only assigning emotions to words and phrases. In particular, it is difficult to analyze metaphorical expressions and idiomatic expressions on a word-by-word basis, and it is impossible to register all expressions in a dictionary because new expressions can be created byflexibly replacing words. However, it is difficult to determine the constraints on the words to be replaced, and not all expressions can be registered in the dictionary as sentence patterns.Methods: In this paper, we construct a dictionary of idiomatic sentiment expressions, which contains idioms expressing emotions. In this paper, we construct a pseudo-emotional corpus by collecting utterances containing emotional idioms from social media and automatically assigning emotions expressed by the idioms.Results: This corpus includes expressions other than idioms, and can be an effective resource for estimating emotions in sentences that do not contain idioms. In this study, we create an emotion estimation model for utterances based on the constructed corpus, and conduct evaluation experiments to explore the problems of the idiomatic emotion corpus. In addition, using the constructed sentimentcorpus, we investigate how to expand the dictionary of sentiment expressions in idiomatic phrases by using deep learning methods.Conclusion: Using the corpus of idiomatic sentiments constructed by the proposed method as training data, models with and without idioms were constructed by machine learning models. The results show that the F-values of all emotions with idioms exceed 0.8. On the other hand, when idioms were not included, the F-values tended to decrease overall. However, the F-values of emotions such as "shame"and "excitement" were around 0.7, indicating that the characteristics of emotional expressions other than idioms were expressed.
- (キーワード)
- emotion recognition / 慣用表現 (idiomatic expression) / idiomatic emotional expression / コーパス (corpus)
- (徳島大学機関リポジトリ)
- ● Metadata: 116606
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.15344/2456-4451/2021/174
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.15344/2456-4451/2021/174
(徳島大学機関リポジトリ: 116606, DOI: 10.15344/2456-4451/2021/174) Reishi Amitani, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Buzz Tweet Classification Based on Text and Image Features of Tweets Using Multi-Task Learning,
Applied Sciences, Vol.11, No.22, 2021.- (要約)
- This study investigates social media trends and proposes a buzz tweet classification method to explore the factors causing the buzz phenomenon on Twitter. It is difficult to identify the causes of the buzz phenomenon based solely on texts posted on Twitter. It is expected that by limiting the tweets to those with attached images and using the characteristics of the images and the relationships between the text and images, a more detailed analysis than that of with text-only tweets can be conducted. Therefore, an analysis method was devised based on a multi-task neural network that uses both the features extracted from the image and text as input and the buzz class (buzz/non-buzz) and the number of likes (favorites) and retweets (RTs) as output. The predictions made using a single feature of the text and image were compared with the predictions using a combination of multiple features. The differences between buzz and non-buzz features were analyzed based on the cosine similarity between the text and the image. The buzz class was correctly identified with a correctness rate of approximately 80% for all combinations of image and text features, with the combination of BERT and VGG16 providing the highest correctness rate
- (キーワード)
- multi-task learning / buzz classification / social media / trend analysis
- (徳島大学機関リポジトリ)
- ● Metadata: 116681
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3390/app112210567
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.3390/app112210567
(徳島大学機関リポジトリ: 116681, DOI: 10.3390/app112210567) Minoru Yoshida, Kojima Takumi, Kazuyuki Matsumoto and Kenji Kita :
Toward Analyzing Relations between Sleep Time and Social Networking Service Texts: Prediction of the Tweet Time Span Using the Last Tweet of the Day,
International Journal of Advanced Intelligence (IJAI), Vol.12, No.1, 1-9, 2021.- (要約)
- Sleeping habits are one of the major issues in today's healthcare. In this paper, we consider the problem of analyzing sleeping habits of people using social networking service (SNS) texts. As the first step toward predicting user's sleeping time using SNS texts, we assume that the time span between the user's last post in one day and the first post the next day can be used as a pseudo-indicator for the user's sleeping time if the user posts the text sufficiently frequently. We call such tweet time spans ``pseudo-sleeping time'' if the first tweet of the next day include ``Good morning'' or similar words. We try to predict such pseudo-sleeping time using the text (tweet) of the preceding tweet (i.e., the last tweet of the day). Preliminary experiments show that the tweet text contains some useful information to predict the user's pseudo-sleeping time.
- (キーワード)
- sleeping time / SNS / text mining
- (徳島大学機関リポジトリ)
- ● Metadata: 116122
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1570291227698842880
(徳島大学機関リポジトリ: 116122, CiNii: 1570291227698842880) 佐久田 祐子, 津野邉 純一, 松本 和幸, 吉田 稔, 北 研二 :
Earth Mover's Distanceを用いた画像の印象推定,
日本感性工学会論文誌, Vol.19, No.1, 97-104, 2020年.- (要約)
- 本論文では,配色イメージスケールおよび言語イメージスケールを元に,画像イメージを簡便に評価できるシステムについて述べた.また,そのシステムによる評価結果と,人間の感性による評価結果の一致率を検討し,イメージスケール上のカテゴリーの再検討を行った.
- (キーワード)
- Earth Mover's Distance / EMD / 印象 / 画像処理 (image processing) / カラーイメージスケール / 感情 (emotion) / 感性マッピング / カラー画像
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.5057/jjske.TJSKE-D-19-00038
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1390002184878233472
- ● Search Scopus @ Elsevier (DOI): 10.5057/jjske.TJSKE-D-19-00038
(DOI: 10.5057/jjske.TJSKE-D-19-00038, CiNii: 1390002184878233472) Kazuyuki Matsumoto, Seiji Tsuchiya, Takumi Kojima, Hiroya Kondo, Minoru Yoshida and Kenji Kita :
Classification of Smartphone Application Reviews Using Small Corpus Based on Bidirectional LSTM Transformer,
International Journal of Machine Learning and Computing, Vol.10, No.1, 148-157, 2020.- (要約)
- This paper provides the classification of the review texts on a smartphone application posted on social media. We propose a high performance binary classification method (positive/negative) of review texts, which uses the bidirectional long short-term memory (biLSTM) self-attentional Transformer and is based on the distributed representations created by unsupervised learning of a manually labelled small review corpus, dictionary, and an unlabeled large review corpus. The proposed method obtained higher accuracy as compared to the existing methods, such as StarSpace or the Bidirectional Encoder Representations from Transformer (BERT).
- (キーワード)
- attention mechanism / review classification / small corpus / transformer
- (徳島大学機関リポジトリ)
- ● Metadata: 114311
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.18178/ijmlc.2020.10.1.912
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.18178/ijmlc.2020.10.1.912
(徳島大学機関リポジトリ: 114311, DOI: 10.18178/ijmlc.2020.10.1.912) Koji Bando, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Twitter User's Hobby Estimation Based on Sequential Statements Using Deep Neural Networks,
International Journal of Machine Learning and Computing, Vol.9, No.2, 108-114, 2019.- (要約)
- 近年,SNS上でのユーザー同士のコミュニケーションが増大している.TwitterやFaacebookを始める際,多くのユーザーが,同じ趣味の友達を探す.本研究では,Twitter上のツイートに基づいてユーザの興味(趣味)を推定する手法を提案する. 1つのツイートは,多くの情報を含んでいるわけではなく,また,ツイートの中にはユーザーの趣味に関係していないものもある.そこで,複数の連続したつぶやきから特徴を抽出し,信頼できる趣味推定法を提案する.提案手法では,時系列情報に対応できるリカレントニューラルネットワーク(RNN)を用いる.また,文脈情報を扱うことができる畳み込みニューラルネットワーク(CNN)も使用する.特徴量としては,単語分散表現の平均ベクトルを使用した.Long Short-Term Memory RNN (LSTM-RNN)に基づく提案された方法を使用して,機械学習アルゴリズムとしてランダムフォレスト(RF)回帰を使用するベースライン方法と比較して23.72%の改善を得た.
- (キーワード)
- Twitter / 趣味推定 / ニューラルネットワーク (neural network) / ランダムフォレスト / サポートベクトルマシン
- (徳島大学機関リポジトリ)
- ● Metadata: 113915
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.18178/ijmlc.2019.9.1.773
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85064990114
(徳島大学機関リポジトリ: 113915, DOI: 10.18178/ijmlc.2019.9.1.773, Elsevier: Scopus) Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Emotion Recognition for Japanese Short Sentences Including Slangs Based on Bag of Concepts Feature Trained by Large Web Text,
Current Analysis on Instrumentation and Control, Vol.2019, No.2, 9-18, 2019.- (要約)
- The growth of Internet communication sites such as weblogs and social networking sites brought younger people especially in teens and in their 20s to create new words and to use them very often. We prepared an emotion corpus by collecting weblog article texts including new words, analyzed the corpus statistically, and proposed a method to estimate emotions of the texts. Most slang words such as Youth Slang are too ambiguous in sense classification to be registered into the existing dictionaries such as thesaurus. To cope with these words, we created a large scale of Twitter corpus and calculated sense similarities between words. We proposed to convert unknown word to semantic class id so that we might be able to process the words that were not included in the learning data. For calculation similarities between words and converting the word into word cluster id, we used the word embedding algorithms such as word2vec, or GloVe. We defined this method as a method using Bag of Concepts as feature. As a result of the evaluation experiment using several classifiers, the proposed method was proved its robustness for unknown expressions.
- (キーワード)
- Youth Slang / Unknown Words / Bag of Concepts / Word Embedding / Unsupervised Clustering
- (徳島大学機関リポジトリ)
- ● Metadata: 113245
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1571980077723683712
(徳島大学機関リポジトリ: 113245, CiNii: 1571980077723683712) Kazuyuki Matsumoto, Fuji Ren, Masaya Matsuoka, Minoru Yoshida and Kenji Kita :
Slang Feature Extraction by Analyzing Topic Change on Social Media,
CAAI Transactions on Intelligence Technology, 2019.- (要約)
- Recently, we often see words such as youth slang, neologism and Internet slang on social networking sites (SNSs) that are not registered on dictionaries. Because the documents posted to SNSs include a lot of fresh information, they are thought to be useful for collecting information. It is important to analyze these words (hereinafter referred to as slang) and capture their features for the improvement of the accuracy of automatic information collection. This paper aims to analyze what features can be observed in slang by focusing on the topic. We construct topic models from document groups including target slang on Twitter by Latent Dirichlet Allocation (LDA). With the models, we chronologically analyze change of topics during a certain period of time to find out the difference in the features between slang and general words. Then, we propose a slang classification method based on the change of features.
- (キーワード)
- Slang / Topic analysis / Latent Dirichlet Allocation / Social media, / Tweet representation
- (徳島大学機関リポジトリ)
- ● Metadata: 113246
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1049/trit.2018.1060
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1049/trit.2018.1060
(徳島大学機関リポジトリ: 113246, DOI: 10.1049/trit.2018.1060) Kazuyuki Matsumoto, Akira Fujisawa, Minoru Yoshida and Kenji Kita :
ASCII Art Classification based on Deep Neural Networks Using Image Feature of Characters,
Journal of Software, Vol.13, No.10, 559-572, 2018.- (要約)
- In recent years, a lot of non-verbal expressions have been used on social media. Ascii art (AA) is an expression using characters with visual technique. In this paper, we set up an experiment to classify AA pictures by using character features and image features. We try to clarify which feature is more effective for a method to classify AA pictures. We proposed four methods: 1) a method based on character frequency, 2) a method based on character importance value and 3) a method based on image features and 4) a method based on image features of characters. We trained neural networks by using these four features. In the experimental result, the best classification accuracy was obtained in the feed forward neural networks that used image features of characters.
- (キーワード)
- アスキーアート / 分類 (classification) / 深層ニューラルネットワーク / 文字特徴
- (徳島大学機関リポジトリ)
- ● Metadata: 113248
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.17706/jsw.13.10.559-572
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.17706/jsw.13.10.559-572
(徳島大学機関リポジトリ: 113248, DOI: 10.17706/jsw.13.10.559-572) Mei Chen, Qingmei Xiao, Kazuyuki Matsumoto, Minoru Yoshida, Kenji Kita and Xin Luo :
Similarity Analysis and Repeating Pattern Detection in Fingerprint Features,
Journal of Computational Methods in Sciences and Engineering, Vol.18, No.3, 553-562, 2018.- (キーワード)
- オーディオ指紋 (audio fingerprint) / similarity analysis / repeating pattern detection / music retrieval
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3233/JCM-180781
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85059945684
(DOI: 10.3233/JCM-180781, Elsevier: Scopus) 松本 和幸, 秋田 恭佑, 任 福継, 吉田 稔, 北 研二 :
演劇台本における登場人物間の親密度推定手法,
知能と情報, Vol.30, No.3, 591-604, 2018年.- (要約)
- 近年,音声アシスタント機能を搭載した携帯型端末が普及し,より使い手に配慮した対話システムが求められている. 従来型の対話システムの問題点として,雑談のような非タスク型対話への対応が未熟な点があげられる.非タスク型対話 においては,ユーザとの会話を円滑かつ柔軟にするための工夫が必要となる.たとえば,ユーザの現実世界での人間関係 を考慮することによって,ユーザと親しい人物に関する話題の提供を積極的に行ったり,ユーザと親しくない(仲が良く ない)人物に関する話題の提供を避けたりすることができると考える.本論文では,演劇台本を題材に,対話中の2 者間 の人間関係を「親密度」という尺度により表現する.親密度に関わると考えられる要素として,発話の応答回数や発話中 の態度などがある.本論文では,その中でも発話中の感情状態に着目することで,高精度な親密度推定の実現を試みる. 評価実験の結果,発話役割に基づく従来手法を上回る高精度な親密度推定を実現することが出来た.
- (キーワード)
- 親密度 / シナリオ対話 / 感情状態
- (徳島大学機関リポジトリ)
- ● Metadata: 113247
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3156/jsoft.30.3_591
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1390564237991620096
- ● Search Scopus @ Elsevier (DOI): 10.3156/jsoft.30.3_591
(徳島大学機関リポジトリ: 113247, DOI: 10.3156/jsoft.30.3_591, CiNii: 1390564237991620096) Fujino Naoya, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Emotion Estimation Adapted to Gender of User Based on Deep Neural Networks,
International Journal of Advanced Intelligence (IJAI), Vol.10, No.1, 121-133, 2018.- (要約)
- In this study, we focus on Twitter as a representative SNS and target emotion estima-tion from tweets posted on Twitter by male and female users. Specically, we constructgender-based emotion estimation models assuming that there are different word usage ten-dencies between genders. By analyzing gender-specic differences in the use of emotion-related slang and emoji, we propose a method to improve emotion estimation based onneural networks using a different distributed representation model for each gender. Ourevaluation experiments show that training with Deep Convolutional Neural Networks us-ing word's distributed representation as the feature produced higher estimation accuracythan training with Feed Forward Neural Networks.
- (キーワード)
- emotion estimation / user's gender, / deep neural networks
- (徳島大学機関リポジトリ)
- ● Metadata: 113250
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050302172853082368
(徳島大学機関リポジトリ: 113250, CiNii: 1050302172853082368) Hirokimi Fukuda, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Index Generation of BGM Video Based on Distinctive Comments,
International Journal of Advanced Intelligence (IJAI), Vol.10, No.1, 113-119, 2018.- (要約)
- The purpose of this study is to generate indexes for background music (BGM) based ondistinctive comments annotated to BGM videos posted on Nico Nico Videos. Our proposedmethod detects the end/start positions of the BGM considering the increase/decrease inthe number of comments, comments distinctive to the songs, and exclamatory expressionsannotated to the videos. The evaluation result indicated that the proposed method couldgenerate correct indexes within a 10 s error for BGM videos less than 40 min long andwith annotations of over 30,000 comments.
- (キーワード)
- Nico Nico Video / Index generation / BGM video for work
- (徳島大学機関リポジトリ)
- ● Metadata: 113249
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050020697876372224
(徳島大学機関リポジトリ: 113249, CiNii: 1050020697876372224) Kazuyuki Matsumoto, Seiji Tsuchiya, Miyake Takeshi, Minoru Yoshida and Kenji Kita :
Flame Prediction Based on Harmful Expression Judgement Using Distributed Representation,
International Journal of Technology and Engineering Studies, Vol.4, No.1, 7-15, 2018.- (要約)
- 近年,ソーシャルメディア上での炎上が問題になっている.炎上を避けるためには,投稿前に自動的にメッセージを確認して,炎上を引き起こす可能性の高い表現が含まれているかどうかを判断することが役立つ.提案手法では,有害表現辞書を作成する.このさい,表現を集めるコストを最小限に抑えるために,単語分散表現を使用して半自動的に辞書を構築した.辞書に登録された有害表現と一般的な表現を用い,有害表現と一般的表現の分類を行った.評価実験により,提案手法は約70%の精度で有害表現を抽出できることが分かった.提案手法は未知の表現を抽出することもできたが,有害でない表現も有害として抽出する傾向があった.提案手法は,基本辞書に含まれていない未知の有害な表現を決定することができ,有害表現間の意味的関係を判定することができる.
- (キーワード)
- 炎上予測 / 有害表現 / 分散表現 / サポートベクターマシン
- (徳島大学機関リポジトリ)
- ● Metadata: 113251
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.20469/ijtes.4.10002-1
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1572261552700328448
- ● Search Scopus @ Elsevier (DOI): 10.20469/ijtes.4.10002-1
(徳島大学機関リポジトリ: 113251, DOI: 10.20469/ijtes.4.10002-1, CiNii: 1572261552700328448) Kazuyuki Matsumoto, Fuji Ren, Minoru Yoshida and Kenji Kita :
Review Score Estimation Based on Transfer Learning of Different Media Review Data,
International Journal of Advanced Intelligence (IJAI), Vol.9, No.4, 541-555, 2017.- (要約)
- 本研究では,異なるメディアのレビューデータに基づいたレビュー分類モデルの構築を提案します.現在,多種多様なビッグデータを対象とした異なるドメイン間での転移学習に関する研究が盛んである.異なるドメイン間では,評価表現が異なることが多く,評判分析の障壁となる.異なるメディアにおける著作物に触れているユーザが異なる表現を使用することは多い.たとえば,著作物に関して,「アニメ」や「漫画」,「ゲーム」,「映画」など,異なるメディアにおいては異なる用語や表現が存在する.評価表現以外にもメディアの違いの特徴が表れると考えられる.我々はメディア間でのレビューデータの転移学習をおこなうことで,こうした違いが分類精度にどんな影響を及ぼすかについて分析した.本研究では,著作物の媒体ごとに,転移先と転移元のメディアの相性について,レビューの評価分類モデルを構築することで明らかにした.また,評価実験の結果,Long Short Term Memoryを用いて,レビュー片の学習においてSo-Scoreを用いずに,SO-Scoreに基づく手法よりも正確に評価スコアの推定をおこなえた.
- (キーワード)
- レビュー分類 / 転移学習 / Long Short-Term Memory / different media
- (徳島大学機関リポジトリ)
- ● Metadata: 113252
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1570572702840072192
(徳島大学機関リポジトリ: 113252, CiNii: 1570572702840072192) Kazuyuki Matsumoto, Akira Fujisawa, Minoru Yoshida and Kenji Kita :
Emotion Recognition of Emoticon Based on Character Embedding,
Journal of Software, Vol.12, No.11, 849-857, 2017.- (要約)
- 本研究では,顔文字の文字意味分散表現を用いた顔文字の感情認識をおこなう.従来の顔文字研究では,文中から顔文字を抽出したり,顔文字を構成パーツに分解しその組み合わせによる感情認識などがおこなわれてきた.近年発展してきた単語埋め込み技術を応用し,顔文字の文字単位での意味を学習し,特徴量として用いることで,より汎用的な顔文字の感情認識を試みる.文字の分散表現を素性として深層畳み込みニューラルネットワークに学習させる手法により構築した顔文字感情認識モデルを交差検証法により評価した結果,未知顔文字に対する感情認識を,単純な文字n-gram出現頻度ベクトルを素性として用いた手法よりも高い精度でおこなえることが分かった.
- (キーワード)
- 顔文字 / 感情認識 / 文字埋め込み / 畳み込みニューラルネットワーク
- (徳島大学機関リポジトリ)
- ● Metadata: 113914
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.17706/jsw.12.11.849-857
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.17706/jsw.12.11.849-857
(徳島大学機関リポジトリ: 113914, DOI: 10.17706/jsw.12.11.849-857) Zhang Guodong, Jiang Peiling, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
An Improvement of Pedestrian Detection Method with Multiple Resolutions,
Journal of Computer and Communications, Vol.5, No.9, 102-116, 2017.- (要約)
- In object detection, detecting an object with 100 pixels is substantially different from detecting an object with 10 pixels. Many object detection algorithms assume that the pedestrian scale is fixed during detection, such as the DPM detector. However, detectors often give rise to different detection effects under the circumstance of different scales. If a detector is used to perform pedestrian detection in different scales, the accuracy of pedestrian detection could be improved. A multi-resolution DPM pedestrian detection algorithm is proposedin this paper. During the stage of model training, a resolution factor is added to a set of hidden variables of a latent SVM model. Then, in the stage of detection, a standard DPM model is used for the high resolution objects and a rigid template is adopted in case of the low resolution objects. In our experiments, we find that in case of low resolution objects the detection accuracy of a standard DPM model is lower than that of a rigid template. In Caltech, the omission ratio of a multi-resolution DPM detector is 52% with 1 false positive per image (1FPPI); and the omission ratio rises to 59% (1FPPI) as far as a standard DPM detector is concerned. In the large-scale sample set of Caltech, the omission ratios given by the multi-resolution and the standard DPM detectors are 18% (1FPPI) and 26% (1FPPI), respectively.
- (キーワード)
- Deformable Part Model / Pedestrian Detection / Multi-Resolution / Latent SVM
- (徳島大学機関リポジトリ)
- ● Metadata: 113913
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.4236/jcc.2017.59007
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.4236/jcc.2017.59007
(徳島大学機関リポジトリ: 113913, DOI: 10.4236/jcc.2017.59007) Kazuyuki Matsumoto, Satoshi Tanaka, Minoru Yoshida, Kenji Kita and Fuji Ren :
Ego-state Estimation from Short Texts Based on Sentence Distributed Representation,
International Journal of Advanced Intelligence (IJAI), Vol.9, No.2, 145-161, 2017.- (要約)
- 人間の性格は,複雑な要素が組み合わさって,多面的に構成される.性格診断手法としてのエゴグラムは,5つの自我状態の高低の組み合わせに基づき,性格をパターン分類するものである.近年のSNSの発達にともなって,性格をSNS上の発言から診断しようという試みが増えてきた.しかし,発言の表層情報を手掛かりとした性格診断は,自我状態を推定するうえでいくつかの問題を抱える.具体的には,性格がすべての発言に反映されているわけではないこと,また,個人の性格に起因する発言の傾向は時間とともに変化していくものであるということなどがあげられる.また,十分な量の性格診断結果を伴う発言の事例を収集することも重要となる.本研究では,SNS,とくにMicroblog 上の発言(ショートテキスト)をもとに,エゴグラム診断を自動化するために,Twitter 上の発言を事前学習において分散表現(文ベクトル)により表し,Deep Neural Network による機械学習を用いて,ユーザごとに自我状態のレベルを推定するモデルの構築を試みる.評価実験の結果,提案手法による自我状態推定モデルは,Bag of Words を素性としたベースライン手法よりも高精度%であることを示した.また,時間経過による性格変化を調べるため,エゴグラム診断の前後において,推定結果の一致率にどのような変化が起きているかを分析した.さらに本論文では,文のフォーマル度合いを特徴づける素性を追加することで性格パターン分類の精度向上を確認した.
- (キーワード)
- エゴグラム / 性格推定 / Twitter / Social Networking Service / 分散表現
- (徳島大学機関リポジトリ)
- ● Metadata: 113455
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050583647829752704
(徳島大学機関リポジトリ: 113455, CiNii: 1050583647829752704) 松本 和幸, 土屋 誠司, 芋野 美紗子, 吉田 稔, 北 研二 :
感性を考慮した日本語俗語の標準語変換,
人工知能学会論文誌, Vol.32, No.1, WII-A_1-12, 2017年.- (要約)
- 近年のソーシャルメディアを用いたコミュニケーションの普及に伴い,Web上での意見交換が老若男女問わず一般的になってきた.一方で,「ネット炎上」と呼ばれる問題が,ソーシャルネットワークサービスのユーザの増加にともない,しばしば起こっている.この理由は,ユーザが単語により表現された意味/意図/感情を理解しないためである.本研究では,SNS上でよく用いられるが,一般的な辞書に登録されていない俗語(ネットスラング)に着目し,それらを標準語に変換することを試みる.我々は,意味的な類似だけでなく,感性的な類似を考慮し,より適切な候補を出力しようと考える.提案手法は,分散表現に基づき得られた候補を,2つの点に焦点をあて,フィルタリングし再ランキングする.入力語と出力候補間の,(1)俗語/標準語の特徴,(2)感性的類似度 の2点である.評価実験において,提案手法により,ベースライン手法よりも高いMRRを得た.
- (キーワード)
- ネットスラング / 標準語 / 感性 / 単語概念
- (徳島大学機関リポジトリ)
- ● Metadata: 113254
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1527/tjsai.WII-A
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1527/tjsai.WII-A
(徳島大学機関リポジトリ: 113254, DOI: 10.1527/tjsai.WII-A) Zhang Guodong, Jiang Peilin, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Reidentification of Persons Using Clothing Features in Real-Life Video,
Applied Computational Intelligence and Soft Computing, Vol.2017, 1-9, 2017.- (要約)
- Person reidentification, which aims to track people across nonoverlapping cameras, is a fundamental task in automated video processing. Moving people often appear differently when viewed from different nonoverlapping cameras because of differences in illumination, pose, and camera properties. The color histogram is a global feature of an object that can be used for identification. This histogram describes the distribution of all colors on the object. However, the use of color histograms has two disadvantages. First, colors change differently under different lighting and at different angles. Second, traditional color histograms lack spatial information. We used a perception-based color space to solve the illumination problem of traditional histograms. We also used the spatial pyramid matching (SPM) model to improve the image spatial information in color histograms. Finally, we used the Gaussian mixture model (GMM) to show features for person reidentification, because the main color feature of GMM is more adaptable for scene changes, and improve the stability of the retrieved results for different color spaces in various scenes. Through a series of experiments, we found the relationships of different features that impact person reidentification.
- (キーワード)
- Clothing Feature / Gaussian mixture mode / spatial pyramid matching / person reidentification / perception-based color space
- (徳島大学機関リポジトリ)
- ● Metadata: 113911
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1155/2017/5834846
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1155/2017/5834846
(徳島大学機関リポジトリ: 113911, DOI: 10.1155/2017/5834846) Kazuyuki Matsumoto, Minoru Yoshida, Seiji Tsuchiya, Kenji Kita and Fuji Ren :
Slang Analysis Based on Variant Information Extraction Focusing on the Time Series Topics,
International Journal of Advanced Intelligence (IJAI), Vol.8, No.1, 84-98, 2016.- (要約)
- 近年,SNS の利用者増加に伴い,Web上でのコミュニケーションがよりいっそう活発になった. これにより,言葉の多様性について,SNS上のビッグデータを用いて解析できる可能性が出てきた.日本語では扱われる文字種が多いことからも,様々な表現が存在し,自然言語処理において基本的な処理である形態素解析が,比較的難しいことが問題となっている.こうした形態素解析の辞書に登録されていないような未知表現に対しては,厳密な定義が存在していないこともしばしばであり,意味解釈における個人差が大きいことが考えられる.本研究では,Twitter上の俗語に関連したトピックを時系列で分析する.本論文では,検証実験として,連続するTweetデータを用いたトピックの時系列分析実験をおこない,俗語の種類によるトピック変化の違いを考察する.変化しない情報(不変情報)が,一定期間においてどのような変化を示すかを実験により示し,標準語との差異を調べる.また,俗語の変化の仕方を変動値とし,特徴ベクトルとすることで,似たような傾向を示す俗語をクラスタリングする手法を提案し,実験結果を分析する.
- (キーワード)
- 俗語 / トピック分析 / 時系列分析
- (徳島大学機関リポジトリ)
- ● Metadata: 113910
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1571698602718115840
(徳島大学機関リポジトリ: 113910, CiNii: 1571698602718115840) Akira Fujisawa, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
An Illustration Image Classification Focusing on Infrequent Colors,
International Journal of Advanced Intelligence (IJAI), Vol.8, No.1, 72-83, 2016.- (要約)
- 漫画やアニメ作品において用いられるイラスト画像は感性的な特徴である作風を持つ.作風はイラスト画像の様々な要素により表現される.イラスト画像の作風を扱った研究は少ない.本論文では,画像特徴量を用いることで作風のモデル化およびイラスト画像の作風による分類を試みた.我々は,イラスト画像においてあまり使用されない色が作風を表現していると考えた.そのため,あまり出現しない色を強調した色ヒストグラムを作成するための手法を提案する.我々はこのヒストグラムを「Infrequency histogram(IF-hist)」と呼ぶ.このヒストグラムの有効性を確認するため,我々は,IF-histを用いて「少年向け」と「少女向け」の2つの作風に分類する実験をおこなった.実験の結果,通常の色ヒストグラムを用いた場合よりも50%の精度改善を確認でき,本手法の有効性を示すことができた.
- (キーワード)
- 画像分類 / イラスト画像 / 色ヒストグラム / 作風 / IF-hist
- (徳島大学機関リポジトリ)
- ● Metadata: 113909
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050583647829579648
(徳島大学機関リポジトリ: 113909, CiNii: 1050583647829579648) Zhang Guodong, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Pedestrian Re-identification using Color Feature in Multi Surveillance Video,
International Journal of Advances in Electronics and Computer Science, Vol.3, No.3, 11-14, 2016.- (要約)
- In this paper we present a system to solve the problem of moving pedestrian re-identification in surveillancevideo. Surveillance video has low-resolution, high video noise and limited monitoring scope. Our proposed framework mustdeal with several problems such as variations of illumination conditions, poses and occlusions. How to extract the robustfeature that can adapt the problems have been the task. The people of global color approaches do not change in the processof monitoring. Our paper use the color histogram as feature descriptors and choose RGB HSV and UVW for color space.Traditional histogram method extract the global color approach as the feature. The object color structure information will beneglected. We use the SPM model supplement the structure information for the histogram. The results of a test from a realsurveillance system show that our method can provide a probability of matching.
- (キーワード)
- Pedestrian Re-identification / UWV Color space / Color Histogram / SPM
- (徳島大学機関リポジトリ)
- ● Metadata: 113906
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050865122806291456
(徳島大学機関リポジトリ: 113906, CiNii: 1050865122806291456) Sun Zhuoran, Minoru Yoshida, Kazuyuki Matsumoto and Kenji Kita :
A Study on the Review Analysis for the Automatic Evaluation of the Product,
International Journal of Management and Applied Science (IJMAS), Vol.2, No.3, 2016.- (要約)
- Nowadays, e-business has been never more popular and more convenient. Online merchants have flourished andmerchandize have diversified. However, its still difficult for users to quickly locate their desired products on online markets.Often times, an online shopper will evaluate ratings and comments from other users to speculate the current product. Inparticular, the easiest and the most intuitive way is to see the scores to determine the quality of the product. Therefore, if wecan automatically identify and analyze all the reviews and accurately and objectively give a score to a particular product, itwill be more efficient for users to search merchandize and for online business owners to manage the products they sell.
- (キーワード)
- e-ビジネス (e-business) / レビュー / Analysis / 自動評価 / 技術経営 (management of technology)
- (徳島大学機関リポジトリ)
- ● Metadata: 113907
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1050020697876158592
(徳島大学機関リポジトリ: 113907, CiNii: 1050020697876158592) Kazuyuki Matsumoto, Kyosuke Akita, Xielifuguli Keranmu, Minoru Yoshida and Kenji Kita :
Extraction Japanese Slang from Weblog Data Based on Script Type and Stroke Count,
Procedia Computer Science, Vol.35, No.2014, 464-473, 2014.- (要約)
- 若者はWeblogやSNSにおいてよく俗語を用いる.こうした語をどう扱うかが,テキストマイニングなどの分野において,一つの問題となっている.本論文では,若者にとくに用いられる若者言葉と呼ばれる日本語俗語を文字種と画数に着目することにより抽出する手法を提案した.評価実験の結果,文字種を適用した場合に高い抽出精4度が得られることが分かった.
- (キーワード)
- 日本語俗語 / 条件付き確率場 / 未知語 / 画数 / 文字種
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1016/j.procs.2014.08.127
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-84924135505
(DOI: 10.1016/j.procs.2014.08.127, Elsevier: Scopus) 藏本 貴久, 和泉 潔, 吉村 忍, 石田 智也, 中嶋 啓浩, 松井 藤五郎, 吉田 稔, 中川 裕志 :
新聞記事のテキストマイニングによる長期市場動向の分析,
人工知能学会論文誌, Vol.28, No.3, 291-296, 2012年.- (要約)
- In this study, we developed a new method of the long-term market analysis by using text-mining of news articles. Using our method, we conducted extrapolation tests to predict stock price averages by 19 industry and two market averages, TOPIX and Nikkei225 for about 10 years. As a result, 8 sectors in 21 sectors (about 40%) showed over about 60% accuracy, and 15 sectors in 21 sectors (over 70%) showed over about 55% accuracy. We also developed a web system of financial text-mining based on our method for financial professionals.
- (キーワード)
- text-mining / stock prices prediction / market trend / UI
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1527/tjsai.28.291
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1390282680085059968
- ● Search Scopus @ Elsevier (DOI): 10.1527/tjsai.28.291
(DOI: 10.1527/tjsai.28.291, CiNii: 1390282680085059968) 吉田 稔, 中川 裕志, 寺田 昭 :
コーパス検索支援のための動的同義語候補抽出,
人工知能学会論文誌, Vol.25, No.1, 122-132, 2010年.- (要約)
- This paper proposes a method for implementing real-time synonym search systems. Our final aim is to provide users with an interface with which they can query the system for any length strings and the system returns a list of synonyms of the input string. We propose an efficient algorithm for this operation. The strategy involves indexing documents by suffix arrays and finding adjacent strings of the query by dynamically retrieving its contexts (i.e., strings around the query). The extracted contexts are in turn sent to the suffix arrays to retrieve the strings around the contexts, which are likely to contain the synonyms of the query string.
- (キーワード)
- synonyms / suffix arrays / query support systems
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1527/tjsai.25.122
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1390282680084681600
- ● Search Scopus @ Elsevier (DOI): 10.1527/tjsai.25.122
(DOI: 10.1527/tjsai.25.122, CiNii: 1390282680084681600) 吉田 稔, 池田 雅紀, 小野 真吾, 佐藤 一誠, 中川 裕志 :
二段階クラスタリングを単語重み付与に応用した人名曖昧性解消,
日本データベース学会論文誌, Vol.9, No.2, 19-24, 2010年.- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1520572359771738496
(CiNii: 1520572359771738496) 寺田 昭, 吉田 稔, 中川 裕志 :
同義語辞書作成支援ツール,
自然言語処理, Vol.15, No.2, 39-58, 2008年. Minoru Yoshida, Kentaro Torisawa and Jun'ichi Tsujii :
Integrating Tables on the World Wide Web,
Transactions of the Japanese Society for Artificial Intelligence, Vol.19, No.6, 548-560, 2004.- (キーワード)
- HTML tables / EM algorithm / clustering
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1527/tjsai.19.548
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1390001205109189504
- ● Search Scopus @ Elsevier (DOI): 10.1527/tjsai.19.548
(DOI: 10.1527/tjsai.19.548, CiNii: 1390001205109189504) - MISC
- 吉田 稔, 松本 和幸, 北 研二 :
Value行列を手掛かりとした Transformerの分析,
人工知能学会論文誌, Vol.38, No.2, 2023年.- (キーワード)
- Transformer / value matrix / word embedding
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1527/tjsai.38-2_C-MB7
- (文献検索サイトへのリンク)
- ● CiNii @ 国立情報学研究所 (CRID): 1390013795251121280
- ● Search Scopus @ Elsevier (DOI): 10.1527/tjsai.38-2_C-MB7
(DOI: 10.1527/tjsai.38-2_C-MB7, CiNii: 1390013795251121280)
- 総説・解説
- 藤澤 日明, 松本 和幸, 奥村 紀之, 吉田 稔, 北 研二 :
アスキーアートへの挑戦 - 画像特徴量によるアプローチ -,
人工知能学会誌(-2013), Vol.32, No.3, 364-370, 2017年5月.- (キーワード)
- アスキーアート / 画像特徴 / 非言語表現 / 顔文字 / histograms of oriented gradients
- (徳島大学機関リポジトリ)
- ● Metadata: 113912
(徳島大学機関リポジトリ: 113912) - 講演・発表
- Haruto Uda, Kazuyuki Matsumoto and Minoru Yoshida :
Text Data Augmentation Method Using Filtering Indicators based on Multiple Perspectives,
Proceedings of the 38th Pacific Asia Conference on Language, Information and Computation, 1-10, Dec. 2024.- (要約)
- The widespread use of social networking services (SNS) has made it possible to collect a wide variety of text data on a large scale. Text data posted on SNS contain many broken expressions, especially abbreviations and colloquial expressions. In order to utilize such data as a resource for natural language processing, annotation of the data, assignment of class labels, etc. become issues. In general, because manual annotation is costly, artificial data augmentation and semi-automation of label assignment are often used as a countermeasure against data shortages. In this study, we propose a method for efficiently preparing large-scale, high-quality labeled text data for machine learning by applying evaluation indicators from multiple perspectives to the data generated by data augmentation methods. The goal is to improve the prediction accuracy of the model by adding the augmented data to the training data. Specifically, the proposed method sets thresholds for the semantic similarity based on the vector of BERT between the original text and the augmented text, the degree of change by BLEU, and the change in attention by Attention, respectively, and deletes data that do not satisfy the threshold conditions. Since the number of augmented data also affects learning accuracy, the number of data is also addressed by adding it to the evaluation indicators. Evaluation experiments on emotionlabeled datasets show that the proposed method achieves higher Accuracy than the method that simply augments the data using Easy Data Augmentation.
- (キーワード)
- easy data augmentation / multiple perspectives / imbalanced data / small data / sentiment analysis
Analysis of Emotional Changes in Twitter Users by Personality Type Before and After the Outbreak of the COVID-19 Pandemic,
Proceedings of the 202319th International Conference on Natural Computation, Fuzzy Systems and Knowledge Discovery (FSKD), Harbin, Jul. 2023.- (要約)
- Three years have passed since the outbreak of the novel coronavirus pandemic at the end of 2019, and the situation continues to change daily as non-pharmaceutical interventions and associated restrictions are gradually being eased. Even now, drastic changes in aspects of daily living continue to have significant impacts in terms of physical and mental stress on many people. In this study, we analyzed changes in Twitter users comments, thoughts, and actions by conducting sentiment analysis of the content of tweets posted before and after the outbreak of the pandemic. We extracted characteristic expressions and conducted a comparative analysis. In addition, we examined changes in emotions according to users personality types.
- (キーワード)
- Twitter / pandemic / emotion changes / personality
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/ICNC-FSKD59587.2023.10280850
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1109/ICNC-FSKD59587.2023.10280850
(DOI: 10.1109/ICNC-FSKD59587.2023.10280850) Shohei Noguchi, Kazuyuki Matsumoto, Minoru Yoshida, Ryota Nishimura and Kenji Kita :
Extraction of keywords from disease-fighting blogs by fine-tuning the T5 model,
2022 6th International Conference on Natural Language Processing and Information Retrieval, Dec. 2022.- (要約)
- To measure lifestyle-related diseases such as heart disease and diabetes, which are on the increase, information on patients' lifestyles is necessary. With the growth of the Internet culture in recent years, a great deal of valuable information about patients' long fight against the disease, including lifestyle and condition changes, is now being written in the form of blogs and tweets. In this study, keywords related to changes in health status are extracted from "disease-fighting blogs" using Named Entity Recognition system, which is fine-tuned the "T5 Model", one of the latest deep learning and natural language processing models. This method can be applied to a system that informs patients and health care professionals how their lifestylehabits affect their health status.
- (キーワード)
- disease-fighting blog / named entity recognition / T5
Emotion and personality estimation of utterances in a dialogue model reflecting personality,
Proceedings of 4th International Conference on Technological Competency as Caring in Nursing and Health Sciences 2022, 105, Online, Dec. 2022.- (要約)
- One of the factors that enable humans to interact with AI in a friendlier manner is personality, and since the personality required of AI varies depending on the situation and context, a mechanism is needed that allows AI to switch between different personalities depending on the person with whom he or she is interacting. In this study, we use a Japanese language Transformer Encoder-decoder dialogue model (Japanese-dialog-transformers) and aim to construct a dialogue model that reflects the personality of the target person by fine-tuning the interview dialogue data. By analyzing the output of the proposed dialogue models using the MBTI estimation model and the sentiment analysis model, we evaluate the consistency of the personality and discuss the differences and similarities among the dialogue models.
- (キーワード)
- 自然言語処理 (natural language processing) / 対話モデル / 人工知能 (artificial intelligence) / 深層学習 (deep learning)
Affective Analysis and Visualization from Posted Text, Replies, and Images for Analysis of Buzz Factors,
Frontiers in Artificial Intelligence and Applications (FAIA), Fuzzy Systems and Data Mining VIII, Vol.358, 191-203, Nov. 2022.- (要約)
- In this study, we propose a method to visualize the factors that contribute to the buzz phenomenon triggered by Twitter posts. The analysis included tweets, images, and replies. Replies are after-the-fact responses posted in response to a posted tweet and therefore cannot be used to predict buzz phenomena. Therefore, they cannot be used to predict the buzz phenomena. In this study, the tweet body, images, and reply text were feature vectors, and an affective analysis model was constructed. Visualization of the relationship between the sensibility features output from this model and the number of RTs and likes (echo index), which represent the scale of the buzz, will be useful for analyzing the factors behind the popularity. Consequently, the subjective sensibility information with the most likes also tended to have a higher degree of similarity among the sensibility vectors.
- (キーワード)
- Tweet analysis / 自然言語処理 (natural language processing) / trend analysis
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3233/FAIA220384
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85142130952
(DOI: 10.3233/FAIA220384, Elsevier: Scopus) Motonobu Yoshida, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
A System to Correct Toxic Expression with BERT,
Proceedings of the 14th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management - KEOD, 92-97, Valletta, Oct. 2022.- (要約)
- This paper describes a system for converting posts with toxic expression on social media, such as those containing slander and libel, into less-toxic sentences. In recent years, the number of social media users as well as the cases of online flame wars has been increasing. Therefore, to prevent flaming, we first use a prediction model based on Bidirectional Encoder Representations from Transformers (BERT) to determine whether a sentence is likely to be flamed before it is posted. The highest classification accuracy recorded 82% with the Japanese Spoken Language Field Adaptive BERT Model (Japanese Spoken BERT model) as a pre-trained model. Then, for sentences that are judged to be toxic, we propose a system that uses BERTs masked word prediction to convert toxic expressions into safe expressions, thereby converting them into sentences with mitigated aggression. In addition, the BERTScore is used to quantify whether the meaning of the converted sentence has changed in meaning compared to the original sentence and evaluate whether the modified sentence is safe while preserving the meaning of the original sentence.
- (キーワード)
- Toxic Expression / BERT / 分類 (classification) / Text Crrection / Flame War
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.5220/0011586100003335
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85146200806
(DOI: 10.5220/0011586100003335, Elsevier: Scopus) Daichi Kawahara, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Music Video Search System Based on Comment Data and Lyrics,
Advances in Natural Computation, Fuzzy Systems and Knowledge Discovery(Lecture Notes on Data Engineering and Communications Technologies; LNDECT), Vol.153, 1125-1135, Jul. 2022.- (要約)
- Many people currently use video-sharing services such as YouTube. Keyword search is prevalent in these services. It can be hard to find a video that matches the users' interests using keyword search unless appropriate words are used. In this study, we propose a method for retrieving music videos with similar impressions by analyzing comment data from YouTube viewers and music lyrics. The proposed method converts comments and lyrics into vectors using Word2Vec, and music videos with similar impressions are retrieved using fuzzy c-means clustering According to the mean reciprocal rank (MRR) scores, it was clear that the output of the music videos had the same impression within the top three songs.
- (キーワード)
- 人工知能 (artificial intelligence) / music video search / lyric / fuzzy c-means
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-031-20738-9_122
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85147845007
(DOI: 10.1007/978-3-031-20738-9_122, Elsevier: Scopus) Naomichi Tabuchi, Kazuyuki Matsumoto, Minoru Yoshida, Ryota Nishimura and Kenji Kita :
Analysis of Lifestyle Habits from Weblogs of Patients with Intractable Diseases Using Deep Learning,
Proceedings of International Conference on Electrical, Computer and Energy Technologies (ICECET), Jul. 2022.- (要約)
- In recent years, patient-centered medicine has become widely accepted. To keep a record of their struggles,patients sometimes publish their diaries (disease blogs) on weblogs to be read by an unspecified number of people. In particular, writing a blog may be helpful in the case of intractable diseases of which there are few cases, and patients often feel isolated because they know few people with the same disease. In this study, we used deep learning technology to analyze the blogs written by patients with intractable diseasesand to determine how they live their daily lives and their feelings. If their lifestyles are understood, the relationship between the physical condition and mental changes of people fighting intractable diseases can be determined, and a system that shows behavioral guidelines for new users fighting similar intractable diseases can be built.
- (キーワード)
- lifestyle habits / intractable disease / 深層学習 (deep learning)
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/ICECET55527.2022.9872887
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85138876019
(DOI: 10.1109/ICECET55527.2022.9872887, Elsevier: Scopus) Naomichi Tabuchi, Kazuyuki Matsumoto, Minoru Yoshida, Ryota Nishimura and Kenji Kita :
Risk Analysis of Developing Lifestyle-related Diseases based on the Content of Social Networking Service Posts,
Innovation in Medicine and Healthcare, Part of the Smart Innovation, Systems and Technologies book series, Vol.308, 63-72, Jun. 2022.- (要約)
- Japans leading causes of death are cancer, cardiovascular disease, and diabetes, which account for approximately 60% of all deaths. All these diseases are closely related to lifestyle habits such as diet, exercise, and sleep and are called lifestyle-related diseases. Lifestyle-related diseases are characterized by a lack of subjective symptoms, making it difficult to notice the deterioration of the disease. In this study, we analyzed tweets related to diet, exercise, physical condition, and mental state from the contents posted by users on social networking services (SNS) to construct a system that can prevent lifestyle-related diseases more simply. We found that the results of this work can lead to the construction of a system than can detect risk factors leading to the development of lifestyle-related diseases, from the contents of users posts.
- (キーワード)
- risk analysis / social networking service / lifestyhle-related diseases
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-981-19-3440-7_6
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85135061563
(DOI: 10.1007/978-981-19-3440-7_6, Elsevier: Scopus) Taiga Kirihara, Kazuyuki Matsumoto, Manabu Sasayama, Minoru Yoshida and Kenji Kita :
Topic Segmentation for Interview Dialogue System,
Proceedings of 2021 5th International Conference on Natural Language Processing and Information Retrieval, Online, Dec. 2021.- (要約)
- In this study, topic segmentation was performed by referring to the interview dialogue corpus. Utterance intention tags were added to the existing interview dialogue corpus, and uttered sentences were vectorized using BERT, Sentence BERT, and Distil BERT. In addition, topic classification was performed using the utterance intention tags and the features of the preceding and following uttered sentences. Consequently, the greatest accuracy was achieved when the utterance intention tag was used with DistilBERT
- (キーワード)
- interview dialogue / neural networks / speech intention / DistilBERT
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1145/3508230.3508237
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1145/3508230.3508237
(DOI: 10.1145/3508230.3508237) Reishi Amitani, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Prediction of Number of Likes and Retweets based on the Features of Tweet Text and Images,
Proceedings of 2021 5th International Conference on Natural Language Processing and Information Retrieval, Online, Dec. 2021.- (要約)
- The current study aimed to investigate social media trends and propose an analysis method to explore the factors underpinning the buzz phenomenon on Twitter. As it is not always possible to determine the cause of the buzz phenomenon from the text content alone posted on Twitter, we limited the analysis to tweets with attached images and devised an analysis method using both text and images. We investigated whether there is a relationshipbetween the features of both tweet text and its attached images, and how the relationship between these features is related to the number of likes and retweets (RTs) receivedthat is, indicators of popularity. We trained a multi-task neural network that takes the features extracted from the images and text as input, and then outputs the number of likes and RTs before extracting the feature vectors of the same dimension from the two inputs (images and text, respectively) from the middle layer. By calculating the distance between these feature vectors, we analyzed the relationship between the number of likes and RTs. The results revealed that the average vectors of BERT and inceptionresnetv2 served as predictors of the number of likes and RTs. We also found that tweet text with a low number of likes and RTs was short and simple.
- (キーワード)
- Twitter / multi-task learning / neural networks / trend ananlysis
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1145/3508230.3508244
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1145/3508230.3508244
(DOI: 10.1145/3508230.3508244) Ryota Kishima, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Construction of MBTI Personality Estimation Model Considering Emotional Information,
Proceedings of the 35th Pacific Asia Conference on Language, Information and Computation (PACLIC35), 262-269, Shanghai, Nov. 2021.- (要約)
- The widespread use of social networking services (SNSs) such as Twitter and Facebook in recent years have rendered it easy to interact with various people all over the world.Analysis of the user personality and emotion using features such as the text information and image information on SNSs has been researched.This study analyzes the effectiveness of using emotional information as a feature when building a personality estimation model for Twitter users. The extensively used Myers-Briggs type indicator (MBTI) is used for analysis. A method is proposed for estimating the MBTI personality pattern by extracting emotional information from Twitter and adding it to the characteristics of the distributed expressions of sentences and words.Through evaluation experiments, it is determined whether the emotional information is effective in constructing the MBTI personality estimation model. The obtained results demonstrate that the accuracy is improved when emotional information is included as a feature, compared to the case without emotional information.
- (キーワード)
- MBTI / personality analysis / 感情 (emotion) / Twitter
Construction of Emotional Similarity Word Embedding Model for Sentiment Analysis,
20th Mexican International Conference on Artificial Intelligence (MICAI2021), Oct. 2021.- (要約)
- We propose a method for constructing a dictionary of emotional expressions, which is an indispensable language resource for sentiment analysis in the Japanese. Furthermore, we propose a method for constructing a language model that reproduces emotional similarity between words, which to date has yet not been considered in conventional dictionaries and language models. In the proposed method, we pre-trained sentiment labels for the distributed representations of words. An intermediate feature vector was obtained from the pre-trained model. By learning an additional semantic label on this feature vector, we can construct an emotional semantic language model that embeds both emotion and semantics. To confirm the effectiveness of the proposed method, we conducted a simple experiment to retrieve similar emotional words using the constructed model. The results of this experiment showed that the proposed method can retrieve similar emotional words with higher accuracy than the conventional word-embedding model.
- (キーワード)
- affective computing / emotional embedding / DistilBERT / deep neural networks / 感情 (emotion)
The Relationship between Personality Patterns and Harmfulness: Analysis and Prediction based on Sentence Embedding,
3rd Technological Competency as Caring in the Health Sciences 2021, Aug. 2021.- (要約)
- In this paper, we propose a method for detecting harmful contents in social media. In the Social Networking Service (SNS) the articles and messages posted on these services can be viewed by an unspecified number of unknown people from worldwide. Recently, increasing the number of users who have been forced to close their SNS accounts or have been suffering from mental problems because of blew up SNS triggered by hate speech or bullying remarks in social media. Even if the management of the SNS takes countermeasures, it is difficult to deal with all types of harmful expressions. In this research, we focus on the characteristic that harmful statements need to be judged from the entire sentence, and extract features of harmful expressions using a general-purpose language model.
- (キーワード)
- harmful expression / sentence embedding / Internet flaming / MBTI / personality analysis
Lifestyle Analysis via a Corpus of Disease-Fighting Weblogs,
Proceedings of 2021 IEEE 2nd International Conference on Pattern Recognition and Machine Learning (PRML 2021), 266-272, Chengdu, Jul. 2021.- (要約)
- 近年,日本では糖尿病予備軍の人口が年々増加している.2型糖尿病は生活習慣病の一種で 型糖尿病は生活習慣病の一種であり,生活習慣を改善することである程度予防することができる.しかし,生活習慣に問題があると気付いた時には手遅れになってしまうこともある.そのため,生活習慣病の危険因子を早期に発見することが重要である.本研究では,生活習慣病闘病者のブログを収集し,危険因子に関連すると考えられる複数のキーワードカテゴリを設定し,カテゴリごとにラベルを付けて闘病ブログのコーパスを構築した.評価実験の結果,提案手法は,単純な手法よりも高い精度でキーワードや文章の分類を実現した.
- (キーワード)
- diabetic patients / 生活習慣病 (lifestyle-related disease) / category classification / 機械学習 (machine learning)
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/PRML52754.2021.9520697
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1109/PRML52754.2021.9520697
(DOI: 10.1109/PRML52754.2021.9520697) Minoru Yoshida, Kohno Shogo, Kazuyuki Matsumoto and Kenji Kita :
Visualization of the Artist Relations Using Twitter User Profiles,
Frontiers in Artificial Intelligence and Applications (FAIA), Fuzzy Systems and Data Mining VI,, Vol.331, 682-689, Nov. 2020.- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3233/FAIA200746
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85101594489
(DOI: 10.3233/FAIA200746, Elsevier: Scopus) Fujisawa Akira, Kazuyuki Matsumoto, Kazuki Ohta, Minoru Yoshida and Kenji Kita :
ASCII Art Classification Model by Transfer Learning and Data Augmentation,
Frontiers in Artificial Intelligence and Applications (FAIA), Fuzzy Systems and Data Mining VI, Vol.331, 608-618, Nov. 2020.- (要約)
- In this study, we propose an ASCII art category classification method based on transfer learning and data augmentation. ASCII art is a form of nonverbal expression that visually expresses emotions and intentions. While there are similar expressions such as emoticons and pictograms, most are either represented by a single character or are embedded in the statement as an inline expression. ASCII art is expressed in various styles, including dot art illustration and line art illustration. Basically, ASCII art can represent almost any object, and therefore the category of ASCII art is very diverse. Many existing image classification algorithms use color information; however, since most ASCII art is written in character sets, there is no color information available for categorization. We created an ASCII art category classifier using the grayscale edge image and the ASCII art image transformed from the image as a training image set. We also usedVGG16, ResNet-50, Inception v3, and Xceptions pre-trained networks to fine tune our categorization. As a result of the experiment of fine tuning by VGG16and data augmentation, an accuracy rate of 80% or more was obtained in the human category.
- (キーワード)
- テキストアート / アスキーアート / 転移学習 / ファインチューニング / データ拡張
- (徳島大学機関リポジトリ)
- ● Metadata: 115914
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3233/FAIA200738
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.3233/FAIA200738
(徳島大学機関リポジトリ: 115914, DOI: 10.3233/FAIA200738) Kirihara Taiga, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Keyword Extraction from TV Program Viewers Tweet Based on Neural Embedding Model,
Frontiers in Artificial Intelligence and Applications (FAIA), Fuzzy Systems and Data Mining VI, Vol.331, 360-369, Nov. 2020.- (要約)
- In recent years, young people have not been watching television (TV) as much as they used to. This is mainly because a number of TV programs are very long and/or have limited viewing times. Recently, individuals have been actively posting live-action tweets on Twitter to comment on TV content while watching programs in real time. In this study, we propose a method for extracting key phrases related to the event scenes of TV programs using live tweets, and we propose a scene search system that aims at efficient TV program viewing. The experimental results indicated that the program contents were estimated with an error of approximately 5% to 10% with respect to the program time. In addition, the extracted key phrases were visualized for each event scene category using the t-SNE algorithm.
- (キーワード)
- 自然言語処理 (natural language processing) / TV番組 / キーフレーズ抽出 / ツイッター解析
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3233/FAIA200714
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85101584659
(DOI: 10.3233/FAIA200714, Elsevier: Scopus) Kohei Torii, Minoru Yoshida, Kazuyuki Matsumoto, Jiro Tsuruki, Kobayashi Kenichiro, Eiichi Honda and Kenji Kita :
Towards Automatic Dental Diagnosis System Based on Deep Learning,
Proc. IEEE International Conference on Natural Language Processing and Knowledge Engineering, 64-65, Online, Oct. 2020. Ryu Mopuaa, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Construction of Annotated TOBYO Blog Corpus for Lifestyle Disease Analysis of Diabetic Patient,
Proceedings of The 15th International Conference on Natural Language Processing and Knowledge Engineering (NLP-KE20), 77, Oct. 2020.- (要約)
- In this study, we target to analyze weblogs authored by diabetes patients describing their struggle against their disease. In order to build a corpus for analysis, we annotate tags to the important keywords/key phrases such as blood glucose level, diet and emotions in collected weblog data. We aim at constructing a labeled lifestyle disease weblog corpus (called as TOBYO weblog corpus) to extract useful information from patients' weblogs of against illness. For example, to improve our lifestyle, it would be very useful to know how we should live every day, what kind of diet we should eat, how much exercise is appropriate, and so on. In our study, we organize the tagged data and take statistics on part-of-speech combinations. We set the top N thresholds in the rank of the frequency of the part-of-speech and create a system to exclusively pre-process the key phrases that are ranked as more frequent part of speech combinations. The extracted key phrase information is vectorized by a model of BERT (bidirectional encoder representation from a transformer), then the key phrases are sorted out by making a model for category prediction that uses two inputs (BERT vector and character frequency vector). To evaluate our proposed method, we conduct cross validation test and open test by using several machine learning algorithms. In comparison with the baseline classification method, which is a simple and ordinal neural network method, our method can achieve higher performance.
- (キーワード)
- 闘病コーパス / ニューラルネットワーク / ブログ / 生活習慣病 (lifestyle-related disease) / 糖尿病 (diabetes)
Construction of lifestyle disease weblog corpus and evaluation of keyword classification model,
International Forum on Advanced Technologies 2020 (IFAT2020), Mar. 2020.- (キーワード)
- 生活習慣病 (lifestyle-related disease) / weblog corpus / keyword classification
Emotional State Estimation by Dialogue History and Sentence Distributed Representation,
Proceedings of 2019 6th IEEE International Conference on Cloud Computing and Intelligence Systems(CCIS2019), 31-35, Singapore, Dec. 2019.- (要約)
- The paper presents a novel approach to predict humans emotion in the dialogue. We target the scenario dialogue corpora. The corpora are annotated by some subjects with emotion tag. We use sentence embedding by Bidirectional Encoder Representations from Transformers as versatile and rich feature. By acquiring multi-context information from dialogue text, the accuracy of emotion prediction can be improved. As an experiment by machine learning algorithm such asdeep neural networks for the proposed method, we achieved higher accuracy than the method using embedding feature from utterance itself.
- (キーワード)
- dialogue sentences / dialogue emotion estimation / sensibility robotics
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/CCIS48116.2019.9073750
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85085005205
(DOI: 10.1109/CCIS48116.2019.9073750, Elsevier: Scopus) Yuko Sakuta, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Kansei Mapping of Color Images Using Earth Mover's Distance,
International Conference on Software Technology and Engineering (ICSTE2019), Oct. 2019. Akira Fujisawa, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
An Approach for Conversion of Japanese Emoticons into Emoji Based on Character-Level Neural Autoencoder,
Frontiers in Artificial Intelligence and Applications, Vol.320, 635-644, Oct. 2019.- (要約)
- In this paper, we propose a method for converting Japanese emoticons into emoji. The method creates a model that translates text into emoji using training neural networks with a character-based feature; the model determines the positive/negative/neutral polarity of the emoji from the text. By extracting a feature vector from the hidden layer of the model, we calculate the similarity between the input sentence and the text annotated with emoji in the database; the conversion candidates come from the emoticon in the input text. In comparison tests of the proposed method and a word-level feature method that uses a word distributed representation vector, the emoji emotion polarity-based model achieved a maximum accuracy rate of 90.0%, representing an 8% improvement over the word-level feature method.
- (キーワード)
- emoji / emoticon / neural autoencoder
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3233/FAIA190231
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.3233/FAIA190231
(DOI: 10.3233/FAIA190231) Kazuyuki Matsumoto, Mopaa Ryu, Minoru Yoshida and Kenji Kita :
Emotion Analysis on Weblog of Lifestyle Diseases,
Proceedings of the 2019 International Symposium on Signal Processing Systems (SSPS2019), 142-148, Beijing, Sep. 2019.- (要約)
- In this paper, we investigate the relation between patient lifestyle and emotional state transition by analyzing weblog articles written by patients with diabetes. To conduct our analysis, we use blood sugar level and body weight to indicate the disease condition, together with meal keywords and sentences that express feelings in the selected weblogs. A corpus annotated with a tag to word units in the target articles is constructed and a method of keyword classification based on the constructed corpus is proposed and evaluated. Finally, we analyze whether the indicated emotion is positive or negative in sentences expressing emotion in the corpus and investigate the relation between the emotion and a change in blood sugar level.
- (キーワード)
- テキストマイニング (text mining) / 糖尿病 (diabetes) / 生活習慣病 / 感情分析 / 機械学習 (machine learning)
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1145/3364908.3365294
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85077207726
(DOI: 10.1145/3364908.3365294, Elsevier: Scopus) Kazuyuki Matsumoto, Yuta Hada, Minoru Yoshida and Kenji Kita :
Analysis of Reply-Tweets for Buzz Tweet Detection,
Proceedings of 33rd Pacific Asia Conference on Language, Information and Computation (PACLIC33), 138-146, Sep. 2019.- (要約)
- In this study, we propose a method for predicting whether a tweet will create a buzz on the Internet by examining tweeted replies posted by others. We also investigate the distinguishing characteristics of replies to buzz tweets by analyzing feature amounts. Our proposed method first converts each reply tweet into a vector expression using a word distributed representation or some other vectorization method. We then apply a machine learning method for binary classification todetermine whether the reply is to a buzz tweet or a non-buzz tweet. We classify the target tweet into buzz or non-buzz categories by comparing the total buzz and non-buzz scores produced by the classifier. The proposed method using StarSpace achieved 93.1% F1-score, while an approach that used number of retweets and number of favors (likes) achieved 77.8% F1-score. Wealso found that there are a number of words that are characteristic of buzz tweet replies anda number of words that are characteristic of non-buzz tweet replies.
- (キーワード)
- テキストマイニング (text mining) / Twitter / buzz tweet / StarSpace / Deep learning
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85084953625
(Elsevier: Scopus) Kazuyuki Matsumoto, Manabu Sasayama, Minoru Yoshida and Kenji Kita :
Personality Analysis on Dialogue System for Emotional Interaction Robot,
Conference Proceedings of Asia Pacific Society for Computing and Information Technology 2019 Annual Meeting (APSCIT 2019 Annual Meeting), Jul. 2019.- (要約)
- In this study, we proposed the personality analysis method for dialogue system towards realization of emotional interaction robot. To achieve smooth communication between human and robot in dialogue, it is necessary that overcome feeling of strangeness by generating dialogue utterance based on consistent personality. Firstly, we extract the wording feature from utterance texts on social media. To obtain relation between the wording feature and personality ego-state level, we use sentence level embedding feature and create state level estimator for each ego-state. Next, we evaluate the ego-state level estimator with an evaluation test set. Finally, we use this estimator for analysis of chat-bot dialogue. By comparing the existing chat-bot dialogue and user utterance, we consider about non-reality of current chat-bot dialogue generation.
- (キーワード)
- personality analysis / dialogue system / egogram / emotional interaction robot
Research on statements in tweets and sleep time of classification,
the 3rd International Conference on Natural Language Processing and Information Retrieval, Tokushima, Japan, Jun. 2019. Horikawa Haruki, Minoru Yoshida, Kenji Kita and Kazuyuki Matsumoto :
Extended Dataset for Food Image Classification Based on Twitter,
Hong Kong International Conference on Engineering and Applied Science (HKICEAS 2018), Dec. 2018. Minoru Yoshida, Kazuyuki Matsumoto and Kenji Kita :
Modeling Relations Between Profiles and Texts,
Proceedings of the 14th the Asia Information Retrieval Societies Conference (AIRS 2018), LNCS 11292, 103-109, Taipei, Nov. 2018.- (要約)
- Twitterのテキストと投稿者のプロフィールを同時にモデル化する手法を提案する.提案手法では,テキスト中の単語とプロフィール中の単語との関連を考慮したん分散表現学習を行い,それぞれの単語のベクトル表現を獲得する.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-030-03520-4_10
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85057273674
(DOI: 10.1007/978-3-030-03520-4_10, Elsevier: Scopus) Akira Fujisawa, Kazuyuki Matsumoto, Ohta Kazuki, Minoru Yoshida and Kenji Kita :
ASCII Art Category Classification based on Deep Convolutional Neural Networks,
Proceedings the 5th IEEE International Conference on Cloud Computing and Intelligence Systems (CCIS), 345-349, Nanjing, Nov. 2018.- (要約)
- ソーシャルメディア上のテキストベースのコミュニケーションでは,絵文字は,感情を伝達し,短いテキストでスムーズなコミュニケーションを促進する重要な方法を提供する.非言語表現として,アスキーアートの文字そのものには意味はないが,文字の位置や形を用いることで,感情や意図を視覚的に表現することができる.文字を特徴量としてアスキーアートを分類することはこれまで困難であった.本稿では,アスキーアートを画像に変換し,深層学習を用いてアスキーアートを分類する手法を提案する.評価実験では,97%の分類成功率を達成することができた.
- (キーワード)
- ASCII Art / 分類 (classification) / Deep learning / Convolutional Neural Networks
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/CCIS.2018.8691245
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85064980913
(DOI: 10.1109/CCIS.2018.8691245, Elsevier: Scopus) Kazuyuki Matsumoto, Manabu Sasayama, Minoru Yoshida, Kenji Kita and Fuji Ren :
Transfer Learning Based on Utterance Emotion Corpus for Lyric Emotion Estimation,
Proceedings of 2018 5th IEEE International Conference on Cloud Computing and Intelligence Systems (CCIS), 699-703, Nanjing, Nov. 2018.- (要約)
- 感情推定の研究では,従来,コーパスベース,辞書ベース,またはルールベースの様々なアプローチが存在する.しかし,各ドメインに適した言語リソースを用意する必要があり,多大なコストがかかる.本稿では,転移学習を用いて歌詞フレーズの感情を推定する手法を提案する.既存の発話感情コーパスを歌詞感情推定タスクに適用することで,単純なBag of Wordsモデルを用いたtf-idfベクトルおよびロジスティック回帰モデルによるベースライン法と比較し,より高い精度を得た.
- (キーワード)
- Transfer learning / Emotion estimation / Lyric / Word embedding
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/CCIS.2018.8691207
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85064985706
(DOI: 10.1109/CCIS.2018.8691207, Elsevier: Scopus) Bando Koji, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Twitter User's Hobby Estimation Based on Sequential Statements Using Deep Neural Networks,
2018 10th International Conference on Software Technology and Engineering, Oct. 2018.- (キーワード)
- Twitter / 趣味推定 / ニューラルネットワーク / ランダムフォレスト / サポートベクトルマシン
Emoticon-based emotion analysis for Weibo articles in sentence level,
Lecture Notes in Computer Science, Vol.11248, 104-112, Oct. 2018.- (キーワード)
- Emotion Analysis / Emoticon
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-030-03014-8_9
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85057082718
(DOI: 10.1007/978-3-030-03014-8_9, Elsevier: Scopus) Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Classification of Emoji Categories from Tweet Based on Deep Neural Networks,
Proceedings of the 2nd International Conference on Natural Language Processing and Information Retrieval (NLPIR2018), 17-25, Bangkok, Sep. 2018.- (要約)
- In this paper, we describe the sentiment analysis method from tweets based on emojis category. Many of existing study about sentiment analysis focused on the emotional expressions included in sentence. However, because there are various kinds of emotional expressions, such as Internet slang, it cannot be constructed that the fixed emotional expression dictionary. The most of the methods based on corpus and machine learning, its performance is quite depended on the quality of annotation. Therefore, we attempt to use categories which are expressed by emoji as sentiment label instead of manually annotated labels. Our proposed method uses automatically annotated category label by emoji which is annotated to sentence, and train word embedding feature by deep neural networks. As the result of the experiment, our proposed method overcome the simple word feature based method.
- (キーワード)
- 絵文字 / Twitter / 深層ニューラルネットワーク
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1145/3278293.3278306
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1145/3278293.3278306
(DOI: 10.1145/3278293.3278306) Nakao Hidetoshi, Jirela Dilixiati, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Emotion Recognition from Emoticons using Convolutional Neural Networks,
Proceedings of 2nd Technological Competency as Caring in the Health Sciences 2018, 72, Aug. 2018.- (要約)
- In recent years, text communication has been grown steadily so that all kinds of daily contacts could be conducted now through Internet based text messaging services. As an advantage of text-based communication via the Internet, we can quickly interact with anyone wherever we are. At the same time, since it is difficult to express emotions with each other only with text, the chance of adding non-verbal information such as photos to text is increasing. Among the non-verbal information, there are emoticons in expressions that have been developed by Internet bulletin boards, chat, e-mail, etc. In particular, the types of emoticons used in Japan are diverse, even now; various types of emoticons continue to increase. There have been studies on these emoticons until now, which have become increasingly important in recent years. In this paper, we propose a method to classify facial expressions expressed from emoticons by letting deep convolutional neural networks. When recognizing emotions from emoticons, it is not known that seeing emoticons in character units is very effective. Information such as role positioning and coexistence roles is necessary. Characters in emoticons differ depending on font it also gives different impressions depending on context. In order to realize semantic analysis / emotion analysis considering emoticons, it is necessary to provide a corpus that records various kinds of emoticons and a database that gives information such as meanings and emotions expressed by emoticons. However, including all the emoticons is difficult, and since the emoticons are more vague than ordinary language expressions, that is why the construction of the dictionary is delayed. In this paper, we propose a method to classify the emotions of the emoticons by letting the deep convolutional neural network learn the features of the emoticons. By treating the emoticon as an image, the visual features can be captured and it is considered that natural recognition can be performed instead of processing like a character string. In addition, since the emoticon characterizes the facial expression with a character string, there is a problem that the impression is different only when the used fonts are different from each other, and therefore, when different fonts are used, how the classification accuracy is changed, we consider whether to do so.
- (キーワード)
- 顔文字 / 畳み込みニューラルネットワーク / 感情認識 / データ拡張
Sentence Emotion Classification for Intelligent Robotics Based on Word Lexicon and Emoticon Emotions,
Proceedings of the International Conference of Intelligent Robotic and Control Engineering, 38-41, Aug. 2018.- (キーワード)
- ロボティクス (robotics) / 自然言語処理 (natural language processing)
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/IRCE.2018.8492969
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85056756985
(DOI: 10.1109/IRCE.2018.8492969, Elsevier: Scopus) Ryusei Matsumoto, Minoru Yoshida, Kazuyuki Matsumoto, Hironobu Matsuda and Kenji Kita :
Visualization of the occurrence trend of infectious diseases using Twitter,
Proceedings of the 11th edition of the Language Resources and Evaluation Conference (LREC 2018), (poster), 511-514, May 2018.- (要約)
- 感染症の流行を可視化するシステムを提案する.Twitterデータを対象に,投稿者が感染の当事者か否かを判定する事実性解析を行い,結果を用いて可視化する.複数の感染症について提案手法を適用し,その効果を示す.
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85059887520
(Elsevier: Scopus) Jirela Dilixiati, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Predicting facial expression from emoticon based on convolutional neural networks,
4th International Forum on Advanced Technologies (IFAT 2018), Mar. 2018.- (要約)
- Text communication has been developed in recent years, all kinds of daily contacts are through the SNS regardless of age, gender and active. As an advantage of text-based communication via the Internet. There is a point that you can quickly respond to anyone wherever you are. In this paper, by letting the deep convolution neural network learn the image features of emoticons. We propose a method to classify by emotion expressed by emoticons. By treating emoticons as images, it is possible to capture visual features and think that natural identification can be made rather than handling as character strings.
- (キーワード)
- 顔文字 / 畳み込みニューラルネットワーク / 感情 / 顔表情
The Effectiveness of Image Data Augmentation for Deep Learning,
Conference Abstract of the 3rd International Conference on Multimedia and Image Processing, 19, Mar. 2018.- (キーワード)
- Deep Learning / Data Augmentation / 画像処理 (image processing)
Visual Similarity for ASCII Arts Using Image Features,
Proceedings of the 2018 2nd International Conference on Machine Vision and Information Technology (CMVIT 2018), 17, Hong Kong, Feb. 2018.- (要約)
- Communication with various types of non-verbal expressions has been increasing on Social Networking Services. Among them, ASCII art is a character-based design technique to express human emotions. In many cases, ASCII arts are generated from original images by mapping some region of pixels to a certain character. In the field of natural language processing, ASCII arts are treated as sequences of characters. In addition, there have been few studies that aim to analyze or classify ASCII arts. In this paper, we extract characteristics of ASCII arts using image shape features. Our image shape-based features provide visual similarity between ASCII arts that are invariant across image scale and characters used in ASCII arts. Moreover, the proposed method enable us to compare visual similarity between ASCII arts and original images. To extract shape features from ASCII arts, we use image features of original images by converting ASCII arts to images. In the experiment, we compared visual similarity between ASCII arts and original images by using Histograms of Oriented Gradients(HOG). Our experimental result shows that the proposed method is effective to compare visual similarity between ASCII arts and original images.
- (キーワード)
- visual similarity / ascii art / image feature
Review Score Estimation Based on Transfer Learning of Different Media Review Data,
Proceedings of The 12th International Conference on Natural Language Processing and Knowledge Engineering(NLP-KE'17), 185-199, Dec. 2017.- (要約)
- In this paper, we proposed a model to classify reviews based on review data of different media. Recently, researches have been actively made on transfer learning between different domains with various kinds of big data as a target. Evaluation expressions are usually different in different domains, and this becomes a barrier for reputation analysis. Users usually use different linguistic expressions to refer to the creative works of each media. For example, media such as "anime", "comics", "games" and "movies" have different terms or expressions to be described their creative works. These differences can be considered showing features of each medium and such differences should be found in other expressions as well as in evaluation expressions. We analyzed what effect such differences would cause to classication accuracy by conducting transfer learning between review data ofdifferent media. In this paper, we proved compatibility between original (pre-transferring) and target (post-transferring) media for each medium of the creative works by constructing a review classication model. As a result of evaluation experiments, we could more accurately estimate review score without using SO-Score for training of review fragment based on Long Short Term Memory (LSTM) than the SO-Score based method.
- (キーワード)
- レビュー分類 / 転移学習 / Long Short-Term Memory / 異メディア
Index Generation of BGM Video Based on Distinctive Comments,
Proceedings of The 12th International Conference on Natural Language Processing and Knowledge Engineering(NLP-KE'17), 179-184, Dec. 2017.- (要約)
- The purpose of this study is to generate indexes to the BGMs based on the distinctive comments annotated to the BGM videos posted on Nico Nico Videos. Our proposed method detects the end/start positions of the BGMs considering the increase/decrease of the number of the comment data, the comments distinctive to the songs and the exclamatory expressions annotated to the videos. The evaluation result showed that the proposed method could generate correct indexes within 10 seconds error for the BGM videos with length of less than 40 minutes and with annotation of over 30,000 comments.
- (キーワード)
- ニコニコ動画 / インデックス生成 / 作業用BGM
Emotion Estimation Adapted to Gender of User Based on Deep Neural Networks,
Proceedings of The 12th International Conference on Natural Language Processing and Knowledge Engineering(NLP-KE'17), 166-178, Dec. 2017.- (要約)
- In this study, we focus on a representative SNS, Twitter and target emotion estimation from tweets posted on Twitter. we construct emotion estimation models applicable to each gender. It is considered that there would be different word usage tendencies depending on gender. Therefore, we analyze what difference exists in usage tendency of slangs or emoji, which are thought to be related to emotion, depending on gender. Then, we propose a method to improve emotion estimation based on neural networks by usingdistributed representation models for each gender. As the result of the evaluation experiments, the higher estimation accuracy was realized by training with Deep Convolutional Neural Networks using word's distributed representation as feature than by training with Feed Forward Neural Networks.
- (キーワード)
- emotion estimation / user's gender / deep neural networks
Facial Expression Classification Based on Shape Feature of Emoticons,
Proceedings of 1st International Conference on Machine Learning and Data Engineering (iCMLDE2017), 29-34, Sydney, Nov. 2017.- (要約)
- Emoticons are used in the situation of textual communication such as web mails and internet forums. Many of the existing studies dealing with classification or extraction of emoticons regard emoticons as a kind of character string and focus on what characters constitute the emoticons or how they are lined up. However, emoticons are used to express human facial expressions, and characters constituting them represent various facial parts such as eyes, nose, mouth, etc. Such characters can be identified as different facial parts depending on their positions, and facial expressions are thought to be represented by the combinations of their shape features. In this study, we classified the facial expressions of emoticons by focusing on the shape features of those emoticons. To deal with shape features of emoticons, we converted emoticons, which are text data, to image data. Emoticons are mainly formed by line segments of characters, and use only black and white colors. Therefore, other factors such as colors and shades were not considered as the feature to classify the facial expressions. In the experiments, we used image features that did not require color information. As the result of comparative experiment with the 1-nearest neighbor method using character features, the facial expression recognition rate is 52% when using the Histograms of Oriented Gradients(HOG) was used as image feature. By this result, proposed method improved recognition rate by 2 % than using baseline.
- (キーワード)
- facial expression classification / 顔文字 / 画像特徴
Gender Estimation from Facial Images by Deep Neural Network,
Proceedings of Annual Conference on Engineering and Applied Science, Nov. 2017.- (要約)
- In this paper, we collect new learning data and learned this by the existing neural network in order to exceed the accuracy of the model of the existing research. As a result, we succeeded in improving the accuracy by increasing the learning data. However, we discovered that performance declined due to biased learning data. The future task is to further improve accuracy and Research the relationship between bias and accuracy of learning data.
- (キーワード)
- 性別推定 / 顔画像 / 深層ニューラルネットワーク / 画像処理 (image processing) / 深層学習
Emotion Recognition of Emoticon Based on Character Embedding,
9th International Conference on Software Technology and Engineering (ICSTE2017), Hong Kong, Oct. 2017.- (要約)
- 本研究では,顔文字の文字意味分散表現を用いた顔文字の感情認識をおこなう.従来の顔文字研究では,文中から顔文字を抽出したり,顔文字を構成パーツに分解しその組み合わせによる感情認識などがおこなわれてきた.近年発展してきた単語埋め込み技術を応用し,顔文字の文字単位での意味を学習し,特徴量として用いることで,より汎用的な顔文字の感情認識を試みる.文字の分散表現を素性として深層畳み込みニューラルネットワークに学習させる手法により構築した顔文字感情認識モデルを交差検証法により評価した結果,未知顔文字に対する感情認識を,単純な文字n-gram出現頻度ベクトルを素性として用いた手法よりも高い精度でおこなえることが分かった.
- (キーワード)
- 顔文字 / 感情認識 / 文字埋め込み / 畳み込みニューラルネットワーク
Face Identification Based on Deep Convolutional Neural Networks,
9th International Conference on Graphic and Image Processing, Oct. 2017.- (キーワード)
- 顔認証 / 深層ニューラルネットワーク
Flame Prediction Based on Harmful Expression Judgement Using Distributed Representation,
Book of Abstracts Proceeding of Engineering & Technology, Computer, Basic and Applied Sciences (ECBA-2017), Vol.3, No.16, 11, Taipei, Sep. 2017.- (要約)
- In recent years, flaming on social media has been a problem. To avoid flaming, it is useful for the system to automatically check the sentences whether they include the expressions that are likely to trigger flaming or not before posting messages. In this research, we target two harmful expressions. There are insulting expressions and the expressions that are likely to cause a quarrel. Firstly, we constructed an original harmful expression dictionary. Because a large cost requires to collect the expressions manually, we constructed the dictionary semi-automatically by using word distributed representations. The proposed method used distributed representations of the harmful expressions and general expressions as features, and constructed a classifier of harmful/general based on those features. An evaluation experiment found that the proposed method could extract harmful expressions with accuracy of approx. 70%.On the other hand, it was found that the proposed method could also extract unknown expressions, however, it wrongly extracted non-harmful.
- (キーワード)
- Flame Prediction / Harmful Expression / Distributed Representation / Support Vector Machine
Distributed Representations for Words on Tables,
Proceedings of the 21st Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD 2017), Part-I (LNAI 10234), 135-146, May 2017.- (要約)
- 表形式中の単語に対する分散表現学習の手法を提案する.提案手法では,同一行のセル,同一列のセルという二種類の文脈を考慮し,水平方向と垂直方向の二種類の単語関係を同時にモデル化する.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-319-57454-7_11
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85018412327
(DOI: 10.1007/978-3-319-57454-7_11, Elsevier: Scopus) Minoru Yoshida, Kazuyuki Matsumoto and Kenji Kita :
Acceleration of Similar Word Search in Distributed Representation,
Proceedings of the 18th International Conference on Computational Linguistics and Intelligent Text Processing (CICLING 2017) (poster), Apr. 2017.- (要約)
- コサイン類似度を用いた単語分散表現ベクトルの検索を高速化するための手法を提案する.提案手法は,類似尺度をユークリッド距離に変換し,距離計算そのものに対して分枝限定法を適用し,しきい値を超えた距離計算を途中で打ち切るというアイデアにより高速化を図る.さらに,PCAを用いてベクトル表現そのものを変換する前処理により,距離計算におけるさらなる加算・乗算演算の削減を行う.
A Comparison of Face Recognition Features Derived from Convolutional Neural Networks,
Conference Abstracts of the 2017 International Conference on Frontiers of Image Processing, 17, Kathmandu, Nepal, Mar. 2017. Kazuyuki Matsumoto, Tanaka Satoshi, Minoru Yoshida, Kenji Kita and Fuji Ren :
Ego-state Estimation from Short Texts Based on Sentence Distributed Representation,
The 11th International Conference on Natural Language Processing and Knowledge Engineering (NLP-KE'16), Dec. 2016.- (キーワード)
- ego-state / egogram / deep neural network / sentence distributed representation
Improvement of the Histogram for Infrequent Color-Based Illustration Image Classification,
Fuzzy Systems and Data Mining II, Frontiers in Artificial Intelligence and Applications, Vol.293, 299-305, Dec. 2016.- (キーワード)
- イラスト画像 / 色ヒストグラム / 画像分類 / 作風
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3233/978-1-61499-722-1-299
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.3233/978-1-61499-722-1-299
(DOI: 10.3233/978-1-61499-722-1-299) Minoru Yoshida, Kazuyuki Matsumoto and Kenji Kita :
Table Topic Models for Hidden Unit Estimation,
Proceedings of the 12th Asia Information Retrieval Societies Conference (AIRS2016), LNCS 9994, 302-307, Dec. 2016.- (要約)
- 表形式中に出現する数値について,省略された単位を推定する手法を提案する.Wikipediaの表形式を対象に,数値のみを含むセルに対して,どの単位が適切であるかを推定する.同一列の第一行目の単語等の文脈情報を用いてそのような推定を行うほか,表形式と周囲の文章を同時にモデル化できる表形式トピックモデルを提案し,それによるパラメータ推定結果を用いることで,精度の向上を図る.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-319-48051-0_23
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-85007107751
(DOI: 10.1007/978-3-319-48051-0_23, Elsevier: Scopus) Kazuyuki Matsumoto, Minoru Yoshida, Kenji Kita, Yunong Wu and Iwasa Fumihiro :
Effect of Users Attribute on Emotion Estimation from Twitter,
Proceedings of the 2nd IEEE International Conference on Computer and Communications, Vol.3, 1186-1190, Oct. 2016.- (要約)
- This study focused on emotion estimation fromutterances on Twitter and analyzed the differences caused forestimation according to the attributes of users. SNS userspossess various user attributes. If we could clarify the tendencyfor each attribute to involve emotion estimation, we would beable to create an emotion estimation model suitable for eachattribute. This study considered two attributes, sex and job, andinvestigated the tendency of emotion estimation based on anemotion estimation model constructed by machine learning. Inthis paper, as a feature for machine learning, we used asentence vector that was obtained by the summation of theword distributed expressions. As a result of the evaluationexperiment using a method based on the nearest neighbormethod, we obtained 0.4 higher estimation accuracies thanusing a baseline method based on a simple Bag of Words model.
- (キーワード)
- user attribute / emotion recognition / Twitter
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/CompComm.2016.7924892
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.1109/CompComm.2016.7924892
(DOI: 10.1109/CompComm.2016.7924892) Kazuyuki Matsumoto, Seiji Tsuchiya, Minoru Yoshida and Kenji Kita :
Judgment of Slang Based on Character Feature and Feature Expression Based on Slangs Context Feature,
Communications in Computer and Information Science, Vol.652, 280-288, Kuala Lumpur, Sep. 2016.- (要約)
- This paper proposes a method to distinguish standardwords from slang words using information from the characters comprising thecharacter string. An experiment testing the effectiveness of our method showeda 30 % or more improvement in classification accuracy compared to the baselinemethod. We also use a contextual feature related to emotion to expand theunregistered slang word in the training data into other expressions and proposean emotion estimation method based on the expanded expressions. In our experiment,successful emotion estimation was obtained in nearly 54 % of the cases, anotably higher rate than with the baseline method. Our proposed method wasshown to have validity.
- (キーワード)
- 俗語 / 文字特徴 / 文脈特徴 / 未知表現
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-981-10-2777-2_25
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-84989337887
(DOI: 10.1007/978-981-10-2777-2_25, Elsevier: Scopus) Zhang Guoliang, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Face Identification based on Deep Learning Using Low Pixel Images,
International Conference on Engineering & Technology, Computer, Basic & Applied Sciences, Jul. 2016. Kazuyuki Matsumoto, Manabu Sasayama, Kohsuke Miyauchi, Minoru Yoshida and Kenji Kita :
Lyric Retrieval System Based on Word's Intimacy Value,
Advances in Engineering Research, Vol.24, 84-87, May 2016.- (キーワード)
- Lyric retrieval / Query expansion / Word intimacy value
An Approach to Refine Translation Candidates for Emotion Estimation in Japanese-English Language,
Proceedings of the 7th International Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management, Vol.2, 74-83, Nov. 2015.- (要約)
- テキストからの感情推定の研究のほとんどは機械学習手法を用いている.機械学習は,大量の事例コーパスを必要とするため,高品質な訓練データをどのように入手するかが,議論すべき主要な問題の一つである.既存の言語資源は,感情コーパスを含む.しかし,言語が異なると,利用できない.我々は,日英対訳感情コーパスを用いて,訓練データを別の言語に変換する手法を提案する.対訳辞書により,各文のすべての単語に対して対訳候補が抽出される.抽出された対訳候補は,感情推定に高く貢献する語に絞り込み,それらを訓練データとして用いる.提案手法により構築された訓練データを用いて,評価実験を行った結果,感情推定の精度はNaive Bayes分類器を用いて66.7%に向上した.
- (キーワード)
- 感情コーパス / 感情推定 / タグ付き対訳コーパス
Slang Analysis Based on Variant Information Extraction Focusing on the Time Series Topics,
the 10th International Conference on Natural Language Processing and Knowledge Engineering, Sapporo, Japan, Oct. 2015. Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Sensibility Estimation Method for Youth Slang by Using Sensibility Co-occurrence Feature Vector Obtained from Microblog,
Proceedings of the 2015 IEEE International Conference on Computer and Communications (ICCC2015), Oct. 2015.- (要約)
- TwitterなどのSNSにおいて,簡潔に個人の思いや意図を伝えるために省略表現や顔文字表現を多用する場面が増加している.こうした表現は,その多くが形態素解析などの既存の辞書に登録されておらず未知表現として解析される.そのため,テキストマイニングにおける評判分析の精度向上の障壁となることが考えられる.また,こうした未知語のクラスタリングに文脈を用いる方法が主流であるが,その多くが分かち書き処理を前提としているため,若者言葉のような未知表現の分割誤りに弱いという欠点がある.本論文では,未知表現が分割誤りを起こす場合においても適切な文脈を取得し,そこから感性を推定する手法を提案する.また,取得した文脈ベクトルは膨大な次元数に上るため,低次元で簡潔な表現として感性語との共起をもとに素性ベクトルを生成する手法を提案する.提案手法の評価実験の結果,分割誤りが生じる若者言葉に対し,分割誤りが生じない若者言葉と同等の感性推定精度が得られることが明らかになった.
- (キーワード)
- 俗語 / マイクロブログ / ツイッター / 感情計算 / 感性分類
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/CompComm.2015.7387618
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-84963939887
(DOI: 10.1109/CompComm.2015.7387618, Elsevier: Scopus) Kazuyuki Matsumoto, Kyosuke Akita, Minoru Yoshida, Kenji Kita and Fuji Ren :
Estimate the Intimacy of the Characters Based on Their Emotional States for Application to Non-Task Dialogue,
Proceedings of the 6th International Conference on Affective Computing and Intelligent Interaction (ACII2015), 327-333, Xi'an, Sep. 2015.- (要約)
- 非タスク型対話においては,ユーザとの会話を円滑かつ柔軟にするための工夫が必要となる.たとえば,ユーザの現実世界での人間関係を考慮することで,システムとユーザという閉じた人間関係から一歩踏み出すことが可能と考える.本稿では,演劇台本を題材に,対話中の2者間の人間関係を「親密度」という尺度により表現することを試みる.親密度に関わると考えられる要素として,発話の応答回数や発話中の態度などがある.本論文では,そのなかでも発話中の感情状態に着目することで,高精度な親密度推定の実現を試みる.評価実験の結果,発話役割に基づく従来手法を上回る高精度な親密度推定を実現することが出来た.
- (キーワード)
- 親密度推定 / 演劇台本コーパス / 感情認識
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/ACII.2015.7344591
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-84964027376
(DOI: 10.1109/ACII.2015.7344591, Elsevier: Scopus) Kazuyuki Matsumoto, Minoru Yoshida, Qingmei Xiao, Luo Xin and Kenji Kita :
Emotion Recognition for Sentences with Unknown Expressions based on Semantic Similarity by Using Bag of Concepts,
Proceedings of the 12th International Conference on Fuzzy Systems and Knowledge Discovery (FSKD'15), 1428-1433, Aug. 2015.- (要約)
- 従来研究では,感情表現,文構造の辞書や感情コーパスのようなテキストからの感情推定のための様々な手法を用いていた.しかし,既存の形態素解析辞書に含まれている表現に着目したものがほとんどで,それらは,未知語,とくに新しく作られた語への対応が不十分であった.日本では,weblogやSNSが普及において,10代から20代のweblogユーザが頻繁に新語を用いる.我々の研究では,新語を含んだweblogテキストから作成した感情コーパスを分析し,これらのテキストからの感情推定手法を提案する. とくに,我々は,単語の意味的な類似性に着目し,さらに,感情を含む表現に対して重み付けすることを考えた.また,若者言葉をはじめとする俗語は,意味的な分類があいまいであるため,既存のシソーラス等への辞書に登録することは困難である.こうした語に対処するため,我々が収集した大規模なTwitterコーパスから単語間の意味的な類似性を計算する.提案手法では,単語を意味のクラス番号に変換することで,学習データに含まれない語への対処を実現する.複数の機械学習による分類器を適用した評価実験の結果,提案手法は,ベースライン手法であるBag of wordsによる感情推定よりも高精度な感情推定がおこなえることがわかった.
- (キーワード)
- Bag of concepts / emotion recognition / unknown expression / semantic similarity
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/FSKD.2015.7382148
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-84966470618
(DOI: 10.1109/FSKD.2015.7382148, Elsevier: Scopus) Minoru Yoshida, Kazuyuki Matsumoto, Qingmei Xiao, Xielifuguli Keranmu, Kenji Kita and Hiroshi Nakagawa :
Extracting Corpus-Specific Strings by Using Suffix Arrays Enhanced with Longest Common Prefix,
Proceedings of the 10th Asia Information Retrieval Society Conference (AIRS 2014), LNCS 8870, 360-370, Kuching, Dec. 2014.- (要約)
- すべての部分文字列を候補とする新しい用語抽出手法を提案する.提案手法は,接尾辞配列を用いることにより,接尾辞木の節点を辿る操作をエミュレートする.言語的切れ目の良さを表すスコアと,分野特有度を表すスコアの2種のスコアを,リランキング手法により組み合わせて,候補のランキングを行う.実験により,頻度の高い用語に関しては,前処理で形態素解析を行う従来手法よりも高い精度で用語抽出が行えることを示す.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-319-12844-3_31
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-84912135895
(DOI: 10.1007/978-3-319-12844-3_31, Elsevier: Scopus) Kazuyuki Matsumoto, Sasayama Manabu, Qingmei Xiao, Fujisawa Akira, Minoru Yoshida and Kenji Kita :
Reranking the Search Results for Lyric Retrieval Based on the Songwriters' Specific Usage of Words,
Electronics, Communications and Networks IV Proceedings of the 4TH Internationa Conference on Electronics, Communications and Networks, 12 15 December 2014, Beijing, China, 1045-1052, Beijing, Dec. 2014.- (要約)
- 作詞者がよく用いる語を考慮することで歌詞検索の精度向上を目指す手法を提案する.既存の検索におけるクエリ拡張では,単語の共起関係を大規模テキストデータから得るものが多かった.しかしながら,歌詞の場合は,一般的なテキストデータとは語の共起傾向が異なることが先行研究からも明らかである.本論文で提案する手法は,歌詞においてよく出現するフレーズを分析する.また,検索に用いる歌詞片に人為的にノイズを加えることによる精度低下を抑えるため,誤りを検出する方法を考える.歌詞のtrigramによる曖昧検索に基づく拡張候補語の取得をおこなう.拡張候補語をキーとして,文脈的に類似したキーワードを検索クエリに加えたうえでの歌詞検索結果に対し,作詞者ごとに単語に重み付けすることでランキング結果を改善する.提案手法により,重み付けを行わない手法に比べMRRが向上することが確認できた.
- (キーワード)
- 歌詞検索 / クエリ拡張
Emotion Predicting Method Based on Emotion State Change of Personae according to the Other's Utterance,
Proceedings of the 3rd IEEE International Conference on Cloud Computing and Intelligence Systems(CCIS2014), 427-432, Nov. 2014.- (要約)
- 対話の流れからの相手の感情予測は,我々人間にとって自然なタスクであるが,会話システムやロボットにとっては非常に困難なタスクといえる.その理由として,人間の感情は対話時でも常に変化するものであり,その変化は内部の自我感情状態が外界からの刺激に反応することにより起きていると考えられる.従来の対話研究では,質問応答システムなどへの応用のため,発話の表面的特徴に着目したものがほとんどであり,内部感情と外界刺激との関連に着目したものは少なかった. 本論文ではシナリオにおける会話文に着目する.会話の流れや人間関係を分析する際に役立つ各種情報のタグ付けをコーパスに対しおこない,シナリオ感情コーパスを構築する. このコーパスを分析することで,他者の発話や感情が,感情の変化にどのような影響を及ぼすかについて考察した. この自己感情から相手感情の変化を予測する手法として,感情予測重みに基づいた手法を提案し,評価実験の結果,有効性を確認できた.
- (キーワード)
- emotion prediction / scenario corpus / emotion corpus
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/CCIS.2014.7175773
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-84988227783
(DOI: 10.1109/CCIS.2014.7175773, Elsevier: Scopus) Minoru Yoshida, Kazuyuki Matsumoto, Kenji Kita and Hiroshi Nakagawa :
Unsupervised Analysis of Web Page Semantic Structures by Hierarchical Bayesian Modeling,
Proceedings of the Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD) 2014, Part II, LNAI 8444, 572-583, Tainan, May 2014.- (要約)
- HTML文書レイアウトの意味構造に対するベイズ確率モデルを提案する.HTML文書の意味的階層構造を,各テキストブロック間の依存構造としてモデル化し,サンプリングによって適切な構造を推定する.提案モデルは階層ベイズモデルであり,各ブロックに付けられる「見出し」や「内容」といったラベルから単語やHTMLタグを生成する.
- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-319-06605-9_47
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-84901278613
(DOI: 10.1007/978-3-319-06605-9_47, Elsevier: Scopus) Akira Fujisawa, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita :
Identifying who drew the illustration focusing on the eyes of the characters,
Proceedings of 20th Korea-Japan Joint Workshop on Frontiers of Computer Vision, 82-89, Feb. 2014.- (要約)
- 本論文では,イラスト画像の作者識別を行うことを目標とする.イラスト画像は作者によって絵柄が大きく異なる. また同一の作者であっても作品によってモチーフや構図などが異なり,一見して同じ作者の作品から共通点を探し出すことは難しい. そこでイラスト画像から作者の描き方の癖を特徴量として抽出し,それを利用して作者識別を行えないか考えた. 識別実験の結果,再現率は平均35%,作者ごとに調べると90%の再現率が得られた作家もいた.このことから,イラスト画像の書き込み具合を特徴量として用いることにより,ある程度作者を識別することができることがわかった.
- (キーワード)
- 画像処理 (image processing) / Identifying / Illustration / Edge / Canny Edge Detection
Improvement of Indexing Methods for Audio Fingerprinting Systems,
International Conference Data Mining, Civil and Mechanical Engineering (ICDMCME'2014), 65-71, Feb. 2014.- (要約)
- オーディオ指紋に基づく楽曲検索において,圧縮接尾辞配列を用いた検索インデックスの圧縮手法を提案した.提案手法では,ソートされたオーディオ指紋データが上位バイトは同じ値になりやすいという性質を利用し,8ビットデータ列に対してランレングス符号化を用いて圧縮を行っている.また,フィボナッチ・ハッシュ関数を用いたオーディオ指紋の検索手法に関しても述べた.
A Fast Retrieval Algorithm Based on Fibonacci Hashing for Audio Fingerprinting Systems,
Proceedings of the 2013 International Conference on Advanced Information Engineering and Education Science, 219-222, Beijing, Dec. 2013.- (要約)
- オーディオ指紋を用いた音楽検索システムでは,膨大な数のサブ指紋をデータベースの格納する必要がある.膨大なサブ指紋データベースの中から,検索楽曲と類似したものを効率的に検索するために,ハッシュ表を用いる手法が既に提案されている.本論文では,フィボナッチ・ハッシュ関数を用いることにより,メモリ容量に応じて,ハッシュ表の大きさを調整できるような検索手法を提案した.また,提案手法の有効性を実験で示した.
Mining Numbers in Text Using Suffix Arrays and Clustering Based on Dirichlet Process Mixture Models,
Proceedings of PAKDD-2010 (The 14th Pacific-Asia Conference on Knowledge Discovery and Data Mining), Springer (LNAI 6119), 230-237, 2010.- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-642-13672-6_23
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-79956306011
(DOI: 10.1007/978-3-642-13672-6_23, Elsevier: Scopus) Minoru Yoshida, Ikeda Masaki, Ono Shingo, Sato Issei and Nakagawa Hiroshi :
Person Name Disambiguation by Bootstrapping,
Proceedings of SIGIR-2010 (the 33rd Annual ACM SIGIR Conference), 10-17, 2010.- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1145/1835449.1835454
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-77956022829
(DOI: 10.1145/1835449.1835454, Elsevier: Scopus) Minoru Yoshida, Nakagawa Hiroshi and Terada Akira :
Gram-Free Synonym Extraction via Suffix Arrays,
Proceedings of AIRS 2008 (the Fourth Asia Information Retrieval Symposium), Springer (LNCS 4993), 282-291, 2008.- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-540-68636-1_27
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-45449093573
(DOI: 10.1007/978-3-540-68636-1_27, Elsevier: Scopus) Ono Shingo, Sato Issei, Minoru Yoshida and Nakagawa Hiroshi :
Person Name Disambiguation in Web Pages using Social Network, Compound Words and Latent Topics,
Proceedings of PAKDD2008 (The 12th Pacific-Asia Conference on Knowledge Discovery and Data Mining), Springer (LNAI 5012), 260-271, 2008.- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-540-68125-0_24
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-44649129207
(DOI: 10.1007/978-3-540-68125-0_24, Elsevier: Scopus) Sato Issei, Minoru Yoshida and Nakagawa Hiroshi :
Knowledge Discovery of Semantic Relationships between Words Using Nonparametric Bayesian Graph Model,
Proceedings of KDD-2008 (Fourteenth International Conference on Knowledge Discovery and Data Mining), ACM, 587-595, 2008.- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1145/1401890.1401962
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-65449127481
(DOI: 10.1145/1401890.1401962, Elsevier: Scopus) Minoru Yoshida and Nakagawa Hiroshi :
Web Document Parsing: A New Approach to Modeling Layout-Language Relations,
Proceedings of the 9th International Conference on Document Analysis and Recognition (ICDAR2007), IEEE Computer Society, 203-207, 2007.- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1109/ICDAR.2007.4378704
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-51149114613
(DOI: 10.1109/ICDAR.2007.4378704, Elsevier: Scopus) Ono Shingo, Minoru Yoshida and Nakagawa Hiroshi :
NAYOSE: A System for Reference Disambiguation of Proper Nouns Appearing on Web Pages,
Proceedings of AIRS2006 (Asia Information Retrieval Symposium), Springer (LNCS 4182), 338-349, 2006.- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/11880592_26
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-33751369671
(DOI: 10.1007/11880592_26, Elsevier: Scopus) Minoru Yoshida and Nakagawa Hiroshi :
Reformatting Web Documents via Header Trees,
Proceedings of the 43rd ACL2005 Poster/Demo Session, 121-124, 2005.- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3115/1225753.1225784
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-84859886917
(DOI: 10.3115/1225753.1225784, Elsevier: Scopus) Minoru Yoshida and Nakagawa Hiroshi :
Automatic Term Extraction based on Perplexity of Compound Words,
Proceedings of IJCNLP 2005, Springer (LNAI 3651), 269-279, 2005.- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/11562214_24
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-33645958849
(DOI: 10.1007/11562214_24, Elsevier: Scopus) Minoru Yoshida and Nakagawa Hiroshi :
Specification Retrieval -- How to Find Attribute-Value Information on the Web,
Proceedings of ijcNLP (International Joint Conference of Natural Language Processing),(Springer LNAI 3248), 338-347, 2004.- (出版サイトへのリンク)
- ● Publication site (DOI): 10.1007/978-3-540-30211-7_36
- (文献検索サイトへのリンク)
- ● Summary page in Scopus @ Elsevier: 2-s2.0-26444463338
(DOI: 10.1007/978-3-540-30211-7_36, Elsevier: Scopus) Minoru Yoshida :
Extracting Attributes and Their Values from Web Pages,
Proceedings of the ACL-02 Student Research Workshop, 72-77, 2002. Minoru Yoshida, Torisawa Kentaro and Tsujii Jun'ichi :
Extracting ontologies from World Wide Web via HTML tables,
Proceedings of the Pacific Association for Computational Linguistics (PACLING 2001), 332-341, 2001. Minoru Yoshida, Torisawa Kentaro and Jun'ichi Tsujii :
A method to integrate tables of the World Wide Web,
Proceedings of the International Workshop on Web Document Analysis (WDA 2001), 31-34, 2001. Minoru Yoshida, Ninomiya Takashi, Torisawa Kentaro, Makino Takaki and Jun'ichi Tsujii :
Efficient FB-LTAG Parser and its Parallelization,
Proceedings of PACLING'99, 90-103, 1999. Makino Takaki, Minoru Yoshida, Torisawa Kentaro and Jun'ichi Tsujii :
LiLFeS -- Towards Practical HPSG Parsers,
Proceedings of the 17th International Conference on Conmupational Linguistics and the 36th Annua Meeting of the Association for Computational Linguistics, (COLING-ACL 98), 807-811, 1998.- (出版サイトへのリンク)
- ● Publication site (DOI): 10.3115/980691.980702
- (文献検索サイトへのリンク)
- ● Search Scopus @ Elsevier (DOI): 10.3115/980691.980702
(DOI: 10.3115/980691.980702) 大賀 亮汰, 松本 和幸, 吉田 稔 :
レビューコメントに基づく感情情報を統合したハイブリッドアニメ推薦システム, --- 感情抽出による推薦精度向上および多様な嗜好への対応 ---,
第26回日本感性工学会講演論文集, 1-10, 2024年9月.- (要約)
- 本研究では,ユーザのレビューテキストに着目し,レビューテキストから自然言語処理技術により抽出した情報を考慮した推薦システムの構築を行う.特にレビューテキストに含まれる感情情報に焦点を当てる.感情は,メタデータからは抽出できないユーザの潜在的な特徴を反映し,アニメの推薦システムにおける多様性や新しい選択肢を提供する上で重要な要素であると考えられる.また,非計画的な時間消費や購買が感情体験によって促進されることが明らかになっており,感情はユーザの意思決定の際に重要な役割を果たすことが示されている.そのため,感情情報を考慮した推薦により,ユーザにとって意外性のある発見や新しい体験を生み出すことができると考えた.本研究の目的は,ユーザレビューから抽出した感情情報を推薦アルゴリズムに組み込むことにより,個々のユーザの好みやニーズに合致し,かつ感情が考慮されたアニメの推薦を行うことである.
- (キーワード)
- recommendation system / anime recommendation / emotion classification / user review
マルチモーダルなカウンセリングデータセットの構築と特徴量の分析,
ITヘルスケア誌 第17回年次学術大会抄録集, Vol.19, No.1, 94-99, 2024年8月.- (要約)
- 近年,ストレスや不安を原因とするうつ病は世界的に増加傾向にあり,日本でもうつ病などの精神疾患による休職者が増加している.しかし,カウンセラーや精神科医の不足は深刻で,早期発見が困難な状況にある.本研究では,うつ病の早期発見のため,日本の大学生25名を対象に,専門のカウンセラーによる約30分間の面接を行い,面接中の言語,音声,映像,心拍数データからなるマルチモーダルデータセットを構築した.面接の前後には,被験者の現在の心理状態に関する質問票も実施した.構築したデータセットは,GiNZA,OpenSMILE,OpenFaceを用いて特徴量を抽出し,アンケート結果と比較することで分析を行った.今後は,精神疾患者へのインタビュー調査を実施し,データを収集する予定である.
- (キーワード)
- multimodal dataset / depression detection / dataset
レビュー論文執筆支援に向けた文献特徴分析に基づく引用文献選択手法,
第38回人工知能学会全国大会予稿集, 1-4, 2024年5月.- (要約)
- この論文では,系統的レビュー(Systematic Review)に用いる引用文献を選択するための,半自動による効率的かつ高精度な方法を提案する.特徴抽出手法としては,類似文検索を用いて系統的レビュー論文の引用基準となる重要な記述や表現を抽出するが,いくつかの課題が残されている.文献収集方法の見直しと絞り込み,システマティックレビューにおける選定論文と除外論文の分類モデルの構築により,引用選定のアルゴリズムを検討する.
- (キーワード)
- レビュー論文執筆支援 / テキストマイニング (text mining) / システマティックレビュー / BiomedNLP-BiomedBERT / 父親の産後うつ
雑談機能の追加による対話ロボットを用いた健康維持支援システムの改良,
第38回人工知能学会全国大会予稿集, 1-4, 2024年5月.- (要約)
- 対話型ロボットを用いて対話内容を解析し,生活習慣改善を提案するWebアプリケーションを活用し,生活習慣の改善を支援するシステムの開発を行っている.このシステムを用いて実際に生活習慣を収集・分析し,機能やUIの課題を分析してシステムの評価を行った.分析結果をもとに,より効果的なシステムへの改善を目指す.本稿では主に,チャット対話機能の追加とユーザー応答分析の改善について説明する.チャットによる対話を通じてユーザーにシステムへの興味を喚起し,システムの継続利用を促し,生活習慣の改善への動機付けを図るのが狙いである.また,GPT-3.5を利用したユーザー回答の分析により,ユーザー回答のYes/No判定の精度が向上することを確認した.
- (キーワード)
- communication robot / health management system / chat dialogue / 音声認識 (speech recognition)
クローズドメイン質問応答におけるバイアスの除去による精度向上に関する研究,
電気学会全国大会講演論文集, 130-131, 2024年3月.- (要約)
- 質問応答の分野においてクローズドメイン質問応答というタスクでは与えられたコンテキストから回答箇所を推測する.しかし,各データセットにおいて偏りが生じてしまう.本研究では,クローズドメイン質問応答システムの精度と汎用性を向上させるため,複数のデータセットの組み合わせとアンサンブル学習による効果の比較実験を行う.この目的のために,3つの異なるデータセットを使用し,事前学習モデルとしてBERTを採用する.
- (キーワード)
- closed domain question answering / バイアス (bias) / ensemble learning / EM score
印象空間マッピングを用いた任意の語の入力による楽曲検索システム,
2024年電子情報通信学会総合大会講演論文集, D-12A-15, 2024年3月.- (要約)
- 近年,インターネット上のサービスによる音楽の聴取がCDなどに比べて主流になっており,このようなサービスではパーソナライゼーションによる感性に基づいた楽曲推薦などが行われている.しかし,土橋[1]は『「自分の嗜好」を強く反映してしまうパーソナライゼーション』(土橋 2011:35)は情報選択の範囲を狭めることにもつながると指摘している. 本研究では,楽曲探索をより広い範囲で行い,潜在的に好みの楽曲を検索するために,任意の語,すなわち自由に入力できるキーワードが表現する感性に基づいた楽曲検索システムの構築を目指す.
- (キーワード)
- 感性検索 / 楽曲検索 / 印象推定
褒めを導入したインタビュー対話システム,
電気学会全国大会講演論文集, 62, 2024年3月.- (要約)
- 近年,IT技術の進化に伴って対話型エージェントが普及しており,人間とAIのコミュニケーションが一般的になってきた.将来は,高齢者施設や病院で生活している人,独居生活をしている人などの話し相手として活躍することもあるだろう.このようなシチュエーションで,対話型エージェントが人に愛されるために,ユーザに親しみを持って対話してもらえることが期待されている.本研究では,ユーザの発話を褒めるインタビュー対話システムの構築を目指す.提案手法では,ユーザの入力した発話文テキストから褒める対象となる単語の抽出を係り受け解析により行い,テンプレート文に当てはめたものを入力としてBERTを用いたマスク単語の予測により褒め対象単語の選定を行う.予測された褒め対象単語を当てはめ,BERTに入力することにより出力された褒め単語の中から,より具体的な褒め表現を選択することで褒める文章を完成させる.アンケートによる評価の結果,提案手法により生成した褒め文章において概ね高評価を得ることができた.入力と出力に用いたテンプレート文の差異により生成される文章が不自然になる問題があったため,今後は同じテンプレート文を使用することで課題を解決したい.
- (キーワード)
- BERT / interview dialogue / Mask Language Model
トピックモデリングと大規模言語モデルを用いた男性の産後うつ関連研究調査手法,
電気・電子・情報関係学会四国支部連合大会講演論文集, 251, 2023年9月.- (要約)
- 男性(父方)産後うつの課題解決に役立つ研究を概観するために,男性の産後うつに関連する論文を対象とした研究動向の調査が必須である.しかし,膨大な文献テキストから必要な情報を人手により取得し,把握することは困難である.本研究では,専門的な知識を有さない人でも瞬時かつ高精度に,取得したい文献情報にアクセスできる関連研究調査システムの構築を目指し,潜在ディリクレ配分法(Latent Dirichlet Allocation;LDA)と,大規模言語モデル(Large Language Model;LLM)を用いた研究動向抽出手法を提案する.
- (キーワード)
- topic modeling / postpartum depression / 大規模言語モデル (large scale language model) / BioGPT / PubMedQA dataset
深層学習モデル TransUNet を用いた歯科パノラマ X 線画像のセグメンテーション,
第22回情報科学技術フォーラム (FIT2023), 571-572, 2023年9月.- (要約)
- 歯科パノラマ X 線画像は歯の診療に使われる画像である.歯科パノラマの照合には専門的な知識が必要であり,歯科医師の負担軽減を目的として歯の自動診断システムの研究が行われてきた.その中で,深層学習技術を用いて歯の識別を行う状態分類モデルが開発されている.本研究では状態分類モデルの入力として必要な歯の輪郭情報を作成するため,深層学習技術を用いて歯科パノラマ X 線画像のセグメンテーションを行う.実験では,歯科クリニックで撮影,ラベル付 けされたデータを取り扱う.セグメンテーションモデルには,近年医療セグメンテーションタスクで成功を収めているTransUNet モデルを用いて実験を行った.
- (キーワード)
- パノラマX線画像 / セグメンテーション / 深層学習 (deep learning) / TransUNet
深層セグメンテーションモデルによる歯科インプラントの自動分類手法,
第22回情報科学技術フォーラム (FIT2023), 567-568, 2023年9月.- (要約)
- 歯科インプラントとは,失った歯を補うための医療機器である.インプラントは,メーカーや種類が様々あり,それぞれで治療法が異なるため,歯科医師は治療時にインプラントの種類を把握しておく必要がある.本研究では,歯科医師の負担軽減を目的として,患者の歯科デンタル X 線画像から深層学習を用いたセグメンテーションモデルによってインプラントの領域を切り取り,画像分類モデルを用いてインプラントの分類を行う.切り抜きの精度は,IoU と Dice 係数でそれぞれ,0.923,0.857 となった.U-Net によってインプラントの領域を切り抜いた画像に対する分類の評価は,正解率,適合率,再現率,F 値がそれぞれ,0.851,0.852,0.884,0.840 となった.
- (キーワード)
- デンタルX線画像 / 画像認識 / 深層学習 (deep learning)
歯科パノラマX線画像における歯の状態診断及び汎化性能の検証,
第22回情報科学技術フォーラム (FIT2023), 563-564, 2023年9月.- (要約)
- 近年, 医療ビッグデータの深層学習技術への活用が盛んに行われており, 医療ビッグデータから診療情報や画像, カルテ情報等を用いて診断結果の提示や診断援助等ができるようになってきた. 本研究では, 歯科医師の負担軽減と診断援助を目的として, 深層ニューラルネットワークアーキテクチャを利用した歯科パノラマ X 線画像における歯の状態診断を行う. 実験では, 共同研究先の歯科クリニックで撮影, ラベル付けされたデータを取り扱う. 歯は複数の状態を持つため, 分類モデルはマルチラベル分類手法を用いて実装する. 結果として, う蝕や根尖病巣の識別が困難であった. また, 未知の撮影機材由来のデータでは精度の低下が見受けられた. そのため, ドメイン汎化手法を用いて, さらなる検証を行った.
- (キーワード)
- パノラマX線画像 / 画像認識 / 深層学習 (deep learning)
攻撃的文章判定を用いた不適切文章の訂正,
第22回情報科学技術フォーラム (FIT2023), 265-266, 2023年9月.- (要約)
- 近年, SNS 利用者が急増しており, 8 割以上の人が使用しているという統計データもある. これに伴い, SNS 上で誹謗中傷や炎上などの被害に遭う件数も増加している.2020 年には某番組内でタレントがとった行動や言動への Twitter 上での誹謗中傷が, 結果的に自殺を幇助してしまった事例もある. 2022 年には回転寿司店での不適切行為に対して不特定多数の人たちが非難を浴びせる「私刑」と呼ばれる現象も問題となった.このような事件を回避する方法として我々は, 攻撃的な内容を含んだ文章を投稿前に検出し, 適切な文章に訂正するシステムを提案する.
- (キーワード)
- text correction / 大規模言語モデル (large scale language model)
テキストデータ拡張による感情分類精度向上の検討,
第37回人工知能学会全国大会講演論文集, 1-4, 2023年6月.- (要約)
- Recently, SNSs have facilitated the collection of a wide variety of text data. However, SNS text data has problems such as short sentences with abbreviations and colloquial expressions, which make labeling difficult, and the difficulty of collecting a large amount of data in a short period of time. To solve this problem, data expansion is an effective method for efficiently preparing large-scale, high-quality labeled text data for machine learning. In this research, we aim to improve the learning accuracy of sentiment classification by extending the data to Japanese texts. EDA (Easy Data Augmentation) was used as the data expansion method. In particular, the use of various models for text manipulation in the EDA increased the range of data expansion. The expanded text generated by data expansion was evaluated based on the semantic similarity and the degree of textual change. The optimal data for training was selected by determining a threshold value. The WRIME corpus was used as the dataset to ensure the reliability of the labels. In this presentation, we report the results of learning accuracy in sentiment classification using data expansion.
- (キーワード)
- データ拡張 / easy data augmentation / sentiment analysis
コロナ禍前後におけるTwitterユーザの性格別感情変化の分析,
言語処理学会 第29回年次大会 発表論文集, 2365-2369, 2023年3月.- (要約)
- 2019 年末から始まったコロナ禍も 3 年が経過し,徐々に行動制限が緩和され,日々,状況は変化しつつある.現在も,生活様式の劇的な変化に伴い心身へのストレスなど人々に大きな影響を与え続けている.本研究は,コロナ禍前後での Twitter 上での発言内容から感情分析を行い,特徴的な表現を抽出して比較分析することにより,人々の発言,思考,行動に起きた変化を分析する.また,ユーザの性格タイプ別での感情の変動について考察する.
- (キーワード)
- ソーシャルメディア / 感情推定 / コロナ禍 / MBTI
音声対話ロボットを用いた健康維持支援システムの開発,
HAI シンポジウム2023 講演論文集, 2023年3月.- (要約)
- 生活習慣病は医療費全体の3 割,死亡者の6 割を占めている.よい生活習慣を送ることが健康を守るうえで重要である.また,近年音声で入力できるサービスや機器が増えてきている.音声認識を使えば,より手軽に計算機を扱えるようになる.本研究では,対話ロボットとの対話内容を分析して生活習慣などを提示するWeb アプリケーションを用いて,生活習慣の改善を助けるシステムを開発する.開発したシステムを用いて実際に生活習慣を収集し,生活習慣の分析とシステムの評価を行った.
- (キーワード)
- 健康維持支援システム / 音声対話ロボット / 生活習慣
登場人物の感情の動きを考慮した物語におけるハイライト文抽出,
HCGシンポジウム2022発表予稿集, C2-7, 2022年12月.- (要約)
- 本研究では,小説における登場人物の感情の大きさや変化を数値化することによる重要文の抽出要約手法を提案する.研究対象として青空文庫から5作品の小説を選び,それぞれの小説に提案手法による自動要約を行った.評価に関しては,人手で抽出した登場人物の感情が大きく表れている個所を正解データとし,上位 10 文における適合率と平均適合率を用いて評価を行った.
- (キーワード)
- 自然言語処理 (natural language processing) / 抽出型要約 / 感情 (emotion)
インタビュー対話に基づく個性を反映した対話モデルの構築,
令和4年度 電気・電子・情報関係学会 四国支部連合大会講演論文集, 139, 2022年9月.- (要約)
- 人間が AI とより親しみのあるコミュニケーションをするための要素の一つとして「個性」が挙げられる.AI に必要とされる個性は場面や状況に応じて異なるので,対話する相手に応じて個性を切り替えられるような仕組みが求められる.本研究では,日本語Transformer encoder-decoder対話モデルを使用し,インタビュー対話において異なる個性を持つ対話データごとにファインチューニングすることで対話モデルの個性に違いや特徴が出るかどうかを評価することを目的とする.
- (キーワード)
- 対話システム / 対話モデル / インタビュー対話
感情辞書を用いた物語のハイライト抽出,
第19回テキストアナリティクス・シンポジウム, 2022年9月. 網谷 嶺志, 松本 和幸, 吉田 稔, 北 研二 :
流行要因分析のための投稿テキスト・リプライ・画像からの感性分析及び可視化,
第21回情報科学技術フォーラム講演論文集(ハイブリッド開催), Vol.2, 63-68, 2022年9月.- (要約)
- 本研究ではTwitter上で起こるバズ現象について,ツイート及び添付された画像,ツイートに対して寄せられたリプライの感性を分析することにより探る.Twitter に投稿されるテキストの文字数には制限があるが,テキストのみで表現することが難しい情報には画像を添付することで視覚的に伝えやすくなる.また,バズ現象を分析するという観点からも,画像付きのツイートはテキストのみのツイートよりも分析に使える情報量が増えるため,より詳細な分析が可能になると考えられる.ツイートの事後情報であるリプライテキストも分析に用いることができる.リプライは,ツイート投稿後に,そのツイートに対する反応として投稿されるものであるため,具体的なバズ現象の要因分析につながると考えた.本研究では,画像付きツイートについて,ツイートテキスト,画像,リプライテキストからそれぞれ抽出した感性情報を分析することで,バズ現象の要因分析を検討する.
- (キーワード)
- buzz factor / information diffusion / Twitter / affective analysis
コメントデータと歌詞に基づく楽曲動画検索システム,
2022年度 人工知能学会全国大会講演論文集, 4O1-GS-4-05, 2022年6月.- (要約)
- 現在,YouTubeに代表される動画共有サービスが多くの人に利用されている.これらのサービスでは,キーワード検索が主流となっている.キーワード検索の場合,適切な単語を用いなければ,ユーザの興味に合った動画を探し出すことは困難である.そこで本研究では,YouTube上の音楽動画に対して視聴者がつけたコメントデータと歌詞を解析することで,印象の似た音楽動画を検索する手法を提案する.提案手法では,コメントと歌詞をWord2Vecによりベクトル化し,Fuzzy c-meansによるクラスタリングにより,印象の類似した音楽動画を検索する.平均相互順位(MRR)スコアによると,上位3曲の中で同じ印象を持つ音楽ビデオが出力されていることが明らかになった.
- (キーワード)
- 楽曲動画 / word2vec / ファジィクラスタリング
多変量解析と機械学習を用いたカラーイメージスケールの再構成に関する一検討,
第17回日本感性工学会春季大会, 35-38, 2022年3月.- (キーワード)
- カラーイメージスケール / 機械学習 (machine learning) / 多変量解析 / 次元削減
SNS の投稿内容に基づく生活習慣病発症リスクの分析,
言語処理学会 第28回年次大会 発表論文集, 1946-1950, 2022年3月.- (要約)
- 国内における死亡原因は,がん・循環器疾患・糖尿病などで全体の約 6 割を占めている.これらの病気はいずれも食事・運動・睡眠などの生活習慣と深い関りがあり,生活習慣病と呼ばれている.生活習慣病には自覚症状がほとんどないため,病気の悪化に気づきにくいという特徴がある.本研究では,より簡易的に生活習慣病を予防するシステムの構築を目指し,ソーシャル・ネットワーキング・サービス(SNS)を用いて,ユーザの投稿内容から食事・運動・体調・精神状態に関するツイートの分析を行った.調査の結果,本研究の成果がユーザの投稿内容から生活習慣病発症の危険因子を検出するシステムの構築につながることが分かった.
- (キーワード)
- ソーシャルネットワーク / 生活習慣病 (lifestyle-related disease) / SNS / BERT / 潜在的ディリクレ配分法
登場人物の感情表現文の抽出による物語のハイライト生成,
電子情報通信学会2022年総合大会 情報・システムソサイエティ特別企画 ジュニア&学生ポスターセッション予稿集, 2022年3月.- (要約)
- 電子書籍の普及により数多くの文学作品をインターネット上で読むことが可能になった.しかし,読者がそれらの中 から読む作品を選ぶことは容易ではない.本稿では物語について登場人物の感情が表現されている文を抽出することによる指示的要約の手法を提案する.
- (キーワード)
- 感情表現 / ハイライト生成 / 物語 / 自動要約 (automatic abstracting)
BERTを用いたSNS上における攻撃的文章訂正システム,
情報処理学会第84回全国大会講演論文集, 2022年3月.- (要約)
- 現代社会において SNS の発展は凄まじく,ほとんどの人が使用しているという状況に置かれている.それに伴い,誹謗中傷や炎上などの被害にあう件数も増加している.2020 年には,某テレビ番組における出演者の行動や言動に対して,Twitter 上で誹謗中傷が多数投稿されたことから,自殺に追い込んでしまうといった事件が起きている.本研究では,SNS ユーザが発言を投稿する前に,投稿文の攻撃性を判定し,攻撃性を緩和した文章に変換して提示するシステムの構築を目指す.
- (キーワード)
- 自然言語処理 (natural language processing) / BERT / Social Networking Site / 有害表現 / toxic expressions
投稿文および画像といいね数との関係に基づく流行要因分析,
HCG シンポジウム2021, 2021年12月.- (要約)
- 本研究ではソーシャルメディアの動向を調査し,Twitterでのバズ現象を支える要因を探るための分析手法を提案することを目的とする.Twitterに投稿されたテキスト内容だけではバズ現象の原因を特定できない場合があるため,画像が添付されたツイートに限定し,テキストと画像のそれぞれの特徴に関連性があるかどうか,また,これらの特徴の関連性が,人気の指標である「いいね」や拡散の規模を表す「RT」の数とどのように関連するかを調べた.画像とテキストから抽出した特徴量を入力とし,いいね数とRT数を出力した後,2つの入力(画像とテキスト)から同じ次元数の特徴ベクトルを中間層から抽出するためにマルチタスク学習型のニューラルネットワークを学習する.これらの特徴ベクトル間の距離といいね数との関係を分析した結果,BERTによる分散表現とInceptionResNetV2の特徴量がいいね数とRT数を予測する要因となり得ることがわかった.
- (キーワード)
- Multi-task learning / Buzz classification / Social media / Trend analysis
闘病ブログコーパスからの生活習慣の抽出,
令和3年度 電気・電子・情報関係学会 四国支部連合大会 講演論文集, 187, 2021年9月.- (要約)
- 闘病ブログは,患者の生活に関する行動情報(病状・食事・運動)について書かれているものがあり,疾患への理解や納得を得られるものも見られ,同病者の励 みとなっている.闘病ブログコーパスとは,闘病ブログを収集し,記事のタグ付けを行ったものである.本研究では年々増加傾向にある2 型糖尿病患者による闘病ブログコーパスから,闘病活動に関わる生活習慣の分析を行う.この分析結果より,病状悪化の危険因子や病状改善の手がかりとなる要素を,非医療従事者が自然言語処理および機械学習手法を用いて発見し,闘病者や糖尿病予備軍の人々に助言できるシステムの構築を目指す.
- (キーワード)
- 闘病ブログ / 生活習慣分析 / 生活習慣病 (lifestyle-related disease) / 2型糖尿病 / テキストマイニング (text mining)
発言内容と画像に基づくバズツイート分類,
JSKE 第23回日本感性工学会講演論文集, 1-5, 2021年9月.- (要約)
- As the information diffusion on social networking sites has become more common, content buzzes have become a frequent occurrence on the Internet via social networking sites. In marketing, it is important to know what is trending, and it is necessary to have a means of quickly detecting buzz on SNS. In this study, we define buzz tweets based on the number of likes and RTs on a tweet, and analyze the content of the tweets to obtain the characteristics unique to buzz tweets, so that we can predict buzz tweets in advance. In this study, we propose a classification method to predict whether a tweet is a buzz tweet or not, based on the statement of the tweet and the attached image. The results of the classification experiments show that the classification accuracy is higher when the statement of the tweet and the image are used as features than when only the content of the tweet and the image are used as features, indicating the effectiveness of the proposed method.
- (キーワード)
- buzz tweet / information diffusion / multitask learning / social networking site
感情分類を用いた単語分散表現からの感性情報抽出,
第20回情報科学技術フォーラム(FIT2021)講演論文集, Vol.2, 41-46, 2021年8月.- (要約)
- 近年,自然言語処理の分野では単語の一般的ではない用法の検出など,単語分散表現から意味推定を行う技術が研究されている.それらの研究では分散表現全体から単語の情報を抽出しており,感性以外の情報が多く含まれている.本研究では感性情報のみを抽出することでその精度上昇を目指す.その手法として単語分散表現から感情分類を行うニューラルネットワークを作成し,ネットワークが学習した重みから感性情報が強く表れている次元の情報を抽出する.評価方法としては,コサイン類似度を用いて抽出次元同士が類似した単語の比較を行う.
- (キーワード)
- emotional information / distributed representation / neural networks
Facts analysis of food tweets,
情報処理学会 第83回全国大会, Mar. 2021. 喜島 涼太, 松本 和幸, 吉田 稔, 北 研二 :
MBTI性格推定モデルの構築における感性情報の有効性,
日本感性工学会春季大会(JSAEE2021)講演論文集, 1-6, 2021年3月.- (要約)
- 本研究は性格推定システムの精度向上を図るため分類モデルの学習時の特徴量としてツイート文から抽出した文ベクトルだけではなく,ツイート文から推定した感性情報も特徴量として利用する.ツイート文から感情推定モデルをもとに感性情報ベクトルを取得し新たな特徴として用いることを試みる.性格推定において,ツイート文から抽出した文ベクトルを用いて性格推定モデルを学習させた場合と,文ベクトルと感性情報ベクトルを複合させたものを特徴量として学習させた場合の結果を比較分析し,Bag of WordsとSVDに基づく従来手法と比較し,性格推定モデルの構築の際に感性情報が有効であることを明らかにした.
- (キーワード)
- MBTI / ツイッター / 感情 (emotion)
Mask R-CNNを用いたパントモ画像からの 歯牙検出及びセグメンテーション,
令和2年度電気・電子・情報関係学会四国支部連合大会, No.15-9, 2020年9月.- (要約)
- 歯科診断における日本の診断項目数は海外と比べてかなり多く,歯科医師が 1 から歯式を書くこ とは手間がかかるため,歯科医師の診断負担軽減 が必要である.診断,歯の健康状態の把握,治療 計画の立案にはまずパントモ画像の解釈が不可欠 であることから,パントモ画像の処理は自動化の 重要な課題である. 本研究では自動でパントモ画像から歯牙検出・ セグメンテーションを行う.本稿では,その方法 について述べる.
- (キーワード)
- 医用画像 (medical image) / 深層学習 (deep learning)
深層学習を用いたコミックの分析に関する研究,
令和2年度電気・電子・情報関係学会四国支部連合大会 講演論文集, Vol.15-7, 1, 2020年9月.- (要約)
- 日本のサブカルチャーである漫画の楽しみ方が近年変化している.市場の売り上げ推移を見ると 紙の書籍ではなく電子端末で閲覧する電子書籍が 普及しつつあることがわかる.しかしスマートフ ォンを始めとする画面の小さい端末では携帯性が 高く扱いやすい反面,通常文庫判∼A5 判である漫 画をページ単位で表示するには小さすぎる. コマの抽出及び並び替えが可能であるなら読者にとって最適な読書環境を提供できる可能性があ る.そこで,本研究ではこの問題を解決するべくコ マ領域の検出について検証する.
異なるタイプの画像コーパスからの転移学習とデータ拡張に基づくアスキーアートのカテゴリ分類,
JSKE 第22回日本感性工学会大会講演論文集, 1-7, 2020年9月.- (要約)
- In this paper, we propose an ASCII art category classification method based on transfer learning and data augmentation.ASCII art is one of the nonverbal expressions that visually express emotions and intentions.There are similar expressions such as emoticons and pictograms. However, most of them are either represented by a single characteror embedded in the statement as an inline expression. ASCII art is expressed in various styles, including dot art illustration and lineart illustration. Basically, ASCII art can represent almost any object, therefore the category of ASCII art is very diverse. Many existing image classification algorithms use color information, however, since most ASCII art is written in character sets, there is no color information available for categorization. Create an ASCII art category classifier using the grayscale edge image and the ASCII art image transformed from the image as a training image set. We also use VGG16, ResNet-50, Inception v3 and Xception's pretrained networks to fine-tune our categorization. As a result of the experiment of fine tuning by VGG16 and data augmentation, an accuracy of 80% or more was obtained in the "human" category.
- (キーワード)
- ASCII art / Transfer learning / Fine tuning / Data augmentation / Domain adaptation
テレビ番組視聴者のツイートからのキーワード抽出および分類,
2020年度人工知能学会全国大会(第34回), 2020年6月.- (要約)
- 近年,若者を中心にテレビ離れが進んでいる. その主な理由としては,長時間番組であったり,視聴者の視聴時間が限られているためである.また,近年,ソーシャルメディアの発達に伴い,テレビ番組の視聴において,リアルタイムに意見や感想を述べる機会が増加した.実際にTwitter上では,いわゆる実況ツイートが盛んに行われている.そこで,本研究では,テレビ番組実況ツイートを用いてテレビ番組のイベントシーンに関するキーフレーズを抽出する手法を提案し,効率的なテレビ番組視聴を目指したシーン検索システムを提案する.実験の結果,番組時間に対して約5%∼10%の誤差で番組内容を推定した.また,抽出されたキーフレーズをt-SNEアルゴリズムによってイベントシーンカテゴリごとに視覚化した.
- (キーワード)
- 自然言語処理 / 情報検索 / Twitter
ツイート内容による夜間活動休止時間の推定に関する研究,
情報処理学会第82回全国大会講演論文集, 469-470, 2020年3月. 高野 翔吾, 松本 和幸, 吉田 稔, 北 研二 :
文書分散表現を用いた音楽アーティストの特徴分類に関する研究,
情報処理学会第82回全国大会講演論文集, 477-478, 2020年3月. 松本 和幸, 篠山 学, 寺園 嶺, 吉田 稔, 北 研二 :
インタビュー対話コーパスにおける発話の意図および感性の分析,
日本感性工学会春季大会, 1-6, 2020年3月.- (要約)
- In this study, we analyze interview dialogue corpora taken from an interview-type TV program, aiming at realizing aninterview dialogue system that brings out the best of the users of the system. After defining a tag set that classifies intention of utterance,these tags were added to six types of interview dialogue corpora, then we conducted utterance intention estimation using utterancesentence vectors obtained by using a pre-trained model. In the experiments, we analyze the expressions that are strongly related to theutterance intention, other important expressions, and the tendency of utterances of both the interviewers and the interviewees.
- (キーワード)
- Interview Dialogue System / Dialogue Act Prediction / Kansei Analysis / Corpus Analysis
深層ニューラルネットワークに基づくテキストと画像間のクロスメディア検索,
電子情報通信学会2020年総合大会学生ポスターセッション, No.ISS-A-076, 2020年3月.- (キーワード)
- 深層学習 (deep learning) / クロスメディア検索
深層学習を用いたパントモ画像からのインプラント体検出,
電子情報通信学会2020年総合大会学生ポスターセッション, No.ISS-A-060, 2020年3月.- (キーワード)
- 深層学習 (deep learning) / パントモ画像 / インプラント (implant) / インプラント検出
Earth Mover's Distance を用いた画像の印象推定,
第21回日本感性工学会大会, No.13A2-02, 2019年9月. 津野邉 純一, 佐久田 祐子, 松本 和幸, 吉田 稔, 北 研二 :
深層学習に基づく配色イメージの感性マッピング,
第18回情報科学技術フォーラム (FIT2019), No.J-004, 2019年9月. 藤野 尚也, 松本 和幸, 吉田 稔, 北 研二 :
Word Mover's Distanceを用いたコーパス拡張による感情推定精度向上の検討,
言語処理学会第25回年次大会(NLP2019), 129-131, 2019年3月.- (要約)
- 近年,深層学習をはじめとする機械学習はテキストマイニングや画像認識などの様々な研究分野で利用されている.今後の技術発展において必要不可欠であり,莫大な費用を投じている企業も少なくない.また,感情推定技術は人間とコンピュータ同士の円滑なコミュ ニケーションの実現に重要な役割を果たす.そういった中,よく問題点として挙げられるのが訓練データ量の不足や質の低下である.データ量の不足,質の低下は機械学習そのものの質の低下に直結する.本研究では,代表的な SNS の一つである Twitter に投稿され るテキストである「ツイート文」に着目し,そこに投稿されるツイート文を感情推定の対象とする.また,コーパス拡張が感情推定モデルの精度にどのような影響を及ぼすかを分析し考察する.
- (キーワード)
- ツイッター / Word Mover's Distance / 感情推定 / データ拡張
リプライを用いたバズツイートの分類,
言語処理学会第25回年次大会(NLP2019), 237-240, 2019年3月.- (要約)
- 近年 SNS の発達により,多数のユーザ間で口コミの拡散や共有が盛んにおこなわれるようになった.これによりインターネット上でコンテンツの流行が度々起こるようになった.ユーザ同士のコミュニケーションによっておこる流行のことを「バズる」と呼ぶ.この「バズる」ことを利用したマーケティングが重要視されており,いち早くバズに気づき取り入れることが今後のマーケティングで重要になってくると考えられる.既存研究において,時系列での拡散のされ方などから流行を検知するものがあるが,それらの手法 では拡散された要因までは知ることができないという問題点がある.本研究では,Twitter においてバズったツイートに寄せられたリプライをベクトル化し,ツイートに対するリプライ全体を特徴ベクトルとすることで,「バズっている」特徴の定義を目指すとともにバズツイート内におけるタイプ別の分類分けの可能性について検討する.
- (キーワード)
- ツイッター / リプライ / ソーシャルメディア / バズ
Comment Mover's Distanceを用いた類似動画検索,
IDRユーザフォーラム 2018, 2018年11月.- (キーワード)
- 動画コメント / Comment Mover's Distance / 類似動画検索
深層畳み込みニューラルネットワークによるアスキーアートの分類,
平成30 年度電気関係学会四国支部連合大会 講演論文集, 155, 2018年9月.- (要約)
- 近年のSNS でのテキストコミュニケーションにおいて,顔文字,絵文字,スタンプといった非言語表現は感情伝達において重要であり,ショートテキストで円滑なコミュニケーションを行う際には欠かせないものとなっている.非言語表現のうち,アスキーアート(ASCII Art; 以下AA)は使用されている文字が特に意味を持たないことが多く,その配置や形状により視覚的に感情や意図を伝達,表現できる.しかし,それ故に使用されている文字を手がかりとした分類が難しい.本研究では,AA を画像化し深層学習を用いて分類する手法を提案する.
- (キーワード)
- アスキーアート / 分類 (classification) / 深層畳み込みニューラルネットワーク
アスキーアート分類手法の比較検討,
第32回人工知能学会全国大会講演論文集, 1-4, 2018年6月.- (要約)
- 近年,ソーシャルメディアにおいて数多くの非言語表現が使用されている.そのなかでも,アスキーアート(AA)は,文字を用いた視覚的な技法による表現の一つである.本論文では,文字特徴と画像特徴によるアスキーアート分類手法を比較検討し,アスキーアートのカテゴリ分類に効果的な手法を評価実験により明らかにする.評価実験では,1) 文字頻度,2) 文字重要度,3) 画像特徴量,4) 文字の画像特徴量 の4種類を比較する.この4つの特徴量を用いて,ニューラルネットワークの学習によりカテゴリ分類器を作成する.実験の結果,文字単位での画像特徴を用いて学習させたフィードフォーワードニューラルネットワークによる分類器が,全体的な精度が優れていることが分かった.
- (キーワード)
- アスキーアート / 画像特徴 / 文字特徴 / ニューラルネットワーク (neural network)
Emotion Recognition from Emoticons based on Deep Neural Netwotks,
2018年電子情報通信学会総合大会ISS特別企画学生ポスターセッション予稿集, Mar. 2018.- (要約)
- Text communication has been developed in recent years, all kinds of daily contacts are through the SNS regardless of age, gender and active. As an advantage of text-based communication via the Internet. There is a point that you can quickly respond to anyone wherever you are. In this paper, by letting the deep convolution neural network learn the image features of emoticons. We propose a method to classify by emotion expressed by emoticons. By treating emoticons as images, it is possible to capture visual features and think that natural identification can be made rather than handling as character strings.
- (キーワード)
- 顔文字 / 感情認識 / 深層ニューラルネットワーク
絵文字を手がかりとした俗語感情コーパスの拡張,
言語処理学会 第24回年次大会 発表論文集, 797-800, 2018年3月.- (要約)
- 絵文字が含まれていない文からでも,絵文字を推定することができれば,感情推定が可能になると考える.本論文では,俗語と絵文字を両方含む多量のコーパスを文字レベルで学習させ,絵文字推定器を作成し,俗語を含んだ発話文コーパスへの感情タグ付け手法を提案する.
- (キーワード)
- 絵文字 / 俗語 / 感情 / コーパス (corpus)
プロフィール情報を用いたテキストの視点分類,
情報処理学会研究報告, Vol.2017-NL-234, No.11, 1-5, 2017年12月.- (要約)
- 同一トピックに関する Twitter への投稿を,視点によって分類する手法を提案する.提案手法は,ユーザーのプロフィール情報を援用し,各投稿内容の分散表現を学習することで,類似する視点からの投稿をまとめる.
ユーザの性別と感情表出傾向との関連,
第31回人工知能学会全国大会予稿集, 1-4, 2017年5月.- (要約)
- 感情表現や俗語表現の使用傾向は,発話者の性別の違いによって傾向があると考えられる.本研究では,性別に適応させた感情推定モデルの構築を行い,その有効性を検証する.さらに,提案モデルにより得られた感情表出傾向に基づき,口語文においてよく用いられる俗語表現の使用傾向が感情表出傾向とどのように関連があるかを,男女別で比較分析する.
- (キーワード)
- ツイッター / 感情認識 / 属性
楽曲に特徴的なコメントに基づく作業用BGMからのインデックス作成,
第31回人工知能学会全国大会予稿集, 1-2, 2017年5月.- (要約)
- 作業用BGMとは,何らかの作業中に流す音楽のことである.本研究では,ニコニコ動画に投稿されている複数の楽曲が収録された作業用BGM動画を対象とし,楽曲ごとに固有の特徴的なコメントに基づく作業用BGMのインデックス作成を目的としている.提案手法では,動画に投稿されたコメントデータの増減と,楽曲固有の特徴的なコメントおよび感嘆表現(記号なども含む)に基づき,BGMの終了・開始位置を検出する.
- (キーワード)
- インデックス生成 / ニコニコ動画 / 特徴コメント
画像特徴量を用いた大型アスキーアートの分類手法の提案,
第31回人工知能学会全国大会予稿集, 1-2, 2017年5月.- (要約)
- アスキーアート(AA)について,従来,顔文字のような小型のものを対象とした研究は多くあり,それら小型AAを単語として捉えた様々な抽出・分類手法が提案されてきた.しかし,複数行にわたる大型のAAも存在し,視覚的に類似しているAAであっても使用文字が異なるものが多数存在している.本研究ではAAを画像化し,画像特徴量を用いることで大型のAAに適した分類手法を提案する.
- (キーワード)
- アスキーアート / 画像特徴 / 分類 (classification)
感情表出傾向の分析による対話破綻検出,
言語処理学会第23回年次大会発表論文集, 158-161, 2017年3月.- (要約)
- 本研究では,ユーザの感情の変化に合わせてシステム自身の感情を表出させることができないために起こる対話破綻について,発話文から推測可能な感情傾向の比較により検出する手法を提案する.具体的には,発話文の分散表現ベクトルをもとに感情が表出されている強度 を推定するモデルを用い,直前の 2 発話における推定結果との類似度の計算を行うことで,そのパターンを特徴量として対話破綻のラベルを推定する.評価実験では,提案手法を用いた対話破綻ラベルの推定をおこない,文の分散表現ベクトルの類似度パターンによる手法との比較をおこなう.
- (キーワード)
- 対話破綻検出 / 感情推定 / 分散表現
Twitter を用いた感染症発生動向の視覚化,
人工知能学会インタラクティブ情報アクセスと可視化マイニング研究会(第15回), 48-53, 2017年3月.- (要約)
- The purpose of this research is to extract comments on infectious diseases from Twitterand to create an infection map.As a method,we check the facts of the extracted utterance,extractthe past tweets of the infected person from the result,and estimate the place where the personlives.We used SVMs both for the fact check and place estimation.
- (キーワード)
- Twitter / 可視化 / 感染症発生動向
分散表現を用いた有害表現判別に基づく炎上予測,
人工知能学会インタラクティブ情報アクセスと可視化マイニング研究会(第15回), 1-6, 2017年3月.- (要約)
- In recent years, flaming on social media has been a problem. To avoid flaming, it is useful for the system to automatically check the sentences whether they include the expressions that are likely to trigger flaming or not before posting messages. In this research, we target two harmful expressions. There are insulting expressions and the expressions that are likely to cause a quarrel. Firstly, we constructed a harmful expression dictionary. Because a large cost requires to collect the expressions manually, we constructed the dictionary semi-automatically by using word distributed representations. The proposed method used distributed representations of the harmful expressions and general expressions as features, and constructed a classier of harmful/general based on those features. An evaluation experiment found that the proposed method could extract harmful expressions with accuracy of approx. 70%. On the other hand, it was found that the proposed method could also extract unknown expressions, however, it wrongly extracted non-harmful expressions at a rate of approx. 40%.
- (キーワード)
- 有害表現 / 分散表現 / サポートベクターマシン / 炎上予測
表形式からの分散表現獲得,
情報処理学会自然言語処理研究会研究報告, Vol.2016-NL-229, No.19, 1-6, 2016年12月.- (要約)
- 表形式における単語埋め込み手法について考える.通常の文章を対象とした学習手法に比べ,表形式においては,単語の周辺文脈として,縦方向 ・ 横方向の二種類の文脈が考えられる.本稿では,これら同時に考慮した,二次元的なモデルを提案し,一次元的なモデルとの比較を行う.
8bit 音源に対する自動採譜システムに関する研究,
平成28年度電気関係学会四国支部連合大会講演論文集, 17-5, 2016年9月.- (要約)
- 本研究では,自動採譜分野において 8Bit 音源の特徴に着目して研究をする.8bit 音源とは,三角波と矩形波が二つの三和音とノイズからなる,一般的な音楽を形成するにあたる最低限の要素で構成された,シンプルな音源である. つまり,8bit 音源の採譜ができればベースやメロディーの動きが明らかになりその楽曲の骨組みが分かるようになる. 従来は,自動採譜の分野の研究において,一般的なクラシックやポップスなど,大量の楽音が混在した楽曲データを対象としていた.1)それに対し,本実験では 8-bit 音源を対象にし,その最低限の和音のみで構成されたものを対象にすることによる影響について考察した.
- (キーワード)
- 8bit音源 / 自動採譜
深層学習に基づく顔画像によるアニメキャラクタの分類,
平成28年度電気関係学会四国支部連合大会講演論文集, 178, 2016年9月.- (キーワード)
- アニメキャラクタ / 深層学習 / 顔画像 / 分類 (classification)
Deep Convolutional Neural Network による顔画像からの表情識別,
第15回情報科学技術フォーラム講演論文集, Vol.3, 293-294, 2016年9月.- (キーワード)
- 深層学習 / 顔表情 / 深層畳み込みニューラルネットワーク
出現頻度の低い色に注目した作風に基づくイラスト画像の分類,
第15回情報科学技術フォーラム講演論文集, Vol.3, 87-88, 2016年9月.- (キーワード)
- イラスト画像 / IF-hist / 作風
Twitterを用いた病気の事実性解析及び知識ベース構築,
人工知能学会全国大会2016講演論文集, 2016年6月. 藤岡 亮太, 吉田 稔, 松本 和幸, 北 研二 :
Twitterから抽出したユーザの発言に基づく健康状態の推定,
人工知能学会全国大会2016発表予稿集, 2016年6月. 田中 聡, 松本 和幸, 吉田 稔, 北 研二 :
情報推薦のための Twitter ユーザの性格分析手法,
人工知能学会全国大会2016発表予稿集, 1-4, 2016年6月.- (キーワード)
- 性格分析 / エゴグラム / ツイッター / 情報推薦
画像特徴量を用いたアスキーアートからの顔文字検出,
人工知能学会全国大会2016講演論文集, 1-2, 2016年6月.- (キーワード)
- アスキーアート / 顔文字 / 画像特徴量 / HOG特徴量 / SIFT特徴量
表形式のトピックモデルとその数値単位推定への応用,
情報処理学会自然言語処理研究会研究報告, Vol.2016-NL-226, No.16, 1-6, 2016年5月.- (要約)
- 表形式中の数値表現について単位が省略されている場合に,その単位を推定するための手法を提案する.Wikipedia 表形式中の,数値のみを含むセルを対象に,一行目のセル等の 「周辺文脈」 を利用し,適切な単位を推定する.また,表形式の外側の文章を利用するために,表形式と文章を同時にモデル化するためのトピックモデルを提案し,トピックの推定結果を単位推定に利用することで精度の向上を図る.
Twitterユーザの属性別感情推定の検討,
言語処理学会第22回年次大会講演論文集, 2016年3月. 村上 侑希, 吉田 稔, 松本 和幸, 北 研二 :
深層畳み込みニューラルネットワークを用いた顔認識の精度評価,
2016年電子情報通信学会総合大会学生ポスターセッション, 2016年3月. 松岡 雅也, 松本 和幸, 吉田 稔, 北 研二 :
トピック変動の分析による俗語の特徴抽出,
情報処理学会研究報告, Vol.2016-NL-225, No.4, 1-5, 2016年1月.- (要約)
- 本研究では俗語の使われ方が時間経過によって変化することに着目した.俗語の含まれたツイート文の集合を潜在的ディリクレ配分法により分析し時間ごとのトピックを得る.このトピックにおけるトピック重要語の集合について隣接する時間(月単位)での類似度を計算し,トピックの変化を抽出し,俗語の特徴となるものを検討する.
- (キーワード)
- 俗語 / トピック変動 / 潜在的ディリクレ配分法
2次元図面の形状に基づく検索システム,
電気関係学会四国支部連合大会講演論文集, 256, 2015年9月. 松尾 高志, 吉田 稔, 松本 和幸, 北 研二 :
ロゴ検出における最適パラメータ推定,
電気関係学会四国支部連合大会講演論文集, 256, 2015年9月. 橋本 佳祐, 吉田 稔, 松本 和幸, 北 研二 :
オーディオ指紋に基づくゲーム音楽の検索手法に関する研究,
電気関係学会四国支部連合大会講演論文集, 256, 2015年9月. 宮本 竜次, 吉田 稔, 松本 和幸, 北 研二 :
ボーカル音を含んだ混合音テンプレートによる多重奏の音源同定,
電気関係学会四国支部連合大会講演論文集, 268, 2015年9月. 清水 隼人, 松本 和幸, 吉田 稔, 北 研二 :
ニコニコ動画におけるコメント分布の相関に着目した不正動画検出,
第14回情報科学技術フォーラム講演論文集, Vol.2, 229-230, 2015年9月.- (キーワード)
- ニコニコ動画 / 動画共有サイト / 不正動画 / 時系列相関分析
影響力の範囲を考慮したTwitter における影響力推定手法,
第14回情報科学技術フォーラム講演論文集, Vol.2, 227-228, 2015年9月.- (キーワード)
- Twitter / 影響力 / Twitter API / フォロワー / リツイート
掲示板における炎上分析のためのノイズ除去手法,
第14回情報科学技術フォーラム講演論文集, Vol.2, 219-220, 2015年9月.- (キーワード)
- 掲示板 / ノイズ除去 / 炎上
分割誤りに頑健な新語のカテゴリ分類,
第14回情報科学技術フォーラム講演論文集, Vol.2, 243-244, 2015年9月.- (キーワード)
- カテゴリ分類 / 新語 / 分割誤り
ニコニコ動画におけるコメント分布の時間に基づく相関に着目した動画の不正検出,
信学技報, Vol.115, No.177, 97-101, 2015年7月.- (要約)
- 近年,YouTubeやニコニコ動画をはじめとする動画共有サイトは,プライベートの公開や企業の宣伝活動,最新のニュースなど,個人・法人を問わず様々な用途で活用されており,動画の広告報酬等で収益を上げているユーザも少なくない.しかし,再生数などをもとに動画の評価が行われるため,恣意的に再生数・コメント数を増やすといった不正な方法により,動画の注目度上げることができてしまう. 本研究では再生数やコメント数の多さではなく,ニコニコ動画に対して投稿されたコメントの時間的な分布の相関に着目し,動画の不正検出手法を提案する.ベースラインとして,動画が不正かそうでないかを,動画に対して投稿されたコメント中の単語を素性とした機械学習による二値分類に基づく手法を用い,検出精度について提案手法との比較を行う.
- (キーワード)
- ニコニコ動画 / コメント分布 / 時系列相関
音喩表現に基づく書体デザインの自動生成に関する研究,
情報処理学会全国大会講演論文集, 4-767-4-768, 2015年3月. 前川 和輝, 松本 和幸, 吉田 稔, 北 研二 :
書き込みのエントロピー に着目した速報スレッド における 盛り上がり要因の分析,
言語処理学会第21回年次大会発表論文集, 620-623, 2015年3月.- (キーワード)
- 掲示板 / 速報スレッド / エントロピー (entropy)
顔文字のパーツの種類と表情の強弱に着目した顔文字表情推定,
言語処理学会第21回年次大会発表論文集, 449-452, 2015年3月. 松本 和幸, 土屋 誠司, 吉田 稔, 北 研二 :
若者言葉の意味と感性を考慮した標準語への変換手法,
言語処理学会第21回年次大会発表論文集, 529-532, 2015年3月.- (キーワード)
- 若者言葉 / 俗語 / 印象 / 変換
歌詞検索に必要な内容語数の分析およびクエリ拡張手法の提案,
電気関係学会四国支部連合大会講演論文集, 2014年9月.- (要約)
- 本研究は間違いの含まれる入力クエリの検索可能最低クエリ数を調べることにより検索システムの効率化や柔軟で強固な検索システムの作成の参考になるデータをとることを目的とした.誤り歌詞片を用いた評価実験の結果,必要な最小内容語数は平均4単語となった.
- (キーワード)
- 歌詞検索 / クエリ拡張
LDPC符号とハミング符号を用いた補助情報を伴う符号化システムの性能評価,
情報・システムソサイエティ・学生ポスターセッション予稿集, ISS-P-255, 2014年3月.- (要約)
- 近年, インターネットの普及により通信する情報量 が増加しているため, 情報を効率良く送信されるため の情報圧縮技術が求められている. その中で, 1975年 にWyner[1], Ahlswede and Körner[2]らが補助情報 を伴う符号化システムの許容伝送率領域の証明した. しかし, 彼らの論文において誤り訂正符号などを実際 に使用しての実験は行なわれていない. そこで本稿は, 補助情報を伴う符号化システムにお いて主符号化器にLDPC符号, 副符号化器にハミング 符号を使用した場合の性能評価を行なう.
- (キーワード)
- LDPC符号 / ハミング符号
知覚ハッシュに よ る 類似画像検索,
情報・システムソサイエティ・学生ポスターセッション予稿集, ISS-P-256, 2014年3月.- (要約)
- 近年,インターネットの普及により個人が触れることのできる画像データの量が膨大に増えている.それに伴い,画像から類似している画像を検索する類似画像検索の需要も増している.本研究では知覚ハッシュを使い,従来手法のグレースケールの代わりに3チャンネルのカラー情報を用いることで,人間の感性に近い類似画像検索を目標としている.
- (キーワード)
- 知覚ハッシュ / Block Mean Value Hash / 画像検索
ナイーブベイズ法を用いたTwitterによる性格推定,
言語処理学会第20年次大会予稿集, 2014年3月.- (要約)
- 本研究ではTwitterを利用し,Web上のツールを用いてエゴグラム分析を行ったユーザアカウントを対象に投稿内容を収集し,投稿内容に出現する単語を素性としてナイーブベイズ法による機械学習をおこない,投稿内容から性格の自動分類することを目的とする.
- (キーワード)
- ナイーブベイズ法 / Twitter / 性格推定
アーティスト評判分析に有効な特徴表現の抽出,
言語処理学会第20回年次大会予稿集, 2014年3月.- (要約)
- 本研究では,n-gram出現頻度に基づき,アーティストに関するつぶやきデータから,評判分析に有効な特徴表現を抽出する.さらに,特徴表現に後続する単語を素性として,Support Vector Machine による機械学習によるカテゴリ分類をおこなう.評価実験の結果,アーティスト/カテゴリごとに差は出たものの,約80%の正解率で分類できることがわかった.
- (キーワード)
- テキストマイニング (text mining) / マイクロブログ / Twitter / 評判分析
歌詞における聞き慣れない表現と誤りとの関連性の分析,
言語処理学会第20回年次大会予稿集, 2014年3月.- (要約)
- 本稿では,歌詞において特徴的な表現について,歌詞コーパスとWeb コーパスにおける出現頻度を比較することで分析する.また,聞き慣れない表現と誤りが起こるフレーズとの関連を,実際に楽曲の歌詞の書き起こしをおこなうことで得た歌詞片を用いることにより調査し,歌詞に特徴的な表現との比較もおこなう.
- (キーワード)
- 歌詞 / 単語親密度
キャラクタの顔を用いたイラスト画像の作者識別,
HCGシンポジウム2013, Vol.HCG2013-I-2-1, 523-530, 2013年12月.- (要約)
- 本研究では,キャラクターを描いたイラスト画像に対し,顔部分に着目し,特に,目の部分からエッジ特徴量(Line Percent: LP)を抽出し,その書き込み具合をもとに,イラストレーター特有の特徴を見出して作者識別を行う. 人による識別と,LPに基づく自動識別実験をおこない比較した結果,人による識別と同等とまではいかないが,ある程度の識別率を得ることができた.このことから,イラスト画像における部分的な書き込み具合を特徴量として用いることで,ある程度の精度での作者識別が可能なことがわかった.
- (キーワード)
- 画像処理 (image processing) / イラスト画像 / エッジ / Canny法
返答率に基づく演劇中の登場人物間の親密度推定,
HCGシンポジウム2013, Vol.HCG2013-I-1-16, 511-515, 2013年12月.- (要約)
- 本稿では,台本の会話文に着目し,演劇の登場人物間の人間関係を獲得することを試みた.一般に,我々は登場人物のセリフや行動を基に,人物像や人間関係を理解する.演劇の場合,一つにはその構造上の理由から,登場人物の感情は,映画やテレビドラマに比べるとより明白に表現される.舞台の上で演じる役者にとって,全観客に表情を使って感情を伝えるのが難しいからである.そのため,人間関係や人物像を得るために台詞中の感情表現を用いることが考えられる.人間同士の会話には感情表現以外の要素が多く含まれており,それらは,人間関係を推測するのに役立つ.本研究では,人間関係に最も重要であると考えられる「親密度」を,台詞から抽出する手法を検討する.登場人物間の会話文に対して,発話頻度と返答数に基づく返答率を計算することにより,登場人物間の親密度を得た.シナリオから対話文を収集したコーパスを構築し,提案手法により計算した親密度の有効性を分析した.
- (キーワード)
- シナリオ会話文 / 返答率 / 親密度
俗語の出現頻度と文末表現の関連性に関する分析,
平成25年度電気関係学会四国支部連合大会講演論文集, 2013年9月.- (要約)
- 近年,スマートフォンなどの携帯型端末の爆発的な普及に伴い,Twitterやfacebookを始めとするSNSやブログサービスなどの利用者が増加している傾向にある.それにより,現在ネット上にはSNSなどから得られる膨大なテキストデータが存在している.これらのテキストデータでは,俗語と呼ばれているくだけた表現が多く用いられている.そのため,俗語が使用されているテキストデータを分析して情報抽出を行う場合,形態素解析誤りが影響し,信用できる結果が得にくい.しかし,現代の言葉を理解する研究は評判分析など様々な場所で応用できるものとして非常に重要であると考えられる.そのため,現代の言葉の特徴である俗語を分析し理解する研究は非常に重要であると考えられる.本論文では,ブログにおける文章の文末表現の混合率および変移率に着目し,俗語が表れやすい文章がどのような特徴を有するのかを分析する.
- (キーワード)
- 俗語 / 文末表現 / 混合率 / 変移率
コスト付き符号化を用いたステガノグラフィ,
電子情報通信学会技術研究報告, Vol.113, No.153, 5-9, 2013年7月.- (要約)
- 近年, ネットワーク通信の発展に伴い, 安全に通信を行う技術が重要になっている. この要求に対して暗号技術が必ずしも満たすとは限らない. この対策として, 通信秘匿技術であるステガノグラフィがあり, 一般的な手法にLSB法が知られている. しかし, LSB法は誤りビットの発生について考慮されていないため, これまでにLSB法を基に誤りビットを考慮した多くの手法が提案されてきた. 本論文では, コスト付き符号化を用いて埋め込む情報を誤りパターンに変換し, 排他的論理和によって埋め込むステガノグラフィを提案する. また, 数値計算によって理論限界$R= H(Delta)$まで漸近的に近づけることができることを示す.
- (キーワード)
- 情報ハイディング / ステガノグラフィ / コスト付き符号化 / 誤りパターンによる埋め込み法
- 研究会・報告書
- 大賀 亮汰, 松本 和幸, 吉田 稔, 北 研二 :
ニコニコデータセットを用いた視聴者の感情を考慮した動画推薦アルゴリズムの提案,
IDRユーザフォーラム 2022, 2022年12月.- (キーワード)
- 自然言語処理 (natural language processing) / 人工知能 (artificial intelligence) / 分類 (classification) / 深層学習 (deep learning)
個性を反映した対話モデルにおける発話文の感情及び性格推定,
信学技報, 34-38, 2022年10月.- (要約)
- 人間がAIとより親しみのある対話をするための要素の一つとして個性が挙げられる.AIに必要とされる個性は場面や状況によって異なるので,対話する相手に応じて個性を切り替えられるような仕組みが求められる.本研究では日本語Transformer Encoder-decoder対話モデル(japanese-dialog-transformers)を使用し,インタビュー対話データでファインチューニングすることで,対象となる人物の個性を反映した対話モデルの構築を目指す.提案する対話モデルから出力される発話文をMBTI推定モデルや感情分析モデルによって分析することで性格の一貫性の評価及び対話モデル間の差異や共通点について考察する.
- (キーワード)
- インタビュー対話 / 個性 / 性格推定 / 対話モデル / 感情分析
ビット演算に基づく高速な音声ドキュメント検索語検出,
第8回音声ドキュメント処理ワークショップ, 2014年3月.
- 特許
- 研究者総覧に該当データはありませんでした。
- 作品
- 研究者総覧に該当データはありませんでした。
- 補助金・競争的資金
- 専門家と非専門家の違いを考慮した科学的テキスト分析に関する研究 (研究課題/領域番号: 24K15193 )
数値および専門性と話題性に着目したSNSからの科学的知識抽出に関する研究 (研究課題/領域番号: 21K12141 )
異なるコミュニティにおいて誤解されやすい表現の感性的言語変換に関する研究 (研究課題/領域番号: 20K12027 )
言語と非言語の混在するWWW上の生活習慣・健康情報の統合的解析 (研究課題/領域番号: 18K11549 )
コミュニティと用語の同時獲得手法に関する研究 (研究課題/領域番号: 15K00309 )
WWW上の医療・健康情報マッチングのための統合的メディア解析 (研究課題/領域番号: 15K00425 )
WWW上の多種メディア情報利用のための数値情報解析 (研究課題/領域番号: 24500162 )
テキスト中の数値表現からの知識発見に関する研究 (研究課題/領域番号: 22700137 )
Web上のテキスト情報の信頼性と有益性の評価システムに関する研究 (研究課題/領域番号: 21013011 )
機械学習によるロングテール現象の解決方法に関する研究 (研究課題/領域番号: 21240011 )
多言語Webテキストからの知識マイニング関する研究 (研究課題/領域番号: 19024014 )
多言語Webテキストからの知識マイニングに関する研究 (研究課題/領域番号: 18049011 )
HTML文書からの輪理構造自動推定に関する研究 (研究課題/領域番号: 17700137 )
Webテキストからの知識抽出支援システムに関する研究 (研究課題/領域番号: 17200007 )
分かり易さ向上のためのテキストコンテンツ変換に関する研究 (研究課題/領域番号: 16016215 )
分かり易さ向上のためのテキストコンテンツ変換に関する研究 (研究課題/領域番号: 15017217 )
研究者番号(40361688)による検索
- その他
- 研究者総覧に該当データはありませんでした。
2024年12月20日更新
- 専門分野・研究分野
- 情報通信 (Informatics) [知能情報学 (Intelligent informatics)]
- 所属学会・所属協会
- 言語処理学会
日本データベース学会
情報処理学会 [2009年6月〜2013年5月])
社団法人 人工知能学会
AIRS 2008
ACM SIGIR - 委員歴・役員歴
- 言語処理学会 (正会員, 全国大会プログラム委員 [2013年8月〜2015年7月])
日本データベース学会 (正会員)
情報処理学会 (正会員, 論文誌「数理モデル化と応用」編集委員 [2010年4月〜2014年3月], 情報基礎とアクセス技術研究会運営委員 [2010年4月〜2014年3月], 自然言語処理研究会運営委員 [2006年4月〜2010年3月], 論文誌知能グループ編集委員(2011年度副査, 2012年度主査) [2009年6月〜2013年5月])
社団法人 人工知能学会 (正会員, 全国大会プログラム委員 [2010年10月〜2012年9月])
AIRS 2008(Asia Information Retrieval Symposium) (プログラム委員 [2007年8月〜10月])
ACM SIGIR (プログラム委員 [2011年1月〜2016年5月])
言語処理学会 (代議員 [2015年4月〜2018年3月]) - 受賞
- 2008年3月, 第70回全国大会 大会優秀賞 (情報処理学会)
2008年6月, 2008年度研究会優秀賞 (共著者として) (社団法人 人工知能学会)
2009年9月, 2009年度全国大会優秀賞 (社団法人 人工知能学会)
2016年9月, Best Paper Award of the 2nd INTERNATIONAL CONFERENCE ON SOFT COMPUTING IN DATA SCIENCE 2016 (The 2nd INTERNATIONAL CONFERENCE ON SOFT COMPUTING IN DATA SCIENCE 2016)
2016年12月, Best Paper Award of The 11th International Conference on Natural Language Processing and Knowledge Engineering
2018年8月, 2nd Technological Competency as Caring in the Health Sciences 2018 Poster Presentation Award
2018年11月, IDRユーザーフォーラム2018 ドワンゴ賞 (国立情報学研究所)
2019年9月, Best Presentation Award (2019 International Conference on Natural Language Processing(ICNLP2019))
2023年9月, FIT奨励賞
2023年9月, FIT奨励賞 (電子情報通信学会) - 活動
- 研究者総覧に該当データはありませんでした。
2024年12月22日更新
2024年12月21日更新
Jグローバル
- Jグローバル最終確認日
- 2024/12/21 01:30
- 氏名(漢字)
- 吉田 稔
- 氏名(フリガナ)
- ヨシダ ミノル
- 氏名(英字)
- Yoshida Minoru
- 所属機関
- 徳島大学 講師
リサーチマップ
- researchmap最終確認日
- 2024/12/22 03:06
- 氏名(漢字)
- 吉田 稔
- 氏名(フリガナ)
- ヨシダ ミノル
- 氏名(英字)
- Yoshida Minoru
- プロフィール
- リサーチマップAPIで取得できませんでした。
- 登録日時
- 2011/11/10 10:41
- 更新日時
- 2022/9/19 14:47
- アバター画像URI
- リサーチマップAPIで取得できませんでした。
- ハンドル
- リサーチマップAPIで取得できませんでした。
- eメール
- リサーチマップAPIで取得できませんでした。
- eメール(その他)
- リサーチマップAPIで取得できませんでした。
- 携帯メール
- リサーチマップAPIで取得できませんでした。
- 性別
- リサーチマップAPIで取得できませんでした。
- 没年月日
- リサーチマップAPIで取得できませんでした。
- 所属ID
- 0344000000
- 所属
- 徳島大学
- 部署
- リサーチマップAPIで取得できませんでした。
- 職名
- 講師
- 学位
- リサーチマップAPIで取得できませんでした。
- 学位授与機関
- リサーチマップAPIで取得できませんでした。
- URL
- リサーチマップAPIで取得できませんでした。
- 科研費研究者番号
- リサーチマップAPIで取得できませんでした。
- Google Analytics ID
- リサーチマップAPIで取得できませんでした。
- ORCID ID
- リサーチマップAPIで取得できませんでした。
- その他の所属ID
- リサーチマップAPIで取得できませんでした。
- その他の所属名
- リサーチマップAPIで取得できませんでした。
- その他の所属 部署
- リサーチマップAPIで取得できませんでした。
- その他の所属 職名
- リサーチマップAPIで取得できませんでした。
- 最近のエントリー
- リサーチマップAPIで取得できませんでした。
- Read会員ID
- リサーチマップAPIで取得できませんでした。
- 経歴
- リサーチマップAPIで取得できませんでした。
- 受賞
- リサーチマップAPIで取得できませんでした。
- Misc
- 論文
- 講演・口頭発表等
- リサーチマップAPIで取得できませんでした。
- 書籍等出版物
- 研究キーワード
- 研究分野
- 所属学協会
- リサーチマップAPIで取得できませんでした。
- 担当経験のある科目
- リサーチマップAPIで取得できませんでした。
- その他
- リサーチマップAPIで取得できませんでした。
- Works
- リサーチマップAPIで取得できませんでした。
- 特許
- リサーチマップAPIで取得できませんでした。
- 学歴
- リサーチマップAPIで取得できませんでした。
- 委員歴
- リサーチマップAPIで取得できませんでした。
- 社会貢献活動
- リサーチマップAPIで取得できませんでした。
2024年12月21日更新
- 研究者番号
- 40361688
- 所属(現在)
- 2024/4/1 : 徳島大学, 大学院社会産業理工学研究部(理工学域), 講師
- 所属(過去の研究課題
情報に基づく)*注記 - 2024/4/1 : 徳島大学, 大学院社会産業理工学研究部(理工学域), 講師
2017/4/1 – 2022/4/1 : 徳島大学, 大学院社会産業理工学研究部(理工学域), 講師
2016/4/1 : 徳島大学, 大学院理工学研究部, 講師
2013/4/1 – 2015/4/1 : 徳島大学, ソシオテクノサイエンス研究部, 講師
2007/4/1 – 2012/4/1 : 東京大学, 情報基盤センター, 助教
2007/4/1 : 東京大学, 情報基盤センター, 教授
2003/4/1 – 2006/4/1 : 東京大学, 情報基盤センター, 助手
- 審査区分/研究分野
-
研究代表者
総合・新領域系 / 総合領域 / 情報学 / 知能情報学
総合系 / 情報学 / 人間情報学 / 知能情報学
小区分62020:ウェブ情報学およびサービス情報学関連研究代表者以外
総合・新領域系 / 総合領域 / 情報学 / 知能情報学
総合系 / 情報学 / 情報学フロンティア / ウェブ情報学・サービス情報学
理工系
小区分61060:感性情報学関連
- キーワード
-
研究代表者
Web文書 / 文書構造 / XML / EMアルゴリズム / レイアウト / 自然言語処理 / 数値情報 / テキストマイニング / 接尾辞配列 / クラスタリング / 数値検索 / ディリクレ過程混合モデル / 数値情報抽出 / レイアウト解析 / 表形式解析 / 数値表現解析 / 表形式 / 数値表現 / SNS / 分散表現 / コミュニティ抽出 / 用語抽出 / 単語分散表現 / テキスト中の数値表現 / 健康情報検索 / 数値情報解析 / 健康情報解析 / SNS解析 / 健康情報 / グラウンディング / 生活習慣分析 / 食事画像分類 / 文書構造解析 / テキスト中の数値解析 / 画像分類 / 健康情報抽出 / SNS分析 / 画像とテキストの関連分析 / 専門用語抽出
研究代表者以外
画像・文章・音声等認識 / 情報基礎 / 人工知能 / ユーザインタフェース / ディレクトリ情報検索 / 分かり易さ / WWW / 情報検索 / 言い換え / 情報抽出 / 自然言語処理 / カタカナ / 異表記 / 携帯端末 / 検索エンジン / 用例抽出 / 多言語 / コーパス / テキスト / 機械学習 / 知識 / テキストマイニング / 用語抽出 / 半構造テキスト / ブログ / マイニング / スパム / 曖昧性解消 / ベイズ統計 / Web / 曖昧生解消 / オンライン学習 / 人名検索 / 情報ナビゲーション / Wikipedia / 有益性 / 信頼性 / 意外性 / 知識発見 / データマイニング / ネットワークデータ / 統計 / 曖昧正解消 / プライバシー保護 / 言語学習 / クラスタリング / 非負行列分解 / GPU / アルゴリズム / 用例検索 / 名寄せ / 検索 / Trie / n-gram / インデキシング / 用例 / Knowledge / Text / Mining / Usage Retrieval / People Name Search / Terminology Extraction / Machine Learning / ウェブインテリジェンス / 医療・健康情報 / 事実性解析 / ソーシャルメディア / テキストの事実性解析 / ディープラーニング / テキストからの位置推定 / 感性言語モデル / 感性的言語変換 / 感性表現 / 言語モデル / 分散表現 / 感性情報処理 / 感性ロボティクス / ミスコミュニケーション