感情分析
感情分析(かんじょうぶんせき、英: sentiment analysis)は、オピニオンマイニング(英: opinion mining)や感情AI(英: emotion AI)とも呼ばれ、自然言語処理、テキスト解析、計算言語学、バイオメトリクス (en:英語版) などを使用して、感情状態や主観的情報を体系的に識別、抽出、定量化、探究する技術である。感情分析は、マーケティングから顧客サービス、臨床医学に至るまで、さまざまな用途で、レビューやアンケート回答などの顧客の声、オンラインメディアやソーシャルメディアのコンテンツ、ヘルスケア情報などの分析に利用されている。RoBERTaのような深層言語モデルの登場により、たとえば記者が暗黙のうちに感情を表現することが多いニューステキストなど、より困難なデータ領域も分析できるようになった[1]。
例
編集感情分析の目的と課題は、いくつかの簡単な例で説明することができる。
簡単な例
編集- オールデイ・クルーザーの中でも、コロネットは最高のラインを持っている。
- バートラムの船体は深いV字型で、海を軽々と滑走することができる。
- 1980年代のパステルカラーのフロリダ発のデイ・クルーザーは魅力がない。
- 古いキャビン・クルーザーは嫌いだ。
より難しい例
編集- キャビンクルーザーが嫌いというわけではない。(否定の扱い)
- 水上バイクを嫌うのは、あまり得意ではない。(否定、逆語順)
- 時に複合艇はかなりイライラする。(副詞が感情を修飾する)
- こんな天気で外出するなんてワクワクする。(皮肉の可能性がある)
- ライムストーンよりクリスクラフトの方がかっこいい。(2つのブランド名、態度の対象を特定するのは難しい)。
- クリスクラフトはライムストーンより美的感覚に優れているが、ライムストーンは耐航性と信頼性を醸し出している。(2つの態度、2つのブランド名)。
- この映画は、不穏な展開が多くて驚かされた。(ある領域で肯定的な意味で使われる否定的な言葉)。
- このヤバいデザートメニューを見てくれ。(甘くて濃厚という意味を持つ。態度用語は、最近、特定の領域で極性が変化している)
- この携帯電話を愛用しているけど、同僚には勧められない。(分類が困難な、条件付きの肯定的な感情)
- 来週の演奏はkoide9だ!(フランス語で「Quoi de neuf?」(新しいもの)を意味する。新しく作られた用語は、非常に態度的であり、極性が不安定で、既知の語彙から外れていることがよくある)。
種類
編集極性の識別
編集感情分析の基本的なタスクの1つは、与えられたテキストの極性(polarity)を、文書、文、または特徴/側面のレベルで決定することである。つまり、文書、文、またはエンティティ(実体)の特徴/側面で表現された意見が、肯定的(positive)、否定的(negative)、または中立的(neutral)かどうかを分類する作業である。「極性を超えた」高度な感情分類では、たとえば、喜び、怒り、嫌悪、悲しみ、恐怖、驚きなどの感情状態も考慮する[2]。
感情分析以前には、文中のパターンを数値化することで洞察を与えた General Inquirer や[3]、それとは別に、言語行動に基づいて人の心理状態を分析する心理学研究などの方法があった[4]。
その後、VolcaniとFogelが特許を取得した方法は[5]、特に感情に焦点を当て、さまざまな感情尺度でテキスト内の個々の単語やフレーズ(熟語、言い回し)を識別した。彼らの研究に基づいて開発されたEffectCheckというシステムは、各尺度において感情喚起のレベルを増減させるために使用できる同義語を提示する。
その後の多くの取り組みはあまり洗練されておらず、感情を肯定的と否定的を両極に配した極性尺度で表現していた。たとえば、Turney[6]とPang[7]は、それぞれ製品レビューと映画レビューの極性を文書レベルで検出するために異なる方法を適用した。しかし、Pang[8]とSnyder[9]らのように、文書の極性を多方向スケールで分類しようとする試みもあった。たとえばPangとLeeは、映画レビューを肯定的か否定的かのいずれかに分類するという基本的なタスクを拡張し、3つ星または4つ星スケールでの星評価を予測しfた[8]。Snyderは、レストランのレビューを詳細に分析し、料理や雰囲気など、与えられたレストランのさまざまな側面に対する評価を5つ星スケールで予測した[9]。
2004年、アメリカ人工知能学会(AAAI)スプリングシンポジウムで、テキストにおける情動、魅力、主観性、感情に関する体系的な計算研究のために、学習・語彙・知識ベースなどのさまざまな手法を統合する第一歩が踏み出された。そこでは、言語学者、コンピュータ科学者、その他の関心を持つ研究者が互いの関心領域を調整し、共有タスクやベンチマーク用データセットを提案した[10]。
多くの統計的分類法は、中立的なテキストが二値分類器の境界近くに位置するという前提で中立クラスを無視しているが、あらゆる極性問題と同様に、3つのカテゴリを識別する必要があることを示唆する研究者もいる。最大エントロピー[11]やサポートベクターマシン(SVM)[12]などの特定の分類器では、中立クラスを組み込むことで、分類精度が全体的に向上することが実証されている。中立クラスを組み込む仕組みとして2つの方法がある。アルゴリズムが最初に中立的な言葉を特定し、フィルタで除外して、残りのテキストを肯定的な感情と否定的な感情の観点から評価する方法と、1つのステップで3方向の分類システムを構築する方法である[13]。この2番目の方法では、多くの場合、すべてのカテゴリに対する確率分布を推定する(たとえば、NLTKで実装されている単純ベイズ分類器による)。中立クラスを含めるかどうか、またどのように含めるかは、データの性質に依存する。データが中立的、否定的、肯定的な言葉に明確に分類されている場合、中立的な言葉を除外して、肯定的な感情と否定的な感情の間の極性に焦点を当てることは理にかなっている。一方、データのほとんどが中立的で、肯定と否定の感情がわずかに偏差をもつ場合、この戦略をとると、2つの極性を明確に区別することが難しくなる可能性がある。
感情を決定する別の方法は、スケーリングシステムを使用することである。一般的に否定的、中立的、または肯定的な感情と関連付けられた単語に、-10から+10のスケール(最も否定的から最も肯定的まで)、または単純に0から+4などの正の上限値で対応する数値が付与される。これにより、ある用語の感情を、その文脈(通常は文レベル)に関して調整することができる。構造化されていないテキストを自然言語処理で分析する場合、指定された文脈内の各概念は、その概念に対する感情語の関わり方と感情値に基づいてスコアが付与される[14][15][16]。これにより、ある概念の感情値を周囲のあらゆる変化に対して相対的に調整できるため、感情をより高度に理解することができるようになる。たとえば、概念によって表現された感情を強める、緩和する、否定する単語は、そのスコアに影響を与える。また、テキストの全体的な極性や強さではなく、テキスト内の感情を判断することを目的とするなら、テキストに肯定的および否定的な感情強度スコアを与えることができる[17]。
感情分析には他にも、アスペクトベース感情分析、グレーディング感情分析(肯定、否定、中立)、多言語感情分析、感情検出など、さまざまな種類がある。
主観・客観の識別
編集主観性分析のタスクは一般に、与えられたテキスト(通常は文・文章)を、客観的または主観的な2つのクラスのいずれかに分類することと定義される[18]。単語やフレーズの主観は文脈に依って変わり、たとえば、人々の意見を引用したニュース記事のように、客観的な文書の中に主観的な文が含まれることもあるため、この作業は極性分類よりも難しい場合がある[19]。さらに、Suが指摘したように[20]、主観性分析の結果は、テキストに注釈する際に使用される「主観性の定義」に依存する。しかし、Pangは[21]、極性分類を行う前に文書から客観的な文を削除することで、成績を向上させることができることを示した。
文や文書に含まれているのが客観的な事実なのか、それも主観的な意見なのかを識別することは、感情分析の新たな側面である。この作業では、構文的特徴や意味的特徴、機械学習を使用する。しかし、事実と意見を識別することは新しく生まれたものではなく、1979年にイェール大学のCarbonellによって発表されている。
客観的という用語は、事実や実際の出来事に基づいた情報を指している[22]。
- 客観的な文の例:「米国大統領に選出されるには、候補者は35歳に達していなければならない」。
主観的という用語は、客観的な事実に反する情報を指しており、個人的な意見、判断、予測などさまざまな形がある。Quirkらはこれを「個人的言及(private states)」と言及している[23]。次の例では「私たちアメリカ人」という表現があり、個人的言及を反映している。さらに、Liu(2010)が述べているように[24]、これらの意見の対象は、有形の製品から無形の話題まで多岐にわたる。また、Liuは、肯定的意見、中立的意見、否定的意見の3種類の態度を特定している[24]。
- 主観的な文の例:「私たちアメリカ人は、成熟していて賢明な判断を下せる大統領を選ぶ必要がある」。
この分析は主観性分類問題として分類することができる[25]。
注釈のないテキストから望ましいパターンを探し出すために各クラスが使用する単語やフレーズの集まりは標識として定義されている。主観的表現に特化した別の単語リストが作成されている。これらの指標のリストは、Riloff et al.(2003)が述べているように[26]、言語学者や自然言語処理分野の研究者によって開発されたものである。与えられた表現を測定するためには、抽出ルールの辞書を作成する必要がある。主観認識のための特徴抽出では、長年にわたって、手作業による特徴の収集・整理から自動化された特徴学習へと進歩してきた。現在、自動学習法は教師あり学習と教師なし学習に分けることができる。学術研究者は、注釈付きテキストと注釈なしテキストの両方について、機械学習によるパターン抽出を広く研究してきた。
しかし、表現に関する不変のルールセットを開発することは、研究者が認識しているように、いくつかの課題がある。これらの課題は、テキスト情報の性質に起因しており、次の6つの要因が含まれている。1)比喩表現、2)文体の不一致、3)文脈への依存、4)使用頻度の少ない代表的な語、5)時間的な制約、6)増え続ける量。
- 比喩表現。テキストに見られる比喩的な表現は、抽出の成績に影響を与える可能性があり[27]、また、比喩はさまざまな形態があるため、誤検出の増加に影響している可能性がある。
- 文体の不一致。特にインターネットから入手したテキストを扱う場合、テキストデータにはさまざまな形式や様式が含まれる可能性がある。
- 文脈への依存。前後の文の主観や客観によって分類が変わることがある[25]。
- 使用回数が少ないものの、ルール作成においては手がかりとなる語(cue words)が存在する。
- 時間的な制約。テキストデータに含まれる時間的な制約によって、この作業を難しくすることがある。たとえば、研究者グループがニュースの事実を確認したい場合、ニュースが陳腐化するよりも長い期間を設定した交差検証を行う必要がある。
- 増え続ける量。テキストデータが増え続けるため、研究者が合理的な時間内に作業を完了することは圧倒的に困難になる。
これまでの研究では、主に文書レベルで分類することに焦点が当てられていた。しかし、文書にはさまざまな種類の話題が含まれているため、文書レベルの分類では正確さに欠く傾向がある。ある調査では、客観的表現が支配的と予想されるニュース記事に対して、実際には主観的表現が40%以上含まれていることが明らかになった[22]。
このような課題に取り組むため、研究者は、分類器の有効性は、パターンを学習する精度に依存すると結論付けている。そして、大量の注釈付き学習データで訓練した学習器は、あまり包括的でない主観的特徴で訓練した学習器よりも優れていることが分かっている。しかし、手作業で注釈された文の大規模なデータセットを作成することは、この種の作業を行う上で大きな障害となっている。手作業による注釈が自動学習より好まれない理由は3つある。
- 理解度のばらつき。手作業による注釈では、言語が曖昧さにより、ある文が主観的か客観的かの判断が、作業者によって異なることがある。
- ヒューマンエラー。手作業による注釈は、細心の注意を払い、多大な集中力を要するため、完成させるためにヒューマンエラーが起こる可能性が高い。
- 時間がかかる。手作業による注釈は、大変な労力と時間を要する。Riloff(1996)は、1人の作業者が160個のテキストを処理するのに8時間かかったと報告している[28]。
前述の要因はすべて、主観的データと客観的データを分類する効率と効果に影響を与える可能性がある。その結果、注釈のないテキストデータから言語パターンを学習するために、2つのブートストラップ法が開発された。どちらの手法も、少数のシードワード(種単語)と注釈のないテキストデータから始める。
- 1999年にRiloffとJonesが考案したメタ・ブートストラップ法(Meta-Bootstrapping)[29]は2つの段階を持つ。第1段階:あらかじめ定義されたルールに基づいて抽出パターンを作成し、各パターンが持つシードワードの数に基づいて抽出パターンを作成する。第2段階:上位5単語に注目して辞書に追加する。これを繰り返す。
- ThelenとRiloffによって開発されたBasilisk法 (Bootstrapping Approach to Semantic Lexicon Induction using Semantic Knowledge)[30]は3つの段階を持つ。 第1段階:抽出パターンを作成する。第2段階:パターンプールから最良のパターンを候補単語プールに移動する。第3段階:上位10単語に着目して辞書に追加する。これを繰り返す。
これらのアルゴリズムは、主観的および客観的な分類を含む作業における自動パターン認識および抽出の必要性を強調するものである。
主観的および客観的な分類器を使用することで、さまざまな自然言語処理のアプリケーションを強化することができる。この分類器の主な利点の1つは、さまざまな業界でデータ駆動型の意思決定プロセスの実践を普及させたことである。Liuによると、主観的/客観的識別のアプリケーションは、ビジネス、広告、スポーツ、および社会科学で実践されている[31]。
- オンラインレビューの分類: ビジネス業界では、製品への反応やレビュー、その背景をより深く理解するのに分類器が役立っている。
- 株価の予測: 金融業界では、ソーシャルメディアやインターネット上のテキスト情報などの補助情報を分類器で処理することで、予測モデルを強化することができる。Dongらが行った日本の株価に関する先行研究では、主観的/客観的モジュールを備えたモデルは、持たないモデルよりも優れた性能を発揮する可能性があることが示されている[32]。
- ソーシャルメディアの分析。
- 学生の反応の分類[33]。
- 文書の要約: 分類器は、対象に特化したコメントを抽出したり、特定の実体によって表明された意見を収集することができる。
- 複雑な質問に対する回答: 分類器は、言語で表現された複雑な質問を、主語や目的、焦点を絞った対象を分類することによって分解することができる。Yu et al.(2003)が行った研究では、文や文書レベルでのクラスタリング法を開発して雑観を識別している[34]。
- 分野別のアプリケーション
- 電子メール分析: 主観的/客観的な分類器によって、対象となる語句に関連する言語パターンを追跡することで、スパムを検出する。
特徴や側面
編集特徴や側面に基づく感情分析は、携帯電話やデジタルカメラなど製品や、銀行などサービスなどの、実体が持つさまざまな特徴や側面に対して表明された意見や感情を特定して分析するものである[35]。ここで、特徴(feature)や側面(aspect)とは、たとえば携帯電話の画面、カメラの画質、レストランのサービスなど、実体が備え持つ属性や構成要素のことである。この方法の利点は、関心のある対象についてのニュアンス(微妙な差違)を捉えることができることである。たとえば、あるホテルは便利な立地だが食事は平凡であるなど、異なる特徴によって異なる感情反応が引き出されることがある[36]。このような分析には、関連する実体の識別、その特徴/側面の抽出、それぞれの特徴/側面について表明された意見が肯定、否定、中立かどうかの判断など、いくつかの下位問題が含まれる[37]。特徴の自動識別は、構文解析、トピックモデリング[38][39]、ディープラーニング(深層学習)などによって行われる[40][41]。このレベルの感情分析の詳細については、Liuの論文で議論されている[24]。
強度ランク
編集感動や感情は、本質的に主観的なものである。文書、文、あるいは特徴/側面のいずれのレベルであっても、与えられたテキストに表現される感動や感情がどの程度の強度を示すかは一件一件異なる[42]。しかし、感動や感情だけを予測しても、必ずしもメッセージを包括的に理解できるとは限らない。感動や感情の強度や水準(例:「良い」対「すばらしい」)は、1つのクラス内の正確な感性を理解する上でしばしば重要な役割を果たす。これらに対応するため、一部の手法では出力を組み合わせたスタックアンサンブル法を採用し、畳み込み型ニューラルネットワーク[43]、長期短期記憶ネットワーク、およびゲート付き回帰型ユニットに基づく深層学習モデルを組み込み[44]、感動と感情の強度を予測している[45]。
方法と特徴
編集感情分析における既存の手法には、知識ベース技術、統計的手法、ハイブリッド手法の3つの主要カテゴリがある[46]。知識ベース技術は、幸せ(happy)、悲しい(sad)、恐い(fraid)、退屈(bored)などの感情語の明確な存在に基づいて、テキストを感情カテゴリに分類する[47]。知識ベースの中には、決まりきった感情語を列挙するだけでなく、任意の単語に特定の感情との「親和性」を付与するものもある[48]。統計的手法では、潜在意味解析、サポートベクターマシン、バッグオブワード、意味的指向の自己相互情報量[6]、意味空間モデルや単語埋め込みモデル[49]、ディープラーニング(深層学習)などの機械学習要素を使用する。より高度な手法では、単語の文法的関係を利用して文脈の中で意見を掘り下げ、感情の保有者(その感情状態の持ち主)とその対象(その感情が感じられる実体)を特定し、発言者が述べた意見から特徴を得ようとする[50]。文法的な依存関係は、テキストを詳細に構文解析することで得られる[51]。ハイブリッド手法は、機械学習と、オントロジーや意味ネットワークなどの知識表現要素の両方を組み合わせ、他の概念に暗黙的にリンクする概念など、意味の微妙な表現を検出する[52]。
さまざまなオープンソースのソフトウェアツールや、無償/有償の感情分析ツールは、機械学習、統計、自然言語処理の技術を使用して、ウェブページ、オンラインニュース、インターネット上のディスカッショングループ、オンラインレビュー、ウェブブログ、ソーシャルメディアなど、大規模テキストに対する感情分析を自動化する[53]。一方、知識ベースシステムは、一般公開されているリソースから、自然言語の概念に関連する意味情報や感情情報を抽出し、システムが感情的な常識推論を行うことを可能にする[54]。感情分析は、画像や動画などのビジュアルコンテンツにも適用できる(マルチモーダル感情分析を参照)。この分野の最初の手法として、ビジュアルコンテンツの形容詞-名詞ペア表現を利用した SentiBank がある[55]。さらに、ほとんどの感情分類手法では、文脈や文法だけでなく語順さえも無視するバッグオブワードモデルに依存している。単語がより長いフレーズの意味を構成する方法に基づいて感情を分析する手法は、注釈に伴う追加作業が発生するが、より良い結果を示している[56]。
感情分析では、自動システムが個々のコメント投稿者の過去の傾向やその理由を分析することができず、表現された感情を誤って分類することが多いため、人間による分析工程が必要である。人間が正しく分類したコメントのうち、約23%が自動システムと異なる[57]。しかし、人間はお互い異なる意見を持ち、人間どうしの合意は、自動化された感情分類器が最終的に到達できる上限を規定すると主張する研究者もいる[58]。
評価
編集感情分析システムの精度は、基本的には人間の判断との一致度に基づいて評価され、通常は、否定的テキストと肯定的テキストの2つのカテゴリに対する適合率と再現率の変量指標で測定される。しかし、研究により、人間の評価者は80%程度しか同意しないことが示されている(評価者間信頼性を参照)[59]。そのため、70%の精度を持つプログラムは、精度は優れないようにも取れるが、人間とほぼ同等と考えられる。また、人間はどのような答えに対しても20%程度は反対する傾向があるため、仮にプログラムの精度が100%であっても20%程度は同意しないことになる[60]。
しかし、コンピュータシステムと人間の評価者の精度を比較することは、誤りの種類が異なるため、完全に適切とは言えない。たとえば、コンピュータシステムは、否定、誇張、冗談、皮肉など、一般的に人間が理解しやすい表現を不得手とすることがある。コンピュータシステムによる誤りの中には、人間にとってあまりに幼稚に見えるものもある。一般的に、学術研究から定義された感情分析の実用性は商業目的においては疑問視されている。その主な理由は、否定から肯定への単純な一次元の感情モデルでは、ブランドや企業の評判に及ぼす世論の影響を懸念する顧客にとって、十分に実用的な洞察を提供しないためである[61][62][63]。
感情分析の評価は、市場の要求に応えるため、PR代理店や市場調査の専門家と共同で開発された課題指向の指標に移行している。たとえば、RepLabの評価データセットでは、調査対象のテキストの内容そのものよりも、テキストがブランドの評判に与える影響に重点が置かれている[64][65][66]。感情分析の評価はますます課題指向になってきているため、特定のデータセットに対してより正確な感情表現を得るために、それぞれの事例ごとに個別の訓練モデルが必要となる。
Web 2.0
編集ブログやソーシャルネットワークなどのソーシャルメディアの台頭により、感情分析への関心が高まっている。オンラインレビュー、評価、推奨など、 オンライン上の表現が豊富になったことで、企業はこの一種の仮想通貨を使用して、製品のマーケティング、新しい機会の発見、評判の管理などを目指すようになった。そして多くの企業は、ノイズを除去し、会話を理解し、関連するコンテンツを特定し、適切な対処をとる過程を自動化するために感情分析に注目している[67]。しかし、4chanやRedditといった匿名によるソーシャルメディア・プラットフォームの台頭は、この過程に複雑さを加えている[68]。Webの次の段階では、Web 2.0がパブリッシング(出版)の民主化とすれば、すべての公開コンテンツに対するデータマイニングの民主化となる可能性がある[69]。
研究の分野において、この目標に向けた第一歩が進められている。2009年現在、世界中の大学のいくつかの研究チームが、感情分析によって電子コミュニティ内の感情のダイナミクスを理解することに専念している[70]。たとえば、2010年のCyberEmotionsプロジェクトでは、ソーシャルネットワーク上での議論を推進する上で、否定的な感情が重要な役割を果たすことを明らかにした[71]。
感情分析アルゴリズムの多くは、単純な用語を使用しているため、製品やサービスに関する感情を表現するのに課題を抱えている。しかし、文化的な要因、言語的なニュアンス、文脈の違いによる影響もあり、記述されたテキストを単純に賛成/反対の感情に変換する非常に困難を伴う[67]。さらに、テキストの感情の解釈に関する人間どうしの意見の相違は、コンピュータにとってこの作業がいかに難しいかを表している。さらにテキストの長さが短いほど、その難しさが増してくる。
Twitterは短い文字列のために難しいが、マイクロブログ上の感情分析により、政治的感情の有効なオンライン指標となることが実証された。ツイートの政治的感情は、政党や政治家の政治的立場と密接に対応しており、Twitterメッセージの内容がオフラインの政治情勢を反映していることが示唆される[72]。さらに、Twitterの感情分析は、医薬品の副作用や人間の生殖サイクルなど[73]、公衆衛生に関する問題や背後にある世界的な世相を捉えられるのに有効であることが立証されている[74]。
感情分析は、ソーシャルメディアや製品レビューなど、著者が明示的に意見を表明する領域(「この映画は素晴らしい」)で広く利用されているが、感情が暗黙的または間接的に現れる他の領域に対する堅牢な手法が近年になって開発された。たとえば、ニュース記事では、ジャーナリズムの客観性が期待されるため、ジャーナリストは情報の極性を直接述べるのではなく、行動や出来事を説明することがよくある。辞書や表面的な機械学習機能を用いた従来の手法では、「行間の意味」を捉えることができなかったが、最近、研究者は、ニュース記事の感情を分析できるディープラーニングに基づく手法とデータセットを提案した[1]。
推薦システムへの応用
編集感情分析は、レコメンダーシステム(推薦システム)のための有益な技術であることが実証されている。レコメンダーシステムの主な目的は、あるアイテムに対する対象ユーザーの好みを予測することである。ほとんどの主流のレコメンダーシステムは、明示的なデータセットに基づいて動作する。たとえば、協調フィルタリングは評価行列で動作し、コンテンツ依存フィルタリングはアイテムのメタデータに基づいて動作する。多くのソーシャル・ネットワーキング・サービスや電子商取引サイトでは、ユーザーがアイテムに関するレビュー、コメント、フィードバックをテキストで提供することができる。これらのユーザーが作成したテキストは、さまざまなアイテムに対するユーザーの感情的意見が豊富に含まれている。テキストはまた、あるアイテムに関する特徴/側面の種類だけでなく、それぞれの特徴に対するユーザーの感情の両方を明らかにすることができる[75]。レコメンダーシステムにとって、これらの特徴/側面は、コンテンツ依存フィルタリングにおけるメタデータと同様の役割を果たすが、前者の方がより価値がある。ユーザーが記述したテキストによる幅広い特徴に言及しているため、アイテムに対するユーザー体験の影響を大きく反映した最も重要なものと考えられる。これに対し、一般に生産者が提供するアイテムのメタデータは、ユーザーが懸念する重要な特徴を見落とす可能性がある。ユーザーは、特徴を共有するさまざまなアイテムに対して、異なる感情を抱くかもしれない。また、同じアイテムの特徴であっても、ユーザによって異なる感情が生じる可能性がある。ユーザの特徴に対する感情は、アイテムに対するユーザの好みを反映した多次元評価スコアとして考えることができる。
ユーザが作成したテキストから抽出した特徴/側面と感情を基づき、ハイブリッド推薦システムを構築することができる[76]。ユーザにアイテム候補を推薦する動機は2つある。第一の動機は、候補アイテムがユーザーが好みのアイテムと多くの共通点を持つことであり[77]、第二の動機は、候補アイテムがその特徴に対して高い感性スコアを獲得していることである。あるアイテムが好みのアイテムと同じ特徴を持つ場合、ユーザーはそのアイテムを好むと考えるのが妥当である。一方、特徴を共通とする2つの候補アイテムの場合、他のユーザが一方に肯定的で、もう一方は否定的な感情を抱く可能性がある。もちろん、評価の高いアイテムがユーザーに推奨されるはずである。この2つの動機に基づき、類似性と感情評価の組み合わせることで、候補アイテムごとのランキングスコアを算出することができる[76]。
感情分析を行うことの本質的な難しさとは別に、感情分析をレビューやフィードバックに適用する場合、スパムや偏ったレビューという課題にも直面する。これに対し、各レビューの有用性を評価することに重点を置いた研究がなされている[78]。書き方が不十分なレビューやフィードバックは、レコメンダーシステムにとってほとんど役に立たない。さらに、よく書かれているレビューが、特定の製品の販売を妨害するように意図されている場合、レコメンダーシステムにとって有害となる可能性もある。
研究により、ユーザーが生成した長文のテキストと短文のテキストは、異なる扱いをする必要があることが明らかになった。興味深いことに、短文のテキストでは無関係な情報を除外しやすいため、長文よりも有益な場合があるという[79]。長文のテキストを長くしても、テキスト内の特徴や感情の数が比例して増えるとは限らない。
Lamba & Madhusudhanは[80]、今日の図書館利用者の情報ニーズに対応するため、Twitterなどのソーシャルメディアから感情分析の結果を再パッケージ化し、さまざまな形式で利用できる時間ベースの統合化サービスとして新たな方法を紹介した。また、ソーシャルメディアマイニングと感情分析を利用した、図書館の新しいマーケティング方法も提案している。
参考項目
編集- アフェクティブ・コンピューティング - 人間の感情を扱えるシステムや装置の研究や開発を目指す学際的な分野
- 消費者態度指数 - 経済に対する消費者の信頼感を定量化するための経済指標
- 感情認識 - 人間の感情を識別する過程、およびそれを研究する分野
- 友好的な人工知能 - 人間に良性な影響を与えるか、その利益に沿うような仮説上の人工一般知能
- マルチモーダル感情分析 - テキストに加え、音声や視覚データなどのモダリティを含むの感情分析の技術
- 計量文献学 - 文書群に統計的分析を適用して特徴や形式を評価する言語学の分野
脚注
編集- ^ a b Hamborg, Felix; Donnay, Karsten (2021). "NewsMTSC: A Dataset for (Multi-)Target-dependent Sentiment Classification in Political News Articles". "Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume"
- ^ Vong Anh Ho, Duong Huynh-Cong Nguyen, Danh Hoang Nguyen, Linh Thi-Van Pham, Duc-Vu Nguyen, Kiet Van Nguyen, Ngan Luu-Thuy Nguyen. "Emotion Recognition for Vietnamese Social Media Text". In Proceedings of the 2019 International Conference of the Pacific Association for Computational Linguistics (PACLING 2019), Hanoi, Vietnam (2019).
- ^ Stone, Philip J., Dexter C. Dunphy, and Marshall S. Smith. "The general inquirer: A computer approach to content analysis." MIT Press, Cambridge, MA (1966).
- ^ Gottschalk, Louis August, and Goldine C. Gleser. The measurement of psychological states through the content analysis of verbal behavior. Univ of California Press, 1969.
- ^ USA Issued 7,136,877, Volcani, Yanon; & Fogel, David B., "System and method for determining and controlling the impact of text", published June 28, 2001
- ^ a b Turney, Peter (2002). "Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classification of Reviews". Proceedings of the Association for Computational Linguistics. pp. 417–424. arXiv:cs.LG/0212032。
- ^ Pang, Bo; Lee, Lillian; Vaithyanathan, Shivakumar (2002). "Thumbs up? Sentiment Classification using Machine Learning Techniques". Proceedings of the Conference on Empirical Methods in Natural Language Processing (EMNLP). pp. 79–86.
- ^ a b Pang, Bo; Lee, Lillian (2005). "Seeing stars: Exploiting class relationships for sentiment categorization with respect to rating scales". Proceedings of the Association for Computational Linguistics (ACL). pp. 115–124.
- ^ a b Snyder, Benjamin; Barzilay, Regina (2007). "Multiple Aspect Ranking using the Good Grief Algorithm". Proceedings of the Joint Human Language Technology/North American Chapter of the ACL Conference (HLT-NAACL). pp. 300–307.
- ^ Qu, Yan, James Shanahan, and Janyce Wiebe. "Exploring attitude and affect in text: Theories and applications." In AAAI Spring Symposium, Technical report SS-04-07. AAAI Press, Menlo Park, CA. 2004.
- ^ Vryniotis, Vasilis (2013). The importance of Neutral Class in Sentiment Analysis.
- ^ Koppel, Moshe; Schler, Jonathan (2006). "The Importance of Neutral Examples for Learning Sentiment". Computational Intelligence 22. pp. 100–109. CiteSeerX 10.1.1.84.9735。
- ^ Ribeiro, Filipe Nunes; Araujo, Matheus (2010). “A Benchmark Comparison of State-of-the-Practice Sentiment Analysis Methods”. Transactions on Embedded Computing Systems 9 (4) .
- ^ Taboada, Maite; Brooke, Julian (2011). “Lexicon-based methods for sentiment analysis”. Computational Linguistics 37 (2): 272–274. doi:10.1162/coli_a_00049 .
- ^ Augustyniak, Łukasz; Szymański, Piotr; Kajdanowicz, Tomasz; Tuligłowicz, Włodzimierz (2015-12-25). “Comprehensive Study on Lexicon-based Ensemble Classification Sentiment Analysis” (英語). Entropy 18 (1): 4. Bibcode: 2015Entrp..18....4A. doi:10.3390/e18010004.
- ^ Mehmood, Yasir; Balakrishnan, Vimala (2020-01-01). “An enhanced lexicon-based approach for sentiment analysis: a case study on illegal immigration”. Online Information Review 44 (5): 1097–1117. doi:10.1108/OIR-10-2018-0295. ISSN 1468-4527 .
- ^ Thelwall, Mike; Buckley, Kevan; Paltoglou, Georgios; Cai, Di; Kappas, Arvid (2010). “Sentiment strength detection in short informal text”. Journal of the American Society for Information Science and Technology 61 (12): 2544–2558. doi:10.1002/asi.21416 .
- ^ Pang, Bo; Lee, Lillian (2008). “4.1.2 Subjectivity Detection and Opinion Identification”. Opinion Mining and Sentiment Analysis. Now Publishers Inc
- ^ Mihalcea, Rada; Banea, Carmen; Wiebe, Janyce (2007). "Learning Multilingual Subjective Language via Cross-Lingual Projections" (PDF). Proceedings of the Association for Computational Linguistics (ACL). pp. 976–983. 2010年7月8日時点のオリジナル (PDF)よりアーカイブ。
- ^ Su, Fangzhong; Markert, Katja (2008). "From Words to Senses: a Case Study in Subjectivity Recognition" (PDF). Proceedings of Coling 2008, Manchester, UK.
- ^ Pang, Bo; Lee, Lillian (2004). "A Sentimental Education: Sentiment Analysis Using Subjectivity Summarization Based on Minimum Cuts". Proceedings of the Association for Computational Linguistics (ACL). pp. 271–278.
- ^ a b Wiebe, Janyce; Riloff, Ellen (2005). Gelbukh, Alexander. ed. “Creating Subjective and Objective Sentence Classifiers from Unannotated Texts” (英語). Computational Linguistics and Intelligent Text Processing. Lecture Notes in Computer Science (Berlin, Heidelberg: Springer) 3406: 486–497. doi:10.1007/978-3-540-30586-6_53. ISBN 978-3-540-30586-6 .
- ^ Quirk, Randolph; Greenbaum, Sidney; Geoffrey, Leech; Jan, Svartvik (1985). A Comprehensive Grammar of the English Language (General Grammar). Longman. pp. 175–239. ISBN 1933108312
- ^ a b c Liu, Bing (2010). "Sentiment Analysis and Subjectivity" (PDF). In Indurkhya, N.; Damerau, F. J. (eds.). Handbook of Natural Language Processing (Second ed.).
- ^ a b Pang, Bo; Lee, Lillian (2008-07-06). “Opinion Mining and Sentiment Analysis” (英語). Foundations and Trends in Information Retrieval 2 (1–2): 1–135. doi:10.1561/1500000011. ISSN 1554-0669 .
- ^ Riloff, Ellen; Wiebe, Janyce (2003-07-11). “Learning extraction patterns for subjective expressions”. Proceedings of the 2003 Conference on Empirical Methods in Natural Language Processing. EMNLP '03 (USA: Association for Computational Linguistics) 10: 105–112. doi:10.3115/1119355.1119369.
- ^ Wiebe, Janyce; Riloff, Ellen (July 2011). “Finding Mutual Benefit between Subjectivity Analysis and Information Extraction”. IEEE Transactions on Affective Computing 2 (4): 175–191. doi:10.1109/T-AFFC.2011.19. ISSN 1949-3045 .
- ^ Riloff, Ellen (1996-08-01). “An empirical study of automated dictionary construction for information extraction in three domains” (英語). Artificial Intelligence 85 (1): 101–134. doi:10.1016/0004-3702(95)00123-9. ISSN 0004-3702.
- ^ Riloff, Ellen; Jones, Rosie (July 1999). “Learning dictionaries for information extraction by multi-level bootstrapping”. AAAI '99/IAAI '99: Proceedings of the Sixteenth National Conference on Artificial Intelligence and the Eleventh Innovative Applications of Artificial Intelligence Conference Innovative Applications of Artificial Intelligence: 474–479 .
- ^ Thelen, Michael; Riloff, Ellen (2002-07-06). “A bootstrapping method for learning semantic lexicons using extraction pattern contexts”. Proceedings of the ACL-02 Conference on Empirical Methods in Natural Language Processing - Volume 10. EMNLP '02 (USA: Association for Computational Linguistics) 10: 214–221. doi:10.3115/1118693.1118721.
- ^ Liu, Bing (2012-05-23). “Sentiment Analysis and Opinion Mining”. Synthesis Lectures on Human Language Technologies 5 (1): 1–167. doi:10.2200/S00416ED1V01Y201204HLT016. ISSN 1947-4040 .
- ^ Deng, Shangkun; Mitsubuchi, Takashi; Shioda, Kei; Shimada, Tatsuro; Sakurai, Akito (December 2011). “Combining Technical Analysis with Sentiment Analysis for Stock Price Prediction”. 2011 IEEE Ninth International Conference on Dependable, Autonomic and Secure Computing (IEEE): 800–807. doi:10.1109/dasc.2011.138. ISBN 978-1-4673-0006-3 .
- ^ Nguyen, Kiet Van; Nguyen, Vu Duc; Nguyen, Phu X.V.; Truong, Tham T.H.; Nguyen, Ngan L-T. (2018-10-01). “UIT-VSFC: Vietnamese Students' Feedback Corpus for Sentiment Analysis”. 2018 10th International Conference on Knowledge and Systems Engineering (KSE) (Vietnam: IEEE): 19–24. doi:10.1109/KSE.2018.8573337. ISBN 978-1-5386-6113-0 .
- ^ Yu, Hong; Hatzivassiloglou, Vasileios (2003-07-11). “Towards answering opinion questions: separating facts from opinions and identifying the polarity of opinion sentences”. Proceedings of the 2003 Conference on Empirical Methods in Natural Language Processing. EMNLP '03 (USA: Association for Computational Linguistics): 129–136. doi:10.3115/1119355.1119372.
- ^ Hu, Minqing; Liu, Bing (2004). "Mining and Summarizing Customer Reviews". Proceedings of KDD 2004.
- ^ Cataldi, Mario; Ballatore, Andrea; Tiddi, Ilaria; Aufaure, Marie-Aude (2013-06-22). “Good location, terrible food: detecting feature sentiment in user-generated reviews”. Social Network Analysis and Mining 3 (4): 1149–1163. doi:10.1007/s13278-013-0119-7. ISSN 1869-5450.
- ^ Liu, Bing; Hu, Minqing; Cheng, Junsheng (2005). "Opinion Observer: Analyzing and Comparing Opinions on the Web". Proceedings of WWW 2005.
- ^ Zhai, Zhongwu; Liu, Bing; Xu, Hua; Jia, Peifa (2011-01-01). Huang, Joshua Zhexue. ed. Constrained LDA for Grouping Product Features in Opinion Mining. Lecture Notes in Computer Science. Springer Berlin Heidelberg. pp. 448–459. doi:10.1007/978-3-642-20841-6_37. ISBN 978-3-642-20840-9
- ^ Titov, Ivan; McDonald, Ryan (2008-01-01). Modeling Online Reviews with Multi-grain Topic Models. WWW '08. New York, NY, USA: ACM. 111–120. arXiv:0801.1063. doi:10.1145/1367497.1367513. ISBN 978-1-60558-085-2
- ^ Liang, Bin (2022). “Aspect-based sentiment analysis via affective knowledge enhanced graph convolutional networks”. Knowledge-Based Systems 235: 107643. doi:10.1016/j.knosys.2021.107643.
- ^ Ma, Yukun; et al. (2018). "Targeted aspect-based sentiment analysis via embedding commonsense knowledge into an attentive LSTM". Proceedings of AAAI. pp. 5876–5883.
- ^ Sharma, Raksha; Somani; Kumar; Bhattacharyya (2017). “Sentiment Intensity Ranking among Adjectives Using Sentiment Bearing Word Embeddings”. Association for Computational Linguistics: 547–552 .
- ^ X. Ouyang, P. Zhou, C. H. Li and L. Liu, "Sentiment Analysis Using Convolutional Neural Network," 2015 IEEE International Conference on Computer and Information Technology; Ubiquitous Computing and Communications; Dependable, Autonomic and Secure Computing; Pervasive Intelligence and Computing, 2015, pp. 2359-2364, doi: 10.1109/CIT/IUCC/DASC/PICOM.2015.349.
- ^ Y. Santur, "Sentiment Analysis Based on Gated Recurrent Unit," 2019 International Artificial Intelligence and Data Processing Symposium (IDAP), 2019, pp. 1-5, doi: 10.1109/IDAP.2019.8875985.
- ^ M. S. Akhtar, A. Ekbal and E. Cambria, "How Intense Are You? Predicting Intensities of Emotions and Sentiments using Stacked Ensemble [Application Notes]," in IEEE Computational Intelligence Magazine, vol. 15, no. 1, pp. 64-75, Feb. 2020, doi: 10.1109/MCI.2019.2954667.
- ^ Cambria, E; Schuller, B; Xia, Y; Havasi, C (2013). “New avenues in opinion mining and sentiment analysis”. IEEE Intelligent Systems 28 (2): 15–21. doi:10.1109/MIS.2013.30.
- ^ Ortony, Andrew; Clore, G; Collins, A (1988). The Cognitive Structure of Emotions. Cambridge Univ. Press. オリジナルの2015-11-23時点におけるアーカイブ。
- ^ Stevenson, Ryan; Mikels, Joseph; James, Thomas (2007). “Characterization of the Affective Norms for English Words by Discrete Emotional Categories”. Behavior Research Methods 39 (4): 1020–1024. doi:10.3758/bf03192999. PMID 18183921 .
- ^ Sahlgren, Magnus; Karlgren, Jussi; Eriksson, Gunnar (2007). "Valence annotation based on seeds in word space". Proceedings of the Fourth International Workshop on Semantic Evaluations (SemEval-2007).
- ^ Kim, S. M.; Hovy, E. H. (2006). "Identifying and Analyzing Judgment Opinions." (PDF). Proceedings of the Human Language Technology / North American Association of Computational Linguistics conference (HLT-NAACL 2006). New York, NY. 2011年6月29日時点のオリジナル (PDF)よりアーカイブ。
- ^ Dey, Lipika; Haque, S. K. Mirajul (2008). "Opinion Mining from Noisy Text Data". Proceedings of the second workshop on Analytics for noisy unstructured text data, p.83-90.
- ^ Cambria, E; Hussain, A (2015). Sentic Computing: A Common-Sense-Based Framework for Concept-Level Sentiment Analysis. Springer. ISBN 9783319236544
- ^ Akcora, Cuneyt Gurcan; Bayir, Murat Ali; Demirbas, Murat; Ferhatosmanoglu, Hakan (2010). "Identifying breakpoints in public opinion". SigKDD, Proceedings of the First Workshop on Social Media Analytics.
- ^ Cambria, Erik; Liu, Qian; Decherchi, Sergio; Xing, Frank; Kwok, Kenneth (2022). "SenticNet 7: A Commonsense-based Neurosymbolic AI Framework for Explainable Sentiment Analysis" (PDF). Proceedings of LREC. pp. 3829–3839.
- ^ Borth, Damian; Ji, Rongrong; Chen, Tao; Breuel, Thomas; Chang, Shih-Fu (2013). "Large-scale Visual Sentiment Ontology and Detectors Using Adjective Noun Pairs". Proceedings of ACM Int. Conference on Multimedia. pp. 223–232.
- ^ Socher, Richard; Perelygin, Alex; Wu, Jean Y.; Chuang, Jason; Manning, Christopher D.; Ng, Andrew Y.; Potts, Christopher (2013). “Recursive deep models for semantic compositionality over a sentiment treebank”. In Proceedings of EMNLP: 1631–1642.
- ^ “Case Study: Advanced Sentiment Analysis”. http://www.paragonpoll.com/.+28 Sep 2013時点のオリジナルよりアーカイブ。18 October 2013閲覧。
- ^ Mozetič, Igor; Grčar, Miha; Smailović, Jasmina (2016-05-05). “Multilingual Twitter Sentiment Classification: The Role of Human Annotators”. PLOS ONE 11 (5): e0155036. arXiv:1602.07563. Bibcode: 2016PLoSO..1155036M. doi:10.1371/journal.pone.0155036. ISSN 1932-6203. PMC 4858191. PMID 27149621 .
- ^ Ogneva, M.. “How Companies Can Use Sentiment Analysis to Improve Their Business”. Mashable 2012年12月13日閲覧。
- ^ Roebuck, K. (2012-10-24). Sentiment Analysis: High-impact Strategies - What You Need to Know: Definitions, Adoptions, Impact, Benefits, Maturity, Vendors. ISBN 9781743049457
- ^ Karlgren, Jussi, Magnus Sahlgren, Fredrik Olsson, Fredrik Espinoza, and Ola Hamfors. "Usefulness of sentiment analysis." In European Conference on Information Retrieval, pp. 426-435. Springer Berlin Heidelberg, 2012.
- ^ Karlgren, Jussi. "The relation between author mood and affect to sentiment in text and text genre." In Proceedings of the fourth workshop on Exploiting semantic annotations in information retrieval, pp. 9-10. ACM, 2011.
- ^ Karlgren, Jussi. "Affect, appeal, and sentiment as factors influencing interaction with multimedia information." In Proceedings of Theseus/ImageCLEF workshop on visual information retrieval evaluation, pp. 8-11. 2009.
- ^ Amigó, Enrique, Adolfo Corujo, Julio Gonzalo, Edgar Meij, and Maarten de Rijke. "Overview of RepLab 2012: Evaluating Online Reputation Management Systems." In CLEF (Online Working Notes/Labs/Workshop). 2012.
- ^ Amigó, Enrique, Jorge Carrillo De Albornoz, Irina Chugur, Adolfo Corujo, Julio Gonzalo, Tamara Martín, Edgar Meij, Maarten de Rijke, and Damiano Spina. "Overview of replab 2013: Evaluating online reputation monitoring systems." In International Conference of the Cross-Language Evaluation Forum for European Languages, pp. 333-352. Springer Berlin Heidelberg, 2013.
- ^ Amigó, Enrique, Jorge Carrillo-de-Albornoz, Irina Chugur, Adolfo Corujo, Julio Gonzalo, Edgar Meij, Maarten de Rijke, and Damiano Spina. "Overview of replab 2014: author profiling and reputation dimensions for online reputation management." In International Conference of the Cross-Language Evaluation Forum for European Languages, pp. 307-322. Springer International Publishing, 2014.
- ^ a b Wright, Alex. "Mining the Web for Feelings, Not Facts", New York Times, 2009-08-23. Retrieved on 2009-10-01.
- ^ “Sentiment Analysis on Reddit” (2014年9月30日). 10 October 2014閲覧。
- ^ Kirkpatrick, Marshall. ", ReadWriteWeb, 2009-04-15. Retrieved on 2009-10-01.
- ^ CORDIS. "Collective emotions in cyberspace (CYBEREMOTIONS)", European Commission, 2009-02-03. Retrieved on 2010-12-13.
- ^ Condliffe, Jamie. "Flaming drives online social networks ", New Scientist, 2010-12-07. Retrieved on 2010-12-13.
- ^ Tumasjan, Andranik; O.Sprenger, Timm; G.Sandner, Philipp; M.Welpe, Isabell (2010). "Predicting Elections with Twitter: What 140 Characters Reveal about Political Sentiment". "Proceedings of the Fourth International AAAI Conference on Weblogs and Social Media"
- ^ Wood, Ian B.; Varela, Pedro L.; Bollen, Johan; Rocha, Luis M.; Gonçalves-Sá, Joana (2017). “Human Sexual Cycles are Driven by Culture and Match Collective Moods”. Scientific Reports 7 (1): 17973. arXiv:1707.03959. Bibcode: 2017NatSR...717973W. doi:10.1038/s41598-017-18262-5. PMC 5740080. PMID 29269945 .
- ^ Korkontzelos, Ioannis; Nikfarjam, Azadeh; Shardlow, Matthew; Sarker, Abeed; Ananiadou, Sophia; Gonzalez, Graciela H. (2016). “Analysis of the effect of sentiment analysis on extracting adverse drug reactions from tweets and forum posts”. Journal of Biomedical Informatics 62: 148–158. doi:10.1016/j.jbi.2016.06.007. PMC 4981644. PMID 27363901 .
- ^ Tang, Huifeng; Tan, Songbo; Cheng, Xueqi (2009). “A survey on sentiment detection of reviews”. Expert Systems with Applications 36 (7): 10760–10773. doi:10.1016/j.eswa.2009.02.063. オリジナルの2018-05-24時点におけるアーカイブ。 .
- ^ a b Jakob, Niklas, et al. "Beyond the stars: exploiting free-text user reviews to improve the accuracy of movie recommendations." Proceedings of the 1st international CIKM workshop on Topic-sentiment analysis for mass opinion. ACM, 2009.
- ^ Minqing, Hu; Liu, Bing (2004). “Mining opinion features in customer reviews”. AAAI 4 (4). オリジナルの2018-05-24時点におけるアーカイブ。 .
- ^ Liu, Yang; Huang, Xiangji; An, Aijun; Yu, Xiaohui (2008). “Modeling and predicting the helpfulness of online reviews”. ICDM'08. Eighth IEEE international conference on Data mining. IEEE. pp. 443–452. doi:10.1109/ICDM.2008.94. ISBN 978-0-7695-3502-9
- ^ Bermingham, Adam; Smeaton, Alan F. (2010). Classifying sentiment in microblogs: is brevity an advantage?. 1833. doi:10.1145/1871437.1871741. ISBN 9781450300995
- ^ Lamba, Manika; Madhusudhan, Margam (2018). “Application of sentiment analysis in libraries to provide temporal information service: a case study on various facets of productivity”. Social Network Analysis and Mining 8 (1): 1–12. doi:10.1007/s13278-018-0541-y.