IT用語集

データマイニング(Data Mining)って何?

はじめに

日本では2014年以降から仮想通貨ブームで「マイニング」なんて言葉を耳にする機会も増えましたよね。
マイニングは「採掘」という意味の英単語で、仮想通貨では安全な取引を可能にする適切な値を探すことを言います。
では、IT業界でいう「データマイニング」とは一体どういう意味なのでしょうか。
早速みていきましょー!!✨

用語説明〜最速で理解したい人のためのIT用語集より抜粋〜

データマイニング(Data Mining)・・・膨大なデータから有益な情報を探す技術。

データマイニングの意味と具体例

データマイニングとは「ビックデータを解析し、何らかの規則性や有効な知見などを得ること」で、主にデジタルマーケティングの領域で使われる言葉です。
少し曖昧な言葉に聞こえますがザックリいうと「データを分析すること」です。
具体的にデータマイニングでできることは大きく分けて以下の4つです。
①近い将来の予想
蓄積されたビックデータから「特定の顧客層がどの条件でどの製品を購入する確率が高い」といった事を予想する事ができます。
予測ができる事で会社としても、高い見込みのある顧客に正しくアプローチする事ができます。
②データの分類
蓄積されたビックデータから「顧客の性年代、好み」などで分類する事ができます。
顧客をグループ化し、特定の製品を多く購入する顧客グループの特徴を把握する事で、製品のどこに力を入れれば良いかを知る事ができます。
③関連性を見つける
データの関連性とは例えば、”紙おむつはビールと購入される事が多い”など「思いもよらぬ関連性」を見つける事です。
ビールと紙おむつは有名な例で、日暮れに子どものオムツを買いに来た父親がついでにビールを購入したというストーリーを想像する事ができます。
このようなデータの関連性を見つけることは、商品の配置場所や新たな施策などを考えることにも繋がるのでとても大事ですよね。

データマイニングの難点

これまでデータマイニングの魅力について語ってきましたが、実際にデータマイニングをしようとすると非常に難しいです。
理由は大きく3つあります。
◾️データの質が高いとは言えない
アンケートを”本心”から答えているとは限らない。人の趣味趣向は時と場合で大きく変わる。
◾️ゴミデータの分類にかなり時間がかかる
ビックデータというだけあってデータの量は凄まじく、どの指標(Ex.性年代,購入商品)で何を分類するかの作業だけでも時間がかかる。
◾️データからどう解決策を導くかがわからない
トランザクションデータ(顧客の購入データなど)はあっても実際にどう活用するかは難しい。
データを正しく扱うということは想像以上に難易度が高いので、専門家に任せる企業が多いんですね。。

おわりに

データは大きく、「どのデータを収集するか決める」→「データを収集」→「データを整理」→「データを分析」→「施策」というフローになります。その中でも現状は「データを収集」は多くの人が実現を実感できていることでしょう。何かのサービスを使うにも性別や住所などの個人情報を登録します。クレジットカードやポイントカードなど日常的に購買データが企業に蓄積されています。ただ、そのデータを整理することに時間がかかり、ここで適当に整理すると、精度の低いデータから分析し、レベルの低い施策をうつことになってしまいます。精度の高いデータ整理をして、そこからデータを高いレベルで分析して初めて効果のある施策を打つのです。
ここまで聞けば近年のビックデータやAIのブームにも納得いただけるのではないでしょうか。フェーズは「収集」から「整理・分析」の段階です。そしてこの「整理・分析」をAIが高速・高精度で行い、人間がそのデータから施策をうとうというわけです。ただ、どんなに整理されたデータがでても、結局「このデータってどういう意味なの?」となっては意味がありませんし、AIから分析結果と施策のアドバイスがされても「なぜこうすべきなのか」説明が出来ないとどうしようもありません。そのための「データリテラシー」ってことみたいです。そしてその「データリテラシー」をもった人材を各企業が欲しているため、アメリカではデータサイエンティストの需要が高いようです。日本でも需要は急速に高まっているので、若い人はデータサイエンティストという選択肢を持っても良いかもしれませんね。
この記事を通して「データマイニング」に関する理解を深めていただければ幸いです。
最後まで目を通していただきありがとうございました🙇‍♂️

参照元

.https://ex-ture.com/
.https://www.albert2005.co.jp/knowledge/data_mining/data_mining_basics/about_data_mining
.https://udemy.benesse.co.jp/ai/datamining.html
.https://www.businessinsider.jp/post-162971
.http://e-words.jp/w/%E3%83%87%E3%83%BC%E3%82%BF%E3%83%9E%E3%82%A4%E3%83%8B%E3%83%B3%E3%82%B0.html
.https://www.innovation.co.jp/urumo/datamining/

ピックアップ記事

  1. 最速で理解したい人のためのIT用語集

関連記事

  1. IT用語集

    プロパティ(Property)って何?

    はじめにPC上で右クリックをすると現れるプロパティという項目。これ…

  2. IT用語集

    最速で理解したい人のためのIT用語集

    皆さんこんにちは!インターンの與那覇(よなは)です今回は数々のIT用…

  3. IT用語集

    オンラインストレージ(Online Storage)って何?

    はじめにオンラインストレージとは字面の通り「オンライン上のストレージ…

  4. IT用語集

    カプセル化(Encapsulation)って何?

    はじめにカプセル化って何だかあっさりした言葉ですよね。カプセル=”…

  5. IT用語集

    クラスタ(Cluster)・クラスタリング(Clustering)って何?

    はじめにクラスタって上級者がたまに会話で使ってますよね。お仕事で分…

  6. IT用語集

    API(Application Programming Interface)って何?

    はじめに今回はIT業界の基本単語である「API(エーピーアイ)」とい…

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

CAPTCHA


最近の記事

  1. モダンデータスタックなワークフローオーケストレーションツール…
  2. Streamlit in Snowflakeによるダッシュボ…
  3. Streamlit in SnowflakeによるStrea…
  4. Streamlitを使った簡単なデータアプリケーション作成ガ…
  5. 生成AI機能を活かしたデータカタログ製品「Secoda」を試…
  1. IT用語集

    プロパティ(Property)って何?
  2. IT用語集

    シンクライアント(Thin Client)って何?
  3. Adobe Analytics

    Adobe Analyticsに入り切らないデータをBigQueryに投入する
  4. Adobe Analytics

    Adobe Analytics:自動で分析してくれる貢献度分析(異常値検出)機能…
  5. IT用語集

    ビッグクエリ(Big Query)って何?
PAGE TOP