IT用語集

データマイニング(Data Mining)って何?

はじめに

日本では2014年以降から仮想通貨ブームで「マイニング」なんて言葉を耳にする機会も増えましたよね。
マイニングは「採掘」という意味の英単語で、仮想通貨では安全な取引を可能にする適切な値を探すことを言います。
では、IT業界でいう「データマイニング」とは一体どういう意味なのでしょうか。
早速みていきましょー!!✨

用語説明〜最速で理解したい人のためのIT用語集より抜粋〜

データマイニング(Data Mining)・・・膨大なデータから有益な情報を探す技術。

データマイニングの意味と具体例

データマイニングとは「ビックデータを解析し、何らかの規則性や有効な知見などを得ること」で、主にデジタルマーケティングの領域で使われる言葉です。
少し曖昧な言葉に聞こえますがザックリいうと「データを分析すること」です。
具体的にデータマイニングでできることは大きく分けて以下の4つです。
①近い将来の予想
蓄積されたビックデータから「特定の顧客層がどの条件でどの製品を購入する確率が高い」といった事を予想する事ができます。
予測ができる事で会社としても、高い見込みのある顧客に正しくアプローチする事ができます。
②データの分類
蓄積されたビックデータから「顧客の性年代、好み」などで分類する事ができます。
顧客をグループ化し、特定の製品を多く購入する顧客グループの特徴を把握する事で、製品のどこに力を入れれば良いかを知る事ができます。
③関連性を見つける
データの関連性とは例えば、”紙おむつはビールと購入される事が多い”など「思いもよらぬ関連性」を見つける事です。
ビールと紙おむつは有名な例で、日暮れに子どものオムツを買いに来た父親がついでにビールを購入したというストーリーを想像する事ができます。
このようなデータの関連性を見つけることは、商品の配置場所や新たな施策などを考えることにも繋がるのでとても大事ですよね。

データマイニングの難点

これまでデータマイニングの魅力について語ってきましたが、実際にデータマイニングをしようとすると非常に難しいです。
理由は大きく3つあります。
◾️データの質が高いとは言えない
アンケートを”本心”から答えているとは限らない。人の趣味趣向は時と場合で大きく変わる。
◾️ゴミデータの分類にかなり時間がかかる
ビックデータというだけあってデータの量は凄まじく、どの指標(Ex.性年代,購入商品)で何を分類するかの作業だけでも時間がかかる。
◾️データからどう解決策を導くかがわからない
トランザクションデータ(顧客の購入データなど)はあっても実際にどう活用するかは難しい。
データを正しく扱うということは想像以上に難易度が高いので、専門家に任せる企業が多いんですね。。

おわりに

データは大きく、「どのデータを収集するか決める」→「データを収集」→「データを整理」→「データを分析」→「施策」というフローになります。その中でも現状は「データを収集」は多くの人が実現を実感できていることでしょう。何かのサービスを使うにも性別や住所などの個人情報を登録します。クレジットカードやポイントカードなど日常的に購買データが企業に蓄積されています。ただ、そのデータを整理することに時間がかかり、ここで適当に整理すると、精度の低いデータから分析し、レベルの低い施策をうつことになってしまいます。精度の高いデータ整理をして、そこからデータを高いレベルで分析して初めて効果のある施策を打つのです。
ここまで聞けば近年のビックデータやAIのブームにも納得いただけるのではないでしょうか。フェーズは「収集」から「整理・分析」の段階です。そしてこの「整理・分析」をAIが高速・高精度で行い、人間がそのデータから施策をうとうというわけです。ただ、どんなに整理されたデータがでても、結局「このデータってどういう意味なの?」となっては意味がありませんし、AIから分析結果と施策のアドバイスがされても「なぜこうすべきなのか」説明が出来ないとどうしようもありません。そのための「データリテラシー」ってことみたいです。そしてその「データリテラシー」をもった人材を各企業が欲しているため、アメリカではデータサイエンティストの需要が高いようです。日本でも需要は急速に高まっているので、若い人はデータサイエンティストという選択肢を持っても良いかもしれませんね。
この記事を通して「データマイニング」に関する理解を深めていただければ幸いです。
最後まで目を通していただきありがとうございました🙇‍♂️

参照元

.https://ex-ture.com/
.https://www.albert2005.co.jp/knowledge/data_mining/data_mining_basics/about_data_mining
.https://udemy.benesse.co.jp/ai/datamining.html
.https://www.businessinsider.jp/post-162971
.http://e-words.jp/w/%E3%83%87%E3%83%BC%E3%82%BF%E3%83%9E%E3%82%A4%E3%83%8B%E3%83%B3%E3%82%B0.html
.https://www.innovation.co.jp/urumo/datamining/

ピックアップ記事

  1. 最速で理解したい人のためのIT用語集

関連記事

  1. IT用語集

    BIツール(Business Intelligence Tool)って何?

    はじめにBIツールって聞いたことあるようなないような〜って単語ですよ…

  2. IT用語集

    ゴー言語(Golang)って何?

    はじめに今回は言語別年収ランキングで一位を獲得した「Go言語」につい…

  3. IT用語集

    コンテナ(Container)って何?

    はじめにコンテナってたまーに耳にする単語ですよね。最近では、路上に…

  4. IT用語集

    オンデマンド(On Demand)って何?

    はじめにオンデマンド配信、オンデマンド授業。最近ではリモート環境で…

  5. IT用語集

    サブルーチン(Sub Routine)・メインルーチン(Main Routine)って何?

    はじめにルーチンってなんか響きが嫌ですよね、、ルーチンとは、ルーテ…

  6. IT用語集

    ネスト(Nest)って何?

    はじめにネストって中々馴染みのない単語ですよね。ネストは「巣」とい…

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

CAPTCHA


最近の記事

  1. 回帰分析はかく語りき Part3 ロジスティック回帰
  2. GCSへのSnowflake Open Catalogによる…
  3. VPC Service Controlsで「NO_MATCH…
  4. モダンデータスタックなワークフローオーケストレーションツール…
  5. Streamlit in Snowflakeによるダッシュボ…
  1. Snowflake

    Snowflakeとは?Data Cloud World Tour から見る20…
  2. Adobe Summit

    Adobe Summit 2020レポート: Data & Insig…
  3. Adobe Experience Cloud

    Adobe Experience Platformを調べてみた – …
  4. ブログ

    データ視覚化ツール「Power BI」
  5. Google Analytics

    【UA完全終了】GA4移行作業は完了しましたか?2023 年 7 月にユニバーサ…
PAGE TOP