ワードクラウドとネットワーク分析でslackコミュニティの1年を振り返る

みなさんこんにちは、データラーニングギルド代表の村上です。

皆さんは、slackやteams、チャットワークといったチャットツールを使用した経験がありますでしょうか?

恐らく、この記事を読んで頂いているほとんどの方が何かしらのチャットツールを使用したことがあるのでは無いかと思います。

コロナの影響でリモートワークに移行してからチャットツールがコミュニケーションの補助的な位置づけから中心的なコミュニケーションの場となったという方もいらっしゃるのではないでしょうか?

リアルな職場環境であれば、誰かと誰かが話している所を目で見て、「あの人とあの人、よく会話しているな」といったことが無意識的に把握できていたかと思います。そのため、リモートワークになって、「誰が誰と話しているか分からない。」、「どんな話題が話されているか分からない。」という課題を感じている方もいらっしゃるのではないでしょうか?

そこで今回は、「データで振り返るデータラーニングギルドの1年」というテーマで実施した分析企画に関してご紹介しようと思います。

データラーニングギルドに関しては2019年7月にオープンしたデータ分析特化型のオンラインサロンで、本記事の執筆時点で168名の会員が在籍しています。コミュニケーションツールとして使用しているslackのデータを用いており、データをエクスポートすることができるため、そちらのデータを使用して分析を行っています。

slackのデータを用いて分析することで以下のような問に対する分析結果を得ることができ、組織内のコミュニケーションの補助的な役割を果たすことができます。

  • 単純集計・基礎分析で分かること
    • コミュニケーションは活発に行われているか?
    • 極端に発言数が少ない、多い人はどの程度いるか?
    • コンスタントにコミュニケーションを取っているか?
    • コミュニティが活発化する時間帯はいつか?
  • ワードクラウドで分かること
    • 各チャンネルごとにどのようなトピックが話題になっているのか?
    • 各ユーザーがどのような話題に興味を持っているのか?
    • 今月の特徴的なトピックは何だったのか?
  • ネットワーク分析で分かること
    • コミュニケーションの中心になっている人物は誰か?
    • 組織間を繋いでいるキーマンは誰か?
    • あまりコミュニケーションが取れていない人物は誰か?
    • 組織内のネットワークがどのような組織の構造になっているのか?

チャットツールのログ分析を実施することによって、上記のように人と人がどのように関わっているかを分析する事ができます。最近だとPeople AnalyticsやHR Techと言われる領域が出てきましたが、領域としてはそういった領域に分類されるのでは無いかと思います。

チャットデータの分析を実施することでどのような分析ができるのか、具体的な事例を元に解説をさせて頂きますので、活用イメージ、実装イメージを持って頂けるのでは無いかと思います。

今回の取組内容

まず、今回の企画が立ち上がった背景に関して簡単に説明したいと思います。

データラーニングギルドの取組で以下のような簡単なデータパイプラインを構築するような取組を以前実施しました。

そこで今度は「slackのデータに関するデータマート構築、ダッシュボード作成に取り組もう」という話になったのですが、「そもそもその前にどんな分析、可視化が可能なのか一旦分析してみた方が良いよね」という話になり今回の企画に至りました。

そこで、3名の分析者+ディレクションという体制で基礎分析、ワードクラウド、ネットワーク分析以下のトピックに関する分析の企画をスタートすることになりました。

営利企業ではなくコミュニティ内に発表するための内容となっているので、クイズ形式で面白おかしく振返りを実施したり、こんな形でデータ分析が可能だということを理解して貰うことにフォーカスを置いています。

類似の事例としてKaizen Platformさんが会社の1年を振り返る記事を公開されていましたので、こちらの記事を参考にしつつプロジェクトに取り組ませて頂きました。

それでは、それぞれの個別の発表内容に関して紹介していきたいと思います。

基礎分析

分析概要

まずは1年間の活動の全体感を把握するために、基礎分析を実施しました。発言数の推移や、ユーザー会員数の推移など、様々な指標に関して分析を行いました。

コミュニティの成長度合いや、どの時間帯に一番発言が多いのかなどの分析を実施しました。(案外オフィスアワーの発言が多いですねw)

代表の自分は、365日中360日以上発言をしていたようで、かなりアクティブに動いているということが分かり自分でもびっくりしましたw

また、データラーニングギルドでは様々なリアクション(メッセージに対して絵文字で反応できる機能)を登録しており、「神」といったリアクションや「感謝」といったリアクションから、「wwww」といったリアクションなど様々なバリエーションがあります。そのため、そのリアクションを集計するとその人の特徴が非常に良く現れるのではないかと思いリアクションを集計して表彰を行いました。

運営サイドの目線としては、積極的な参加者の方にお礼をする機会を作りたいという意図もありました。

何かしら活動を定量化して表彰するというのはコミュニティ運営をする上での参加者のモチベーションに繋がったりするので、単純に可視化をして把握をする以外の効果も期待できそうですね。

発表資料

ワードクラウドでトピックを可視化する

分析概要

こちらの分析では、「チャンネルごとにどんなトピックが会話されているんだろう?」、「この人ってどんなトピックに対して会話しているんだろう?という疑問を解決するための分析を行いました。

分析アプローチの概要に関して解説をすると、以下のようなアプローチで分析を行っています。

  • 特徴語を抽出する方法としてはtf-idfを用いる
  • ユーザー単位や月単位などの単位で「文書」として定義して特徴語を抽出

詳細な実装方法に関しては、以下のの記事に実装方法が書いてあるので、興味がある方は是非参照してみてください。

Qiita

本記事についてこの記事では、Slackコミュニティである一定期間(ここでは1週間)内にどんな話題で盛り上がったのかをWo…

こちらの発表ではクイズ形式でその月の特徴を当てるというイベントとして実施したのですが、4月に関してはコロナに関連する話題がトピックとして出てきていたり、その人独自のワードが出てきていたりとしっかりと特徴を捉えられていて面白かったです。

このように、ワードクラウドで可視化することで、チャンネルや月、ユーザーの特徴を一瞬で捉えることができるので、不特定多数のメンバーが相互に交流するようなコミュニティの自己紹介代わりにワードクラウドを見せるというのは案外効果的かもしれませんね。

発表資料

ネットワーク分析で人と人の関係性を可視化する

分析概要

オンラインサロンを代表とするオンラインコミュニティには代表的なパターンが何種類かあるのですが、ネットワークの形を考えると以下のように分類することが可能です。

コミュニティの形式よって、ネットワークの構造がかなり違っているのが見受けられるかと思います。コミュニティ運営をするに当たって、上記のどのパターンのコミュニティを目指すのか決めることは非常に重要になってきます。

ネットワーク分析をすることで、実際のネットワーク構造が上記のような構造になっているのか分析することが可能です。

ネットワークの構造を把握することによって、コミュニティに入り込めていない人や、ネットワークが断絶されてしまっている部分などを発見することができるので、「誰と誰を繋いだらより理想的なコミュニティになるのか?」ということを把握できます。

今回の分析結果を見ると、初期の段階ではほぼレッスン型の構造だったのが、徐々にコミュニティ型やプロジェクト型の構造に変化してきているのが分かり、順調にコミュニティ形成がされていっていることが分かりました。

発表資料

あなたもチャットデータを可視化して所属組織の分析に取り組んでみよう!

このように、実際にログを可視化して見てみると自分が想定してなかった人と人との関係が把握できたり、活動状況が分かったりします。

データラーニングギルドでは、こちらのプロジェクトの関連プロジェクトとして質問に対する回答ユーザーを検索したり、ダッシュボードを作ったり、ネットワーク分析をしたりという活動なども行っていますので、もしこちらの分析をやってみたいと思った方は是非ご参加ください!

データラーニングギルド

実践的なスキル習得に特化したデータサイエンティストのためのコミュニティ…