「チームAITCでのKaggle初挑戦」 新人データサイエンティストが感じたこと

はじめに

こんにちは、AITC コンサルティングHグループの松清です。 私は2023年4月に電通総研へ新卒入社し、2023年10月からAITCのデータサイエンティストとして働いています。

AITCは現在4つのグループに分かれており、私が所属しているコンサルティングHグループでは、主にAI人材育成サービスを提供しております。

私は以前からKaggleなどの機械学習コンペに関心があり、コンペに参加してデータ分析のスキルを伸ばしたいと考えていました。 そんな中、業務の一環としてAITCの先輩とともにKaggleのコンペに参加する機会をいただき、

「これを機に、Kagglerの先輩たちからデータ分析のスキルを学ぶしかない!」

と思い、チームAITCとしてKaggleに初参加してみました。

AITCのKaggleへの取り組み

我々AITCがKaggleに取り組む理由としては、以下のようなものが挙げられます。

  • AITC間のコミュニケーションを活性化する
  • AIやデータサイエンスの技術分野においてスキルアップする
  • Kaggleで優秀な成績を収め、コラム記事の執筆などを通して価値のある情報を発信する

配属から半年ほどの新人データサイエンティストの私にとって、AIやデータサイエンスに関するスキルアップを業務の一部を使って実施できる環境は、とてもありがたいです。

AITCでKaggleに取り組む理由や目的については、AIソリューショングループに所属しているKaggle Masterの阿田木さんがこちらの記事にまとめられているので、ぜひご覧ください。 aitc.dentsusoken.com

現在参加中のコンペ

現在、チームAITCで参加しているコンペはHome Credit - Credit Risk Model Stability | Kaggleです。こちらのコンペは、顧客がローンを滞納する可能性を予測するコンペとなっております。単純にテストデータの予測精度で評価されるのではなく、長期間安定した予測ができるのかといことが問われるコンペとなっております。また、複数の表形式データを扱うテーマなので、表形式の最新モデルや前処理等の分析テクニックが要求されます。

私のようなKaggle初心者でも比較的取り組みやすいコンペということもあり、今回こちらのコンペに参加することとなりました。

Kaggle参加メンバー

今回のHome Credit - Credit Risk Model Stability | Kaggleには、AITCメンバー4名で参加しています。 参加者はKaggle Expertの久木宮さん、Kaggle Masterの阿田木さん、Kaggle初参加の鴨谷さんと私の4名です。Kaggle ExpertとKaggle Masterが同じチームにいるというのは、Kaggle初心者としてはとても心強いです。

久木宮さん、阿田木さんは過去に参加したKaggleに関するコラムを書かれているので、興味のある方はぜひご覧ください。

久木宮さんコラム aitc.dentsusoken.com

阿田木さんコラム aitc.dentsusoken.com

どのように進めているのか

チームでKaggleに取り組む場合、様々な課題があるかと思います。チームAITCではタスク管理や情報共有を以下の方法で実施しています。

週一回の定例会

週に一度、一時間の定例会を開催しており、その際に勉強会の実施や活動計画の策定を行っています。勉強会では、submitの方法から、データ分析のライブラリ、さまざまなKaggleテクニックに至るまでKagglerの先輩に共有していただき、その内容を勉強しています。

Kaggleでは、他の参加者が共有しているコードからテクニックを学ぶことができると思いますが、初心者にとってはコードの内容をすべて理解するのに少し時間がかかります。なので、コードについてKagglerの先輩に解説してもらえる勉強会は、とても有意義な時間です。

Azure DevOpsでの進捗管理・作業分担

タスク管理にはAzure DevOpsを使用しています。週一回の定例会議で整理したタスクについて各自取り組み、作業を進めていきます。 実施中のタスクやToDoのタスクが可視化されるので、作業を効率的に進めることができます。

Microsoft Teamsでの情報共有

分析を通して、試してみたことや気づいたことなどは、Microsoft Teamsでつぶやく形で各自情報共有しています。このような情報をTeams上で共有することにより、他のメンバーが既に試みた方法を重複しないようにしています。

初参加して感じたこと

私は今回初参加ということもあり、まだまだ分からないことばかりですが、経験豊富なKagglerの先輩とともにコンペに参加できる環境はとても刺激的でおもしろいです。特に先輩たちがどのようなアプローチでモデルの精度を高めているのかなどについて、直接学べるのは非常に良い機会だなと感じています。

また、こうした取り組みは、AI・データ分析のスキルアップやドメイン知識獲得に非常に効果的であり、今後のデータサイエンティストの業務に活きてくるのだろうと感じています。コンペ終了まであまり長くはありませんが、これからもたくさん学びたいと考えています。

おわりに

本記事では、チームAITCが現在参加中のコンペHome Credit - Credit Risk Model Stability | Kaggleに関して、取り組み方や、Kaggle初参加の私が感じたことなどをまとめました。

コンペ終了後に、振り返り記事を掲載する予定ですので、ぜひお楽しみに!

また、AITCでは共に働いてくださるメンバーを募集しています。本記事を読んで、AITCの活動に興味を持っていただけますと幸いです。

下記のページにAITCでの働き方や募集職種、組織などの採用に関わる情報をまとめています。 カジュアル面談の応募フォームもこちらのページにリンクがありますのでぜひご覧ください。 aitc.dentsusoken.com


執筆
AITC AIコンサルティングHグループ
松清 綾大