Kaggleコンペ「Shopee – Price Match Guarantee」で楽天・Yodaさんが6位入賞!

f:id:R-Hack:20210727161454j:plain

皆さん、こんにちは。R-Hack編集室です。

東南アジアのEC大手「Shopee」が5月に開催したKaggleコンペティション「Shopee - Price Match Guarantee」にて当社コマースカンパニービジネスサポート開発部ECビジネスエンパワーメント課ビジネスコミュニケーションプラットフォームグループのYodaさんチームが6位入賞し、上位14位までの対象者が得られるゴールドメダルを獲得されました。 
ECサイトの中には小売事業者が販売する価格を比較し、より優位な条件で提供するための「商品マッチング」を実施することがあります。このマッチングの実現には機械学習のアプローチが重要で、今回、コンペティションで競われたテーマもこれでした。類似する商品は見かけが同じ場合もあれば、全く異なる場合もあります。これらをディープラーニングを用い、画像とテキストの組み合わせを分析して類似性を比較しています。 
応用範囲も広く、商品マッチングに貢献するスキルを手にすれば、より正確な商品分類情報の提供や、マーケットに潜むスパムの発見などに役立ちます。 
ということで、Kaggleコンペティションにて見事入賞されたコマースカンパニーのYodaさんに編集室からお話を伺いました。 

――Kaggleコンペティション「Shopee - Price Match Guarantee」に参加されて入賞されたということですが、このコンペティションはどのような内容の競技だったのですか? 

Yoda:はい、このコンペでは東南アジア最大級のECサイト「Shopee」の商品の画像とタイトルのデータが与えられ、同一商品を抽出してその精度を競う、というものでした。我々は他の多くのコンペ参加者も用いていたディープラーニングと距離学習の手法を用いてタスクを解き、入賞することができました。 

――コンペの特徴や難しかった部分は  

Yoda :コンペはKaggleの「ノートブック提出形式」が採用されていて、マシンのスペックや推論時間に制限があるという特徴があったんです。また、教師データにラベルノイズ(同一商品でも違うラベルがつけられたりする)があり、より実務で出会うタスクに近い条件でのコンペでした。 

f:id:R-Hack:20210727161600j:plain

――参加するまでに準備したことは 

Yoda :技術的な面では、コンペ前までディープラーニングの簡単なモデルを構築したことはあったのですが、今回のコンペのように画像とテキストを組み合わせた複雑なモデルを構築したことがなかったので、KaggleのDiscussionやNotebookをとにかく読んだり、論文を読み漁るなどして実験を行いました。 

――おお、なるほど初挑戦の部分があったんですね 

f:id:R-Hack:20210727161622j:plain

Yoda :精神的な面では、「とにかくGPUを止めてはいけない」という強迫観念のようなものがあって、実験を回している間にサーベイと実装をして、実験が終わったらすぐ次の実験を回すというようなことをしていたので、コンペ期間の約2カ月間はコンペのこと以外はほとんど考えられませんでした。 

――頭がいっぱいという。そんな中、受賞につながった(うまくいった)ポイントは何でしょうか? 

Yoda :過去の類似コンペの解法が豊富にあったのがとても良かったと思います。コードも公開されていたりしたのでとても参考になりました。 また今回、コンペ途中でチームマージをさせていただいたのですが、個人でやっていたときよりも楽しさも学びも格段に増しました。チームを組んでくださった皆様には感謝しています。 

――事前準備含めてこういったコンペはチーム戦ですね。コンペに参加しての感想、また今後に生かせること、楽天に参加したい方々へのメッセージがあればお聞かせください 

Yoda :今回のコンペではディープラーニングについての理解を深めることができ、また最終的に金メダルを獲得できたので、自分の中で大きな自信になりました。 また、ECドメインのコンペでタスクも名寄せだったこともあり、普段の楽天での業務にも直接的に活かせる知識を沢山得ることができたので、今後積極的に活かしていきたいです。  
そして何よりも、Kaggleをやっている期間は単純にとても楽しかったです。今後もKaggleのコンペに参加し続けていきたいです。 

――ありがとうございました! 

R-Hack編集室では引き続き、楽天コマーステックで活躍するメンバーの話題をお届けします!