Machine Learning Casual Talks #8に行ってきました(ブログ枠)
Machine Learning Casual Talks #8に行ってきました。
初メルカリ社です。会場はこんな感じ。
出た。イケてるtech企業あるある。押し放題の自販機。
エムスリー社からのノベルティー。TypeC to USBアダプタ、ありがとうございます。
便利なノベルティおきました! #mlct pic.twitter.com/J1JyWfhd1W
— nishiba (@m_nishiba) January 28, 2019
ここから本編です。資料概要だけ書きますので、気になったものは資料を直接ご覧になってください。
youtubeライブがありました。
冒頭:machine learning casual talksを始めた理由の簡単な説明
-「MLCTに初めて参加した方ーー?」
- (半分以上が挙手)- MLCTのターゲット - 基本的に知識はあるでしょ?という前提で好きなことを話しても良い!
-論文にはあまりでない実務で得た知見を共有するために、開催した。
-MLCTでは、モデルのアルゴリズムより、周辺のエコシステムやキャリアパス等々についての話題が多いよ。
発表1
更新しました! #mlct 聞きたいこと・質問があればメンションください。https://t.co/gikq31pQv2
— nishiba (@m_nishiba) January 28, 2019
-エムスリー社の開発チームについて
-機械学習チームとして開発したアルゴリズムのOSS化を検討している。
- 公開できるレベルのアルゴリズムを作る、作りたい人を集めるため。
- 機械学習チームは、プロダクトまで作れるように機械学習エンジニアだけにはしていない。
- 成功確率が高そうな機械学習プロジェクト
- サービス自体は成功している。
- ABテストができる体制がある
- 期待収益の計算ができる
- 予測したい数字が限定的なこと
- 既存の成功例を真似る
- プロジェクトの中止の基準を決める重要性
-MLエンジニアのキャリアについて
- 勤め先の昇給の仕組みや水準を理解する
- 目安だけでも上の人に聞きましょう。
-出世したいなら上司を出世させましょう。
-ビジネス貢献、組織貢献、技術貢献の3軸で考えよう。
-DMくれたらいつでもカジュアル面談できるので、いつでもどうぞとのこと。
-来週新しくMLエンジニアが増えるらしい。
発表2
本日の発表資料です https://t.co/MXb1iPBl9p #MLCT
— NSK (@naohachi89) January 28, 2019
-B to Bプロダクトを開発する中で遭遇した課題と解決策について
- bedoreにおける機械学習エンジニアの立ち位置について
- ソフトウェアエンジニア、アルゴリズムエンジニアの2種類が存在
-対話エージェント開発について
- 初期想定FAQでは対応できない言語に対して、クライアントがダッシュボードから学習のリクエストができる。
- モデルの予測性能がある日突然急激に低下した事件について。
- 訓練データセットのスナップショットを保存してなかった。
- 保存するようにして、学習を再現できるようにした等々。
- 正解率や訓練データ数、クラス数を学習ごとに保存するようにした等々。
- 人募集してます!
LT1
今日のLTの資料です! https://t.co/G73xBTaAgy #mlct
— OEC Ryosuke OISHI (@roishi2j2) January 28, 2019
- bfloat16という型について。
- tensolflowの中で定義されている型
- 比較対象がなんかよくわからんが、ハード的に高速化できるらしい。
LT2
-chainerrl-visualizerについて
-強化学習の辛いところについて。
LT3
@hurutoriya @upura0 @watarumon 昨日はありがとうございましたー!LT資料ですどうぞ #MLCT https://t.co/7SbPTPn9Vh
— ばんくし (@vaaaaanquish) January 29, 2019
-yahoo kukaiの話
-e-commerceの違反検知の課題
-来週から新しい職場でMLエンジニアとして転職するらしい。
以下パネルディスカッションです。
網羅性は60%くらいだと思います。
西場さんに質問です。AIチームの目標が売上○億円にするのめっちゃ良いですが、売上の定義ってどうしてますか?レコメンドを導入したとして、そのレコメンドからのコンバージョンは100%AIチームの売上になるんでしょうか?
- KPIはダブルカウントしてもとりあえずおっけーとしている。改善幅というところは、機械学習チームの成果としている。(@m_nishiba)
マルチクラスだときついのでは?
-分類数×客数でモデルを生成するよりは、マルチモデルの方が良かった。(@naohachi89)
特徴量を自分で作ってロジスティック回帰を使う、NNのモデルを使う、アンサンブルをするなどで、精度と複雑さや時間とのトレードオフがあると思いますが、この辺実務ではどのように対応されていますか?
-あまり意識していないが、プロダクトになる上で、計算時間だけは意識している。ただ、医療の画像診断に関しては時間がかかっても良い領域で、少し特殊かもしれない。(@m_nishiba)
-学習時間はコストに跳ね返るかつ、chatbotに5秒かかるのはしんどい。様々な要素から総合的にバランスの良いモデルを採用している。(@naohachi89)
サービスのインフラはどれを選びますか
-基本was or gcp。良い方を選んでいる。オンプレは考えていない。(@m_nishiba)
-基本aws。別のチームだとgcpも使っている様。(@naohachi89)
-メルカリだと両方だが、そろそろオンプレの方が安いのでは?という領域に来ている(@hurutoriya)
医療とITでビジネスインパクトが一番大きいのはカルテの共有と診断の(やや)自動化とのことかと思います。M3ではクラウドカルテのサービスがあるようですが、どれだけ使われていて、分析がなされているのでしょうか?
-それは分析したいが、色々リソースが足りていない部分もある。フリーテキストなのでとてもきつかった。(@m_nishiba)
運用の際、モデルの精度の許容範囲はどのように決めていますか?
-サービスオーナー/プロダクトオーナーが決めている。文化としてはある程度悪くても受け入れられてもらえるがきちんとABテストを突破した上で、サービスオーナーが決める(@m_nishiba)
自分の会社でも利益を目標にしているのですが、機械学習やディープラーニング以外を使っていなくても自チームの調査で課題を見つけて他のソリューションで解決した場合も実績に加算していますか?
-機械学習チームの評価には入らないが、360度評価では多少入る(@m_nishiba)
-機械学習使わなくても十分な予測性能が出せるのであれば、それはそれで良いのでは。(@naohachi89)
-機械学習じゃなくても、画像処理でも解決できる様なものを提案することはある。評価に入る時もあればそうでない時も。(@hurutoriya)
採用活動に関連して,ML関連の技術を持っている人材は不足していると言われていますが,未経験or経験が浅い人材でも採用して自社で鍛える上げることもありますか?
-エムスリーに入社した時は、機械学習未経験でした。数値計算分野などでの実績があれば、採用する可能性はあるが勉強は頑張って。(@m_nishiba)
-全くの未経験という事例はないが、学習経験や光るものがあれば取ることはある。何かしらのkaggle等の実績は持っていてほしいなと思っている。(@naohachi89)
すべてのMLフレームワークに精通していますか?
-してないです。(@m_nishiba)
-してないです。(@naohachi89)
MLは大きいところを狙いたいので老舗大企業と組みたい vs 老舗大企業は組織間の壁が厚く辛い のジレンマに陥ることってありますか(私は陥っています)
-あまり感じない。例えばLINEヘルスケアではいいとこ取りができてると思っている。(@m_nishiba)
-企業によるとしか言えない。(@naohachi89)
ばんくしさんへ、スマホで機械学習の状態を監視や操作をするために使った技術を知りたいです!
-ほぼ自作した。(突然の@vaaaaanquish)
スポンサーはメルカリです。お寿司が出ました。名前だけでも覚えて帰ってねとのこと。
誤記/誤解釈があればtwitterまで指摘お願いします!