【CIU】ソフトウェアエンジニア(機械学習基盤)
求人番号:itgr000-005319
サイバーエージェント|機械学習基盤 ML Platformの開発・運用を行い、社内のAI系技術者やプロダクトの開発効率化・速度向上・コスト削減を支援
- 正社員

- 仕事内容
- ■部署紹介CIU(CyberAgent group Infrastructure Unit)は、 サイバーエージェントグループ全体のインフラを支える組織 です。Cycloud というブランドでプライベートクラウドを展開しており、OpenStack (IaaS)、AKE (KaaS)、ML Platform (機械学習基盤) など様々なサービスを提供しています。■業務内容機械学習基盤 ML Platformの開発・運用を行い、社内のAI系技術者やプロダクトの開発効率化・速度向上・コスト削減を支援しています。?ML PlatformではGPUインスタンスの払い出し、機械学習ジョブの実行、機械学習モデルのデプロイといった機能を提供しています。今後はこれらの他にもMLOpsを推進するための機能を開発していく予定です。またこれらのサービスは基本的にKubernetes上のアプリケーションとして作られており、基礎的な機械学習の知識に加えてKubernetesに対する深い知識も必要になります。?サイバーエージェントは技術選定が自由であるため、ユーザーとなる社内プロダクトがパブリッククラウドを使うかCycloudを使うかは自由です。その中でCycloudのML Platformを選択してもらうために、ユーザーの求めるUXや機能を備えたサービスを作るのが我々のミッションです。?|具体的な仕事内容|1. 大規模な GPU Kubernetes クラスタの開発、運用- 物理 GPU ノードのセットアップ(OS インストールやパラメーターチューニング)- Kubernetes クラスタの構築・運用- 定期的な Kubernetes クラスタのバージョンアップデート- Kubernetes の最新バージョンに対するキャッチアップ- 大規模計算クラスタのための技術検証・導入(NVIDIA H100 RoCEv2/RDMA NCCL など)?2. AI 系の開発を支援する機械学習サービスの開発、運用- GPU インスタンスや Jupyter Notebook を払い出すサービスの開発- 各種機械学習フレームワークを用いたジョブシステムの開発(Pytorch/Tensorflow/etc.)- 機械学習モデルのサーバーレスデプロイシステムの開発- 機械学習のためのノード間分散ジョブシステムの開発(MPI)- Kubernetes カスタムコントローラー(Go)の開発- Kubeflow などの機械学習系エコシステムの検証・導入・コントリビュート?3. ML Platform の規模拡大- 新規・既存社内ユーザーとの積極的なコミュニケーションや折衝- ユーザーサポート(Python の学習スクリプトの調査など)- AI 系技術や最新 GPU に対するキャッチアップ- GPU リソースの需要調査や増設に向けた選定・導入■求める人物像- ソフトウェアからインフラまで幅広く興味があるエンジニアの方- 向上心が高く、新しい技術の習得に対して抵抗がない方- 良好なコミュニケーション能力により、チーム内や他部署と調整可能な方- サービス、ユーザー中心で物事を考えられる方- クラウドネイティブ技術に親和性のある方- OSS のアップストリームを追従・貢献する気持ちのある方
- 雇用形態
- 正社員
- 応募資格
- Python Go React AWS TensorFlow Kubernetes Jupyter GCP
週に1回以上のリモート リモート勤務の相談可 急募求人 転勤なし 学歴不問 服装自由 - 給与
- 【想定年収(概算)】500万円~1000万円
- 福利厚生/諸手当
- 【保険】健康保険(関東ITソフトウェア健康保険組合加入)、雇用保険、労災保険、厚生年金保険【諸手当】通勤交通費、家賃補助*(2駅ルール|どこでもルール)*勤務しているオフィスの最寄駅から各線2駅圏内に住んでいる正社員に対し月3万円、5年以上勤続している正社員に対してはどこに住んでいても月5万円の家賃補助を支給します。【制度】従業員持株会、社内融資制度、家賃補助制度、社内カウンセリング制度、慶弔見舞金制度、社内親睦会費補助制度など
- 勤務時間
- ■勤務時間
詳細はお問い合わせください。
※プロジェクト内容、常駐先、リモートワーク等による。 - 休日/休暇
- ■週休2日制(土曜・日曜)、祝日■夏期休暇(7月1日~11月30日までの期間に3日間)、年末年始休暇(12月29日~1月3日) 年次有給休暇(初年度10日間)、慶弔休暇、リフレッシュ休暇 など
- 勤務地
- 【勤務地詳細】■東京都渋谷区宇田川町40番1号 Abema Towers
- 最寄り駅/アクセス
- ■渋谷駅 徒歩10?15分
- 法人名
- 株式会社サイバーエージェント