imgimg
imgimg

お仕事詳細

TOP>お仕事一覧>【CIU】ソフトウェアエンジニア(機械学習基盤)

【CIU】ソフトウェアエンジニア(機械学習基盤)

求人番号:itgr000-005319

サイバーエージェント|機械学習基盤 ML Platformの開発・運用を行い、社内のAI系技術者やプロダクトの開発効率化・速度向上・コスト削減を支援
  • 正社員
【CIU】ソフトウェアエンジニア(機械学習基盤)
仕事内容
■部署紹介CIU(CyberAgent group Infrastructure Unit)は、 サイバーエージェントグループ全体のインフラを支える組織 です。Cycloud というブランドでプライベートクラウドを展開しており、OpenStack (IaaS)、AKE (KaaS)、ML Platform (機械学習基盤) など様々なサービスを提供しています。■業務内容機械学習基盤 ML Platformの開発・運用を行い、社内のAI系技術者やプロダクトの開発効率化・速度向上・コスト削減を支援しています。?ML PlatformではGPUインスタンスの払い出し、機械学習ジョブの実行、機械学習モデルのデプロイといった機能を提供しています。今後はこれらの他にもMLOpsを推進するための機能を開発していく予定です。またこれらのサービスは基本的にKubernetes上のアプリケーションとして作られており、基礎的な機械学習の知識に加えてKubernetesに対する深い知識も必要になります。?サイバーエージェントは技術選定が自由であるため、ユーザーとなる社内プロダクトがパブリッククラウドを使うかCycloudを使うかは自由です。その中でCycloudのML Platformを選択してもらうために、ユーザーの求めるUXや機能を備えたサービスを作るのが我々のミッションです。?|具体的な仕事内容|1. 大規模な GPU Kubernetes クラスタの開発、運用- 物理 GPU ノードのセットアップ(OS インストールやパラメーターチューニング)- Kubernetes クラスタの構築・運用- 定期的な Kubernetes クラスタのバージョンアップデート- Kubernetes の最新バージョンに対するキャッチアップ- 大規模計算クラスタのための技術検証・導入(NVIDIA H100 RoCEv2/RDMA NCCL など)?2. AI 系の開発を支援する機械学習サービスの開発、運用- GPU インスタンスや Jupyter Notebook を払い出すサービスの開発- 各種機械学習フレームワークを用いたジョブシステムの開発(Pytorch/Tensorflow/etc.)- 機械学習モデルのサーバーレスデプロイシステムの開発- 機械学習のためのノード間分散ジョブシステムの開発(MPI)- Kubernetes カスタムコントローラー(Go)の開発- Kubeflow などの機械学習系エコシステムの検証・導入・コントリビュート?3. ML Platform の規模拡大- 新規・既存社内ユーザーとの積極的なコミュニケーションや折衝- ユーザーサポート(Python の学習スクリプトの調査など)- AI 系技術や最新 GPU に対するキャッチアップ- GPU リソースの需要調査や増設に向けた選定・導入■求める人物像- ソフトウェアからインフラまで幅広く興味があるエンジニアの方- 向上心が高く、新しい技術の習得に対して抵抗がない方- 良好なコミュニケーション能力により、チーム内や他部署と調整可能な方- サービス、ユーザー中心で物事を考えられる方- クラウドネイティブ技術に親和性のある方- OSS のアップストリームを追従・貢献する気持ちのある方
雇用形態
正社員
応募資格
Python Go React AWS TensorFlow Kubernetes Jupyter GCP
週に1回以上のリモート リモート勤務の相談可 急募求人 転勤なし 学歴不問 服装自由
給与
【想定年収(概算)】500万円~1000万円
福利厚生/諸手当
【保険】健康保険(関東ITソフトウェア健康保険組合加入)、雇用保険、労災保険、厚生年金保険【諸手当】通勤交通費、家賃補助*(2駅ルール|どこでもルール)*勤務しているオフィスの最寄駅から各線2駅圏内に住んでいる正社員に対し月3万円、5年以上勤続している正社員に対してはどこに住んでいても月5万円の家賃補助を支給します。【制度】従業員持株会、社内融資制度、家賃補助制度、社内カウンセリング制度、慶弔見舞金制度、社内親睦会費補助制度など
勤務時間
■勤務時間
詳細はお問い合わせください。
※プロジェクト内容、常駐先、リモートワーク等による。
休日/休暇
■週休2日制(土曜・日曜)、祝日■夏期休暇(7月1日~11月30日までの期間に3日間)、年末年始休暇(12月29日~1月3日) 年次有給休暇(初年度10日間)、慶弔休暇、リフレッシュ休暇 など
勤務地
【勤務地詳細】■東京都渋谷区宇田川町40番1号 Abema Towers
最寄り駅/アクセス
■渋谷駅 徒歩10?15分
法人名
株式会社サイバーエージェント