分散深層学習環境『Azure Batch AI』の概要解説と実行手順(Portal)

こんにちは。
コンサルティング & テクノロジー部の上坂です。

この記事はネクストスケープ クラウド事業本部のAdventCalenderの24日目です。

DeepLearningやっていると、学習にとても時間がかかってしまって気軽にTry&Errorできないのが辛い所ですよね。GPUのパワーに頼るにしてもオンプレでは限界があるし、クラウド上のIaaSでDeepLearning環境を作るとしても、ハイパワーなIaaS1台で学習させるなら特に難しいことはありませんが、複数台でクラスタ構成組むとなるとそれだけで一苦労です。

2017年5月10日、MicrosoftのBuildというイベントでAzure Batch AI Trainingというサービスが発表されました。このサービスはAzure Batch、という名前から推測できる通り、Azure上でクラスタ環境を組んでくれるものです。これを使って、学習スピードを大幅に短くすることができるかもしれません。現在は名称がAzure Batch AI Service、もしくはAzure Batch AI、となったようです。

Azure Batch AI


このAzure Batch AI、まだPreviewではありますが、きっとGA後はDeepLearningをAzureで実行する時に最も使用頻度が高いリソースになるでしょう。 今日はこの Azure Batch AIについて調べた内容と、実験した結果を書いてみたいと思います。

公式ページのドキュメントではAzure CLI2とPythonによる構築・実行の方法しか説明がありませんが、Azure Portalでも構成・実行は可能です。公式ページに先駆けて、Azure Portalで構成・実行してみましょう。

Read More

最も速く簡単にChainerの環境を構築する方法(Azure Machine Learning)

こんにちは。

コンサルティング&テクノロジー部の上坂です。

みなさんDeep Learningしてますか?Deep LearningはTensorFlowやKerasや、Chainer、CNTKなどがありますが、さぁやってみようと思うとまず環境作るところから始めなければならないのは面倒ですね。

今回ご紹介するのは恐らく?最も速くChainerの実行環境を作成する方法です。

Chainer Banner

ローカルのマシンには何もインストールする必要はありません。

Read More

CNTKの環境をAzureVMでゼロから構築する

こんにちは。
ネクストスケープ上坂です。

今日はMicrosoft Congnitive Toolkit、略してCNTKの環境をAzureVMで構築してみたいと思います。
CNTKはMicrosoftが提供しているオープンソースのDeep Learningモデル構築&実行環境です。

CNTK Image

御存知の通りAzureにはNシリーズというGPU付きのVMがありますので、そちらを使ってGPUで稼働するCNTKをゼロから作っていきます。

ちなみに、Azureには既にCNTKをインストール済みのイメージもありますが、なぜかうまくデプロイできなかったのでゼロから構築してみました。

Read More

Azure Machine Learning Sample Bug

こんにちは、上坂です。
そういえばなぜかAzure Machine Learningについてまったく記事を書いていなかったのでぼちぼち書いていこうと思います。

2015年3月にAzure Machine Learningはトレーニングしたモデルを別のデータを使って再トレーニングできるAPIを公開しました。
公式の説明はこちらです。

プログラムによる Machine Learning のモデルの再トレーニング

このドキュメントに従って設定していけば、再トレーニングまでのバッチ処理の流れは理解できると思います。手順7にて、追加のエンドポイントに公開されるトレーニング済みモデル更新用のAPIを叩くところの解説があるのですが、ドキュメントではここでいきなりC#のコードの画像(!)が出てきます。

C#コード画像 

このC#コードの画像から写経して実装するのは勝手が悪いので、ほとんどの方は管理ポータルで追加したエンドポイントを開くと表示される、「リソースの更新」というリンクをクリックして、そこに記載されたサンプルコードを利用されているかと思います。


リソースの更新

でも、このサンプルコード、一か所間違えているんです。

Read More

「クラウドを活用した機械学習の実践(AzureML等)」セミナー参加レポート

こんにちは。

先日、Microsoftが主催する「クラウドを活用した機械学習の実践」セミナーに参加してきました。

機械学習は注目すべき技術であり、タイミングよく今回のセミナーに参加できたのでレポートします。
この記事では、「IoTの時代」「スケーラビリティと信頼性(Azure Event Hubs)」「自動検知・判定・学習 (Azure Stream Analytics/Azure Machine Learning)」の3つについて紹介します。

Read More

検索する

タグ

メタデータ

投稿のRSS