SageMakerで分析・学習・推論のために作成した.ipynbファイルなどのバージョン管理やチームメンバへの共有を行いたい、ということが日々あります。
今回はSageMakerとGitHubを連携させる方法について紹介します。スクリーンショットたくさんです。
GitHubでリポジトリ作成
まずGitHubでリポジトリを作成します。ここではPrivateにしてます。
ノートブックインスタンスの作成
AWSコンソールからSageMakerノートブックを作成していきます。
設定項目の中のGitリポジトリにて、新たにリポジトリを追加します。
GiHub -> リポジトリのURL -> 認証情報をそれぞれ設定していきます。
- GitHubの認証情報はAWS Secret Managerによって管理されます
シークレットが作成できたらリポジトリの追加を選択します。
ノートブックインスタンス作成画面に戻り、リポジトリの更新ボタンを押すと、先程追加したリポジトリが選べます。
.ipynbファイルのpush
Jupyter Labで開くとリポジトリがクローンされたディレクトリができていますので、そのディレクトリ内でtest.ipynbファイルを作成します。
左のメニューからGitを選択すると、Gitの操作画面が現れます。
新規作成したtest.ipynbをtrackに追加することでstagedにして、コミットコメントを書いてチェックボタンでコミットします。
最初のコミットではNameとEmailが求められますので適当に入力してOKします。.gitconfigの新規作成と同じですね。
あとはメニューの雲ボタンでpushされ、GitHubにファイルが追加されます。
もちろんGitHub上で.ipynbファイルを閲覧できます。
まとめ
SageMakerのファイルをGitHubで管理する方法について紹介しました。
アドホックに変更されることが多い.ipynbファイルなどを健全な状態に保つために、GitHubは役立つかと思います。