SlerのエンジニアがSRE NEXT2020に行ってきた
twitterで「ブログ書くまでが~」と書いていて、実際に#srenextで調べたところ、かなり書いている方が多かったので私も書くことにしました。
きっかけ
Slerに所属しているとあるあるだが、定型作業が自動化されていませんでした。
AWSリソースも昨年まではAWSコンソール上から作成することが多かったので
自動化やインフラのコード化などに興味があった。
たまたまSREで初のカンファレンスがあると知ったので参加しました。
聞いたセッション
- 分散アプリケーションの信頼性観測技術に関する研究
- 40000 コンテナを動かす SRE チームに至るまでの道
- パフォーマンスを最大化するための SRE のオンボーディング事例
- Practices for Making Alerts Actionable
- 冗長性と生産性を高めるハイブリッドクラウド環境の実現
- スクラムを1年回してSREと開発組織がどう変わったのか
- ZOZO MLOps のチームリーディングとSRE(Engineering)
- Webサービスを1日10回デプロイするための取り組み
分散アプリケーションの信頼性観測技術に関する研究
- 自動化すると作業不可は減るが、認知不可は高まる。
- 認知不可に耐えるには高度な訓練が必要
- SREとは「サイト信頼性を制御するための工学」