ソニーの「ハードウェア×クラウド」から生まれる世界 ──クラウド活用事例と開発チームの取り組みを大公開
アーカイブ動画
登壇者プロフィール
佐藤 瞬氏
ソニー株式会社
ホームエンタテインメント&サウンドプロダクツ事業本部
2016年にソニー株式会社に入社。2011年よりSIerとしてキャリアをスタートし、AWS専門のインフラエンジニアとして様々なWebシステムの構築・運用を担当。ソニーでは、TVなどのホームエンタテインメント製品のサーバーサイドを担当。
日野 直登氏
ソニー株式会社
ホームエンタテインメント&サウンドプロダクツ事業本部
2013年にソニーモバイルコミュニケーションズ株式会社に入社。「Xperia™」にプリインストールされるAndroidアプリの開発や、新規事業創出部での「みんチャレ」アプリのサーバーサイド開発・運用を経て、現在は「Locatone」アプリのサーバーサイドの開発・運用を担当。
服部 博憲氏
ソニー株式会社
イメージングプロダクツ&ソリューションズ事業本部
2010年にソニー株式会社に入社。主に放送局向けや監視カメラ向けの画像認識技術開発に従事。2013年~2014年は、米国カーネギーメロン大学のロボティックス研究所に客員研究員として所属し、Computer VisionとMachine Learningの研究に没頭。現在はスポーツに対するソリューション開発を担当。ソニーのグループ会社であるホークアイ(Hawk-Eye Innovations)と連携した技術開発で、スポーツ界にイノベーションをもたらす挑戦をしている。
クリエイティビティとテクノロジーの力で、世界を感動で満たす。
本日のセッションでは、カメラやテレビなどを開発する「エレクトロニクス・プロダクツ&ソリューション」での取り組みを中心に、これまで世に送り出してきたプロダクトもあわせて紹介された。
ハードとソフトの融合により、人々に新たなライフスタイルを提案してきたソニー。プロダクトを見ると、世の中に驚きと感動を提供してきた数々のクリエイティブな製品が並ぶ。
昨今ではさらに、インターネットとクラウドを活用した、新たな価値やプロダクトを生み出している。例えば、テレビ・オーディオ領域では、ライブのように360度全方位から音が降り注ぐような聴き方が楽しめるサービス「360 Reality Audio(サンロクマル・リアリティオーディオ)」。個々に最適な臨場感を生み出すためのパラメータ調整を、AI・クラウドで実現している。
カメラ領域では、テニスやサッカーの試合で判定補助を行う「Hawk-Eye(ホークアイ)」。プロのフォトグラファー向けに開発された「Visual Story(ビジュアルストーリー)」。プロユース向けのプロダクトやサービスが揃う。
テレビ・オーディオ・カメラ領域におけるクラウド活用は、サービス対象国・地域は171国・地域。接続クライアントは4,300万台/日、APIアクセス数は、15億回/日にも上る。
ホームエンタテインメント製品におけるクラウド活用例
続いて、ホームエンタテインメント製品のサーバーサイドを担当する佐藤瞬氏が登壇。まずは、テレビやヘッドホン、サウンドバーといったホームエンタテインメント(HES)製品における、クラウドの活用事例とシステム構成を紹介した。
HES製品で使われているクラウドサービスは、CSD部という専門チームにより開発・提供されている。そのため、CSD部は横断的な役割を担っている。
続いて、AlexaやGoogleアシスタントを搭載したスマートスピーカーにより、HES製品をコントロールする「VC(ボイコントロール)」サービスについて紹介。データの流れやシステム構成は、以下スライドのような流れで認証や制御を行っている。
「テレビ番組メタ情報配信サービス」は、リアルタイムにランキング、おすすめ番組、視聴ログなどの情報をテレビやスマートフォンなどで受け取ることができるサービスである。ソニーでは、リモコン付きテレビ番組表アプリ「Video & TV SideView」を提供している。
システム構成について、佐藤氏は次のように補足した。
「アーキテクチャは基本、AWSで開発することが多いです。同システムにおいてはAurora、DynamoDB、Cloud Searchなどのサービスを組み合わせて構成しています」(佐藤氏)
「360 Reality Audio」では、個々に最適化するために、利用者の耳形状に着目した。耳を写真で撮影し、画像をクラウド、サーバーレスで構成されたシステムにアップ。機械学習AIが最適なパラメータをデバイスにフィードバックすることで、最適な音を実現している。
アーキテクチャは組織の色が強く反映する
続いては、ボイコントロールのシステムを例にCSDにおけるアーキテクチャ設計思想が紹介された。そこには、大きく4つの背景があったという。
- 多くのボイスエージェントと連携させたい
- ボイスエージェント以外のサービスにも対応したい
- デバイス側をサービス依存性させたくない
- さまざまな機器で使用できる基盤がほしい
「以前から、シェアの高いAlexaやGoogleアシスタントとは連携していたものの、各サービスがロックインしており、拡張性が乏しいとの課題がありました。また、ボイスは重要な操作手段ですが、将来的には他の手段も提供されることが予想されます」(佐藤氏)
さらに、ボイスエージェントの影響をデバイスが受けると、様々な問題が発生することが想定される。スピーカーやサウンドバーなど、リビングで使用するデバイスとも連携し、価値を提供していきたい。
このような背景から、コンポーネントは「認証」「管理・制御」「プラグイン」と3つのコンポーネント構成とすることを決めた。また、サービス連携コンポーネントにおいてはCSD部ではなく、他部署で開発することとした。
「Alexaは米国チームが開発しており、有識者もいました。そのためサービスに関する知見は我々よりも、USチームが持っている。その知見を活かしたいと思いましたし、当然、USチームが開発した方が効率的です。組織としての拡張性も高まると考えました」(佐藤氏)
続いては、技術や開発環境の選定について語られた。インフラ構成はContainerを選択。理由はコールドスタート問題の回避や運用の手間を考えて決断した。また、プログラミング言語は構成がシンプルで扱いやすいGo言語を採用した。アプリ―ケーションの開発力を高め、メンバーのスキル・モチベーションを向上させたいという狙いもあった。
佐藤氏はシステム設計思想を振り返り、決定要素は外部要因も含め多岐にわたるため、「アーキテクチャは組織の色が強く反映する」という見解を述べた。そして、次のように話し、セッションをまとめた。
「システムの目的・要件は最重要ですが、作るのはあくまで人なので、組織やメンバーがどのように発展・成長していくのかも重要です。そういった様々な要素も加味して、アーキテクチャは決定するものだと考えています」(佐藤氏)
Sound AR™サービス「Locatone」のクラウドシステム構成
続いて登壇したのは、オーディオ分野の新規Sound ARサービス「Locatone(ロケトーン)」のサーバーサイドの開発・運用を担当する日野直登氏。まずはアプリの概要について説明した。
Sound ARサービスとはその名のとおり、スマートフォンとイヤフォンやヘッドホンが連動し、特定スポットを訪れると、その場に応じた音声や音楽が流れてくるサービスである。
サウンドは360度全方向から聞こえ、「歩く」「ジャンプする」といった体の動きに連動したサウンドも流れる。ARカメラ機能を有したスマホで撮影を行えば、ARのような文字やイラストが画面上に写り込む。
「Locatoneを使えば、あらゆる場所をエンタテインメント化することができます。クリエイターにとっては新たな活躍の場が生まれますし、ユーザーにとってはこれまで体験したことがない、新感覚の音響体験ができる。三者が幸せになるエコシステム的なサービスにしたいと意気込んでいます」(日野氏)
リリースしてまだ1年だが、しながわ水族館やムーミンバレーパークなど、ロケーションは日に日に充実。LiSAやYOASOBIといった人気アーティストや企業とコラボレーションしたコンテンツも続々と配信されている。
開発体制やシステムアーキテクチャについても説明された。ユーザーが利用する「モバイルアプリ」、クリエイターがコンテンツを製作・配信するStudioという「Webアプリ」、両者をつなぐ「クラウド」・大きく3つのコンポーネントから構成される。
アプリの開発は2~3名、Web開発は1~2名。クラウドの開発は2~3名で対応している。
「クリエイターに多くコンテンツを制作してもらいとの意図から、意識的に企画・BizDevメンバーを多くアサインしていますが、3~4名でも足りない状況です。エンジニア、デザイナーとも少数で、お互いが密にコミュニケーションを取りながら追加機能しており、クラウドは1年で約20回リリースしています」(日野氏)
使用している技術については、クラウドはAWSやNodeJS、TypeScript、OpenAPI。WebアプリはReactやTypeScript、モバイルアプリはReact Native、Kotlin、Swift、TypeScriptなどを採用していることが紹介された。
クラウドアーキテクチャについては、少人数でビジネスロジックの開発に集中できることや、ライブイベントなどで急にユーザー数が増えるシーンを想定し、AWSのマネージドサービスを活用したサーバーレス構成とした。
上部の認証コンポーネントは、マイクロサービスとして独立。中央のコアコンポーネントでは、DynamoDBを共有するモノリシックな構成とし、API郡ごとにLambdaを分割している。なお、将来拡張した場合は認証コンポーネントのように、マイクロサービスとして独立させる計画があるという。また、社内のログ・認証基盤とも連携する(上・左部のコンポーネント)。
「いいね!を贈ろう」機能実装での開発思想と実際のシステム構成
続いて日野氏は、App StoreとGoogle Playのコンポーネントとつながる「アプリ向け課金API」について紹介。ユーザーアカウントとアプリ内の「いいね!」の総数を即時反応する機能を実装する取り組みや、実際のアーキテクチャを説明した。
「いいね!を贈ろう」機能とは、ユーザーがツアーと呼ばれる各コンテンツを応援したい気持ちを表す機能で、コインを購入(課金)し「いいね!」に変換し贈ることができる。
基本的な方針として運用を簡略化し、スケーラブルにするために、サーバーレス、マネージドサービスを採用している。一方お金のようなものを管理するためRDSを使いたくなるが、運用するDBの種類を増やしたくない、運用負荷が低い、DynamoDBでどこまでできるのか試してみたい、という理由で「いいね!を贈ろう」機能にもDynamoDBを採用。
お金に絡んでくるため厳密にカウントをする必要があり、ロックをかけて更新することとした。ところが、ロックをかけると一秒間に2~3回の更新しかできず、要件を満たしていなかった。同じく、DynamoDBにはアトミックカウンタとの機能もあるが、こちらも不適切だとされているため、使わないとの判断に至る。このような理由から「いいね!」の総計は、非同期で行うこととした。新たに考えたアーキテクチャが、次のスライドだ。
「ユーザーの『いいね!』はそのままDynamoDBに保存します。一方、総数の更新においては、Lambdaから総数更新命令をSQSに。SQSは非同期かつ直列に命令を更新用のLambdaに伝えます。更新用のLambdaは前回の更新時からの差分を集計して、DynamoDBに書き込みます。負荷テストを行うと、1ツアーあたり秒間10リクエストは問題なくさばけることが分かりましたし、理論的には10リクエスト以上も対応可能です」(日野氏)
この構成だとLambdaの起動が遅れた場合や、timestampがズレた場合に集計漏れの可能性があることが判明したため、一日に一度再計算を行っているが、実際には一度もズレたことはない。
最後に日野氏はソニーで働く魅力について述べ、セッションを締めた。
「社内でオーディションを行い、通過した者が新規事業を担当できる制度などがあり、新しいチャレンジに寛容な社風だと感じています。だからこそ、次々と新しいプロダクトが生まれている。実際、多くのエンジニアが新規事業に携わっています」(日野氏)
映像解析・データ分析技術でスポーツの未来を創造する「Hawk-Eye」
続いては、イメージングクラウド開発部の服部博憲氏が登壇。ソニーのグループ会社であるホークアイ(Hawk-Eye Innovations)が、スポーツ界に起こしている数々のイノベーションの実例や技術的背景を紹介した。
「複雑でいて魅力的なプレーが、人の視力の限界を超えるスピードで繰り広げられるスポーツの現場を、ソニーのテクノロジーによってサポートしています。判定の正確・公平さはもちろん、最近ではコロナ禍で人が介在せず判定を行える安全性にも取り組んでいます」(服部氏)
現在、ホークアイは審判判定補助のほか、試合の中継映像のエンハンスに活用されており、25以上の競技、95カ国以上500を超える会場に導入され、年間2万試合以上で使われている。例えばサッカーでは、ワールドカップに代表されるようなFIFA主催の試合を筆頭に、UEFA、英プレミアリーグ、独ブンデスリーガ、伊セリアAなどで導入されている。
特筆すべきは、これらのリーグにソニー側から一方的にシステムを提供したわけではないことだ。
「例えば、サッカーのゴール判定に用いられるGLTの場合、もともとはFIFAがシステム導入を検討しており、そのアイデアにホークアイが参画した。厳しい精度基準をクリアしたうえで、試合の中での運用方法・体制を含めてFIFAと一緒に作り上げてきました」(服部氏)
まさに、最新テクノロジーを開発するだけではない、「クリエイティビティとテクノロジーの力で、世界を感動で満たす」というパーパスに合致した動きと言えるだろう。
GLTでは、ゴールを取り囲むように設置された6~8台のカメラの試合映像からボールの位置や軌道を独自プログラムで解析し、解析結果を瞬時に映像化することができる。ボールがゴールラインを通過すると、瞬時に審判の腕時計に通知が届く仕組みになっている。
ここ数年は、これらのトラッキング技術を進化させることで、判定の自動化にも取り組んでいる。例えば、テニスではコート内に多くの線審を配置する必要があるため、コロナ禍で試合を開催することが難しかった。しかしながら、ホークアイの自動判定システムを活用することで、最少人数の審判員で試合を進行させることを実現している。
最近サッカーで導入を進めているエレクトロニックパフォーマンストラッキングシステム(EPTS)についても紹介した。EPTSでは、スタジアムに専用設置されたカメラの試合映像から選手・審判・ボールの動きを解析する。高度な画像処理技術と最先端の機械学習を用いた解析技術により、選手のフォームやボールの軌道などを詳細に解析し、データ化する。
「野球であれば、ピッチャーが打たれたときと打ち取ったときで、フォームやボールの軌道に違いがなかったか、スピン量や方向はどうであったのかなどを、データと照らし合わせながら映像を一コマずつ見返して、細かく検証することができます」(服部氏)
EPTSで取得したデータが蓄積されてくると、それらのデータを活用し、データに基づくコーチングや戦術分析、映像とデータを組み合わせた新しい視聴体験など、今後はソニーらしいエンタテインメントに繋げていきたいと考えていると述べ、セッションを締めた。
【Q&A】参加者から寄せられた質問に登壇者が回答
Q&Aタイムでは、登壇者たちが参加者から寄せられた質問に答えた。
Q.AWSを主に採用している理由や、AzureやGCPとの比較や優位性は何か。
佐藤:AzureやGCPと比較した際、規模はそれほど変わらないと思います。ただ、インターネット上で情報がたくさんあることが優位性かと。またソニーでは以前からAWSを使用しているため、メンバーが扱いやすいという理由もあります。
Q.ハードウェアの多さや将来の拡張性など、制約条件が多いのではないか?
佐藤:もちろん制約条件はあります。特にハードウェアは保守期間が長いため、プロトコルやインターフェイスは、長く使えるものを選定するように意識しています。一方で、サーバーのアーキテクチャなどは頻繁にデプロイするなど、柔軟に動ける部分もあります。
Q.AuroraではなくDynamoDBを選んだ理由は?
日野:どちらでも構築は可能ですし、集計などの実装に関してはAuroraの方が楽だと思います。一方でスケーラブルに実装しようとすると、どちらでもそれなりに大変であることは変わらないです。DynamoDBの方が運用が簡単なこともあり、DynamoDBを採用しました。今後サービスが成長すれば、運用が簡単なメリットが実感できるかと思います。
Q.アプリ開発にReactNativeを採用したのはなぜか
日野:コードを共通化したかったからです。今ではFlutterもありますが、当時はReactNativeが一般的だったので採用しました。
Q.ソニー共通のログ基盤は、AWSのCloudWatchLogsのように、共通APIで収集するようなシステムなのか
日野:メインはクライアント(アプリ)からログを収集。クラウド側もログを必要な分、送っているイメージです。クライアント寄りという観点では、Firebase Analyticsに近いと感じています。
Q.モノリシック内のサービス連携ならびに今後のマイクロサービス化について
日野:同じDynamoDBで連携しています。つまりDynamoDBを分けることが、マイクロサービス化になるのではないかと考えています。
Q.Hawk-Eyeは、一試合でどのくらいのデータ量になるのか
服部:例えば4K 60fpsのカメラを12台使った構成の場合、1時間におよそ合計260万フレームの画像データが撮影され、そのフレームごとに選手・ボールのデータを解析して蓄積しています。画像データと解析データをあわせて、数十~数百テラといったデータ量になります。
Q.膨大なデータ量なので、クラウドではレイテンシーが発生するのでは
服部:その通りで、現在はレイテンシーを抑える為に、オンプレに処理を寄せたシステム構成をとっていることが多いです。ただ、少しずつリモート化やクラウド移行が始まってきている段階でもあり、どのようなシステム構成がベストかを随時模索している状況です。
Q.ハードウェアも含め、幅広い技術知識が必要だと感じた。Webのスキルや経験だけでは難しいのではないか
佐藤:そのような心配はいりません。特にハードウェアのスキルに関しては、入社してから学習するかたちで問題ありません。逆に、Webの知識を持っている人材は重宝されていて、私も以前はWeb業界にいました。
Q.技術情報の共有や学びの場について
佐藤:技術共有や勉強会、会社全体の技術カンファレンスなどは頻繁に行っています。
服部:毎週、英国にいるホークアイのエンジニアと、技術的な議論や情報共有を行っています。その中で、ソニーグループの技術をホークアイに提供したり、逆にホークアイの尖った技術をソニーグループに取り入れる交流も生まれています。