音声認識エージェントが流行りだした件、機能自体は昔から実現できてたけど、とても些細な改善が有機的に組み合わされた結果だという私見。
プッシュトゥトーク→発話をトリガー
音声認識ソフト実行環境→IoT
汎用音声認識→アカウント毎にチューニングして高精度で認識
貧弱端末で認識&回答→富豪サーバ側で認識&回答
バラバラに改善されてきた各要素が、誰かのひらめきと努力で結びついて、やっと「システム」として使い物になっているイメージ。
システムの完成度で言えば「知ってる人が頑張れば使える」段階から「なんとなくで使える」段階に入ったかなー、という印象。
でも、「専門家でなくてもユースケースが浮かぶ」というのはすごく大事で、「誤った使い方」からブレイクスルーする事って技術界隈ではままあると思ってる(根拠はない)
スマスピネイティブが青年期なる頃には、「お友達 AI エージェント」が1人一体になってるかもしれない。ドラえ◯んキタコレ!