AI, Voice Agent, MLOps 등 관심 분야의 기술 동향을 분석하고, 실무에서 얻은 인사이트를 기록합니다.
Google이 발표한 최초의 네이티브 멀티모달 임베딩 모델이 음성 에이전트 아키텍처에 미치는 영향을 분석합니다. STT 없이 음성을 직접 벡터로 변환하는 새로운 파이프라인의 가능성과 한계.