Microsoft vừa được cấp bằng sáng chế cho thiết bị kết hợp camera mắt cá và nhiều microphone.

Microsoft nhận bằng sáng chế thiết bị AI với camera mắt cá và nhiều microphone

Gần đây, Microsoft thường nhấn mạnh tầm quan trọng của công nghệ AI, thậm chí hãng còn dự đoán các ứng dụng của công nghệ này sẽ đóng góp 5 nghìn tỷ USD cho tăng trưởng GDP toàn cầu trong vài năm tới. Trong vài tháng qua, nhiều sự hợp tác của hãng này cũng tập trung vào lĩnh vực này hơn.

Một bằng sáng chế mới của Microsoft đã được công bố, cho thấy một hệ thống AI với một camera mắt cá và nhiều microphone.

Theo đó, máy ảnh mắt cá có ống kính đặc biệt cho phép theo dõi toàn cảnh 360 độ. Dù công nghệ này không mới, Microsoft có kế hoạch kết hợp với các thiết bị chụp xung quanh. Các hệ thống này thường có nhiều camera để mở rộng tầm nhìn của chúng. Điều này thường đòi hỏi các thiết kế phức tạp, dẫn đến nhu cầu bổ sung phần cứng để hợp nhất nhiều luồng dữ liệu nghe nhìn.

Microsoft đề xuất một máy ảnh mắt cá hướng lên trên, được sử dụng với các thiết bị này, cùng với một mảng micro. Điều này giúp giải quyết những khó khăn liên quan đến việc ghi hình các đối tượng chuyển động, hoặc tập trung vào chuyển động của một đối tượng từ nhiều mục tiêu. Rất nhiều kỹ thuật đã được mô tả liên quan đến việc đặt phần cứng.

Ví dụ, phần lớn các microphone có thể được đặt trong một hình tròn hoặc lục giác, cùng một vị trí khác tại điểm trung tâm trong một mặt phẳng. Tương tự, máy ảnh mắt cá được đặt gần với mảng micrô, cũng như mặt sàn hoặc mặt bàn để thu thập dữ liệu tối ưu.

Microsoft nhận bằng sáng chế thiết bị AI với camera mắt cá và nhiều microphone

Một mô hình hợp nhất cũng có thể hoạt động như một phần của hệ thống này, sử dụng các thuật toán học sâu để trở nên nhạy hơn về dữ liệu âm thanh và hình ảnh mà nó thu thập được.

Ví dụ, một mạng nơ-ron tái phát bộ nhớ ngắn hạn (LSTM) có thể được triển khai. Thông qua bản chất vốn có, loại mạng này có thể lưu trữ thông tin theo ngữ cảnh và lịch sử, làm cho bất kỳ phân tích nào cũng hữu ích hơn cho các trường hợp sử dụng trong tương lai.

Dựa trên mô hình được mô tả, việc sử dụng thiết bị có thể được mở rộng hơn, chẳng hạn như nhận dạng giọng nói từ một người cụ thể định. Về cơ bản công nghệ này có thể kết hợp với các trợ lý kỹ thuật số như Cortana. Microsoft lưu ý rằng thiết lập được mô tả có thể giúp trợ lý kỹ thuật số ghi lại thông tin phong phú hơn, đồng thời nhận và hành động dựa trên tín hiệu âm thanh, video chất lượng cao một cách dễ dàng và nhanh chóng. Camera mắt cá và mảng microphone sẽ đóng vai trò không thể thiếu trong ứng dụng này.

Dữ liệu thu thập sau khi lưu trữ ở dạng nén cục bộ có thể tận dụng các mô hình LSTM để phân tích hoặc hợp nhất trong một máy chủ đám mây AI. Tuy nhiên việc triển khai hệ thống không chỉ giới hạn ở các trợ lý ảo. Mọi kỹ thuật được mô tả đều có thể hoạt động với PC, máy tính bảng, điện thoại di động.

Theo Neowin

Góc quảng cáo