Mục lục:
- Google duplex là gì?
- Đây không giống như lời nói thành văn bản sao?
- Song song hoạt động như thế nào?
- Còn về bảo mật và quyền riêng tư thì sao?
- Khi nào tôi sẽ có duplex trên điện thoại?
- Tôi có thể tìm hiểu thêm ở đâu?
Tại Google I / O 2018, chúng tôi đã thấy một bản demo về điều thú vị mới nhất của Google, Duplex. Màn hình 60 feet trên sân khấu cho thấy giao diện giống như ứng dụng Google Assistant của bạn với tính năng phát lại từng bước của Trợ lý gọi điện thoại cho thợ làm tóc và thiết lập một cuộc hẹn, hoàn thành với các lần tạm dừng, ummms và ahhhs và phần còn lại của các idiosyncrasies đi kèm với lời nói của con người. Người tham gia cuộc hẹn dường như không biết họ đang nói chuyện với máy tính vì nó không giống máy tính. Một chút cũng không.
Loại demo này trông tuyệt vời (và có thể hơi đáng sợ) nhưng còn chi tiết thì sao? Chính xác là gì? Làm thế nào nó thậm chí hoạt động? Tất cả chúng ta đều có câu hỏi khi chúng ta thấy điều gì đó khác biệt này và việc tìm kiếm câu trả lời lan truyền trên internet là một nỗi đau. Chúng ta hãy đi qua những gì chúng ta biết cho đến nay về Google Duplex.
Google duplex là gì?
Đây là một công cụ mới của Google nhằm mục đích sử dụng Trí tuệ nhân tạo (AI) để "hoàn thành các nhiệm vụ trong thế giới thực qua điện thoại", theo các nhà nghiên cứu và phát triển AI của Google. Hiện tại, điều đó có nghĩa là các nhiệm vụ rất cụ thể như đặt lịch hẹn, nhưng công nghệ đang được phát triển với mục đích mở rộng sang các lĩnh vực khác. Chi hàng tỷ đô la để tạo ra một cách tuyệt vời để đặt chỗ cho bữa tối nghe có vẻ giống như việc Google sẽ làm nhưng không phải là cách sử dụng thời gian hay tiền bạc tuyệt vời.
Song công cũng nhiều hơn những gì chúng ta đã thấy trong một bản demo và nếu nó rời khỏi phòng thí nghiệm sẽ nhiều hơn những gì chúng ta thấy hoặc nghe thấy ở cuối của chúng ta. Có những ngân hàng dữ liệu khổng lồ và các máy tính để xử lý nó không liên quan đến kết quả cuối cùng. Nhưng chúng rất cần thiết bởi vì làm cho một máy tính nói chuyện và suy nghĩ, trong thời gian thực, giống như một người là khó khăn.
Đây không giống như lời nói thành văn bản sao?
Không. Thậm chí không gần gũi. Và đó là lý do tại sao nó là một vấn đề lớn.
Song công được thiết kế để thay đổi cách máy tính "nói" trên điện thoại.
Mục tiêu của Duplex là làm cho mọi thứ nghe có vẻ tự nhiên và để Trợ lý suy nghĩ nhanh chóng để tìm thời gian hẹn làm việc. Nếu Joe nói, "Vâng, về điều đó - tôi không có bất cứ điều gì mở cho đến 10, điều đó có ổn không?" Trợ lý cần phải hiểu những gì Joe đang nói, tìm hiểu điều đó có nghĩa là gì và nghĩ xem những gì Joe đang cung cấp sẽ có ích cho bạn hay không. Nếu bạn bận rộn khắp thị trấn lúc 10 giờ và sẽ mất 40 phút lái xe đến Nhà để xe của Joe, Trợ lý cần có thể tìm ra điều đó và nói 11:15 sẽ tốt.
Điều quan trọng không kém đối với Google là câu trả lời và âm thanh giống như một người. Google cho biết họ muốn người trên điện thoại không biết họ đang nói chuyện với máy tính, mặc dù cuối cùng họ đã quyết định tốt nhất là thông báo cho họ. Khi chúng tôi nói chuyện với mọi người, chúng tôi nói chuyện nhanh hơn và ít trang trọng hơn (đọc: bập bẹ không theo quan điểm của máy tính) so với khi chúng tôi nói chuyện với Trợ lý trên điện thoại hoặc máy tính tại DMV khi chúng tôi gọi. này và tạo lại nó khi trả lời.
Cuối cùng, và ấn tượng nhất, đó là duplex phải hiểu ngữ cảnh. Thứ sáu, thứ sáu tới và thứ sáu sau tuần tới là tất cả các điều khoản mà bạn và tôi hiểu. Song cũng cần phải hiểu chúng. Nếu chúng ta nói giống như cách chúng ta gõ thì đây sẽ không phải là vấn đề, nhưng chúng ta không biết vì nó nghe có vẻ ngột ngạt vâng, nó không giống như nhầm lẫn mặc dù chúng ta đã nghe nó suốt cuộc đời và đã quen với nó không, chúng tôi không có vấn đề gì bạn biết hiểu nó hoặc không có gì như vậy.
Tôi sẽ quản lý sơ cứu cho biên tập viên của mình sau khi gõ nó trong khi bạn nói to, vì vậy bạn thấy điều này có nghĩa là gì.
Song song hoạt động như thế nào?
Từ đầu người dùng, đơn giản như bảo Trợ lý làm gì đó. Hiện tại, như đã đề cập, có điều gì đó bị giới hạn trong việc đặt lịch hẹn nên chúng tôi sẽ nói: "Này Google hãy hẹn tôi thay dầu tại Nhà để xe của Joe vào sáng thứ Ba" và (sau khi nó nhắc chúng tôi nói vui lòng) nó sẽ gọi lên Joe's Garage và thiết lập mọi thứ, sau đó thêm nó vào lịch của bạn.
Khá tiện lợi. Nhưng những gì xảy ra tắt máy ảnh thậm chí còn nhanh hơn.
Song công đang sử dụng cái được gọi là mạng thần kinh tái phát. Nó được xây dựng bằng công nghệ Extended TensorFlow của Google. Google đã đào tạo mạng trên tất cả các thư thoại ẩn danh và các cuộc hội thoại Google Voice mà bạn đã đồng ý cho phép nghe nếu bạn chọn tham gia kết hợp phần mềm nhận dạng giọng nói và khả năng xem xét lịch sử của cuộc hội thoại và chi tiết như thời gian trong ngày và địa điểm của cả hai bên.
Về cơ bản, toàn bộ mạng lưới các máy tính có công suất cao đang xử lý dữ liệu trên đám mây và nói chuyện với Trợ lý trên điện thoại của bạn hoặc sản phẩm khác có Trợ lý trên máy bay.
Còn về bảo mật và quyền riêng tư thì sao?
Có một điều đơn giản: bạn có tin tưởng Google không. Trí thông minh máy trên thiết bị là một điều có thật, mặc dù nó bị hạn chế và tương đối mới. Google đã phát triển ML Kit để giúp các nhà phát triển thực hiện nhiều hơn những thứ này trên chính thiết bị, nhưng tất cả chỉ là vấn đề về sức mạnh tính toán. Phải mất một số lượng tính toán đáng kinh ngạc để thực hiện một cuộc hẹn tóc theo cách này và không có cách nào có thể được thực hiện trên điện thoại hoặc Google Home của bạn.
Bạn phải tin tưởng Google với dữ liệu của mình để sử dụng các sản phẩm thông minh của mình và Duplex sẽ không khác.
Google cần khai thác nhiều dữ liệu cá nhân của bạn để thực hiện những điều đặc biệt mà Trợ lý có thể làm ngay bây giờ và Duplex không thay đổi điều đó. Điều mới ở đây là bây giờ có một bên khác tham gia, người rõ ràng không cho phép Google nghe cuộc trò chuyện của họ.
Nếu / khi Duplex trở thành một sản phẩm tiêu dùng thực tế cho bất kỳ ai sử dụng, hãy hy vọng nó sẽ bị chỉ trích và thách thức tại tòa án. Và nó nên được; để Google quyết định những gì tốt nhất cho quyền riêng tư của chúng tôi giống như câu ngạn ngữ cũ của hai con cáo và một con gà quyết định những gì cho bữa tối.
Khi nào tôi sẽ có duplex trên điện thoại?
Không ai biết ngay bây giờ. Nó có thể không bao giờ xảy ra. Google rất phấn khích khi có thể làm điều tuyệt vời này và muốn chia sẻ nó với thế giới. Điều đó không có nghĩa là nó sẽ thành công hoặc trở thành một sản phẩm thực sự.
Hiện tại, Duplex đang được thử nghiệm trong một môi trường khép kín và được giám sát. Nếu mọi việc suôn sẻ, một bản phát hành thử nghiệm ban đầu cho người tiêu dùng để đặt chỗ nhà hàng, lên lịch các cuộc hẹn ở tiệm làm tóc và nhận được giờ nghỉ qua điện thoại sẽ đến vào cuối năm nay chỉ bằng cách sử dụng Trợ lý trên điện thoại.
Tôi có thể tìm hiểu thêm ở đâu?
Google ngạc nhiên mở về công nghệ mà nó đang sử dụng để tạo ra Duplex. Bạn sẽ tìm thấy thông tin liên quan tại các trang web sau:
- Blog Google AI (Google)
- Deepmind
- Tensorflow.org
- Thư viện Đại học Cornell
- Nghiên cứu Google (Google)
- Từ khóa (Google)
- Bộ ML (Google)
Tất nhiên, chúng tôi cũng đang theo dõi sát sao, và bạn sẽ nghe thấy những phát triển mới nhất ngay tại đây ngay khi chúng có sẵn.