Alexa được cài đặt trên hơn 100 triệu thiết bị trên toàn cầu, thu được hàng tỷ truy vấn của người dùng trong quá trình này. Giống như tất cả các trợ lý kỹ thuật số, Alexa dựa vào các mô hình dữ liệu để đưa ra phản hồi tốt hơn, nhưng có vẻ như Amazon cũng đã giúp trợ lý kỹ thuật số này giúp đỡ dưới dạng đánh giá của con người. Một cuộc điều tra của Bloomberg đã tiết lộ rằng Amazon có một đội ngũ toàn cầu phiên âm và ghi chú các bản ghi Alexa từ khắp nơi trên thế giới để "loại bỏ những lỗ hổng trong hiểu biết về lời nói của con người" và cho phép trợ lý đưa ra những phản hồi tốt hơn cho các truy vấn của bạn.
Ấn phẩm cho thấy Amazon sử dụng hàng ngàn người trên khắp thế giới - cả nhà thầu và nhân viên toàn thời gian - để xem xét các bản ghi Alexa, với các đội trải rộng khắp Boston, Costa Rica, Ấn Độ và Romania. Theo một nguồn giấu tên, mỗi người đánh giá phân tích hơn 1.000 clip âm thanh trong một ca làm việc kéo dài chín giờ, chú thích chúng và đưa chúng trở lại hệ thống để cải thiện phản hồi của Alexa. Từ Bloomberg:
Một công nhân ở Boston cho biết ông khai thác dữ liệu giọng nói tích lũy cho các phát ngôn cụ thể như "Taylor Swift" và chú thích chúng để cho biết người tìm kiếm có nghĩa là nghệ sĩ âm nhạc.
Thỉnh thoảng, người nghe nhặt những thứ mà chủ sở hữu Echo có thể muốn ở riêng: một người phụ nữ hát tệ khi tắt vòi sen, nói, hoặc một đứa trẻ la hét cầu cứu. Các đội sử dụng các phòng trò chuyện nội bộ để chia sẻ các tệp khi họ cần trợ giúp phân tích một từ lầy lội hoặc gặp phải một bản ghi gây cười.
Ấn phẩm cũng cho thấy rằng các nhân viên bắt gặp các bản ghi có bản chất đáng lo ngại:
Đôi khi họ nghe thấy các bản ghi âm mà họ thấy khó chịu, hoặc có thể là tội phạm. Hai trong số các công nhân cho biết họ nhặt được thứ mà họ tin là tấn công tình dục. Khi điều đó xảy ra, họ có thể chia sẻ trải nghiệm trong phòng trò chuyện nội bộ như một cách giải tỏa căng thẳng.
Amazon cho biết họ có các quy trình để các công nhân tuân theo khi họ nghe thấy điều gì đó đau khổ, nhưng hai nhân viên ở Rumani nói rằng, sau khi yêu cầu hướng dẫn cho những trường hợp như vậy, họ đã nói rằng đó không phải là công việc của Amazon để can thiệp.
Các bản ghi không có tên hoặc địa chỉ đầy đủ của người dùng, nhưng chúng bao gồm tên của người dùng, số tài khoản và số sê-ri của thiết bị. Amazon trước đây đã đề cập rằng họ dựa vào xử lý ngôn ngữ tự nhiên để đào tạo Alexa, nhưng họ đã thừa nhận với Bloomberg rằng họ sử dụng yếu tố con người để chú thích một "mẫu ghi âm giọng nói nhỏ của Alexa:"
Chúng tôi rất coi trọng tính bảo mật và quyền riêng tư của thông tin cá nhân của khách hàng. Chúng tôi chỉ chú thích một mẫu ghi âm giọng nói Alexa cực kỳ nhỏ để cải thiện trải nghiệm của khách hàng. Ví dụ: thông tin này giúp chúng tôi đào tạo hệ thống nhận dạng giọng nói và hiểu ngôn ngữ tự nhiên, do đó Alexa có thể hiểu rõ hơn các yêu cầu của bạn và đảm bảo dịch vụ hoạt động tốt cho mọi người.
Chúng tôi có các biện pháp bảo vệ kỹ thuật và vận hành nghiêm ngặt và có chính sách không khoan nhượng đối với việc lạm dụng hệ thống của chúng tôi. Nhân viên không có quyền truy cập trực tiếp vào thông tin có thể xác định người hoặc tài khoản là một phần của quy trình làm việc này. Tất cả thông tin được xử lý bảo mật cao và chúng tôi sử dụng xác thực đa yếu tố để hạn chế quyền truy cập, mã hóa dịch vụ và kiểm toán môi trường kiểm soát của chúng tôi để bảo vệ thông tin đó.
Không chỉ Amazon chuyển sang giúp đỡ con người để phát triển trợ lý kỹ thuật số. Bloomberg phát hiện ra rằng Apple cũng có một nhóm nhân sự kiểm tra xem cách giải thích các yêu cầu của Sir có khớp với những gì người dùng đã hỏi hay không. Google có người đánh giá đào tạo Trợ lý, nhưng các clip không có bất kỳ thông tin nhận dạng cá nhân nào và bản thân âm thanh bị bóp méo để ngăn chặn mọi nhận dạng.