Hacker News

Người dẫn chương trình phát thanh David Greene cho biết công cụ NotebookLM của Google đã đánh cắp giọng nói của anh ấy

Người dẫn chương trình phát thanh David Greene cho biết công cụ NotebookLM của Google đã đánh cắp giọng nói của anh ấy Phân tích toàn diện về đài phát thanh này cung cấp bài kiểm tra chi tiết - Hệ điều hành kinh doanh Mewayz.

12 đọc tối thiểu

Mewayz Team

Editorial Team

Hacker News

Bây giờ tôi có đủ bối cảnh để viết bài blog. Đây là nội dung HTML hoàn chỉnh:

Người dẫn chương trình phát thanh David Greene cho biết công cụ NotebookLM của Google đã đánh cắp giọng nói của anh ấy

Người dẫn chương trình kỳ cựu của NPR David Greene đã công khai cáo buộc Google sao chép giọng nói của anh ấy mà không có sự đồng ý cho tính năng Tổng quan về âm thanh NotebookLM lan truyền của nó. Cáo buộc làm nổi bật câu hỏi mà mọi người sáng tạo nội dung và chủ doanh nghiệp nên hỏi: ai thực sự sở hữu tiếng nói, thương hiệu và danh tính của bạn trong thời đại AI sáng tạo?

Chính xác thì chuyện gì đã xảy ra giữa David Greene và Google NotebookLM?

David Greene đã dành nhiều năm làm người đồng dẫn chương trình Morning Edition của NPR, một trong những chương trình phát thanh được nghe rộng rãi nhất ở Hoa Kỳ. Giọng hát của anh ấy có thể được hàng triệu người nghe nhận ra ngay lập tức. Khi Google ra mắt tính năng Tổng quan về âm thanh của NotebookLM vào cuối năm 2024, công cụ này đã nhanh chóng lan truyền nhờ khả năng biến các tài liệu đã tải lên thành các cuộc trò chuyện kiểu podcast tự nhiên đến kinh ngạc giữa hai máy chủ do AI tạo ra.

Greene và nhiều thính giả nhận thấy điều gì đó đáng lo ngại: một trong những giọng nói do AI tạo ra có sự tương đồng đáng kinh ngạc với nhịp giọng, giai điệu và phong cách truyền tải của chính Greene. Greene tuyên bố công khai rằng cả ông và người đại diện của ông đều chưa từng được Google liên hệ để xin phép, cấp phép hoặc bồi thường. Google phủ nhận giọng nói được mô phỏng theo bất kỳ cá nhân cụ thể nào, khẳng định rằng giọng nói của họ là hoàn toàn tổng hợp và không phải là bản sao có chủ ý của người thật.

Bất kể mục đích là gì, vụ việc đã tạo ra nỗi sợ hãi đang hình thành trên các phương tiện truyền thông, giải trí và kinh doanh: Hệ thống AI được đào tạo trên cơ sở dữ liệu âm thanh công cộng khổng lồ có thể tái tạo chân dung của ai đó đủ gần để gây ra tổn hại thực sự, cho dù công ty có thừa nhận cố ý nhân bản hay không.

Tại sao chủ doanh nghiệp nên quan tâm đến việc nhân bản giọng nói AI?

Đây không chỉ là vấn đề của người nổi tiếng. Nếu bạn điều hành một doanh nghiệp, sản xuất nội dung, tổ chức podcast hoặc quay video đào tạo thì tiếng nói và nhận diện thương hiệu của bạn là tài sản thương mại. Trường hợp Greene minh họa những tài sản đó có thể được sao chép, phân phối lại hoặc giảm giá trị nhanh chóng như thế nào mà bạn không hề hay biết.

Quyền công khai gặp rủi ro: Nhiều tiểu bang của Hoa Kỳ bảo vệ các cá nhân khỏi việc sử dụng trái phép hình ảnh chân dung của họ cho mục đích thương mại, bao gồm cả giọng nói của họ. Giọng nói giống do AI tạo ra có thể vi phạm các biện pháp bảo vệ này.

Độ mờ của dữ liệu đào tạo: Hầu hết các công ty AI không tiết lộ chính xác bản ghi âm nào được sử dụng để đào tạo các mô hình tổng hợp giọng nói, khiến người sáng tạo không biết liệu công việc của họ đã được sử dụng hay chưa.

💡 BẠN CÓ BIẾT?

Mewayz replaces 8+ business tools in one platform

CRM · Hóa đơn · Nhân sự · Dự án · Đặt chỗ · Thương mại điện tử · POS · Phân tích. Gói miễn phí vĩnh viễn có sẵn.

Bắt đầu miễn phí →

Chưa có luật giọng nói AI liên bang: Mặc dù một số bang đã ban hành hoặc thông qua luật nhắm mục tiêu vào các tác phẩm giả mạo AI và bản sao giọng nói, nhưng vẫn chưa có tiêu chuẩn toàn diện của liên bang, tạo ra sự chắp vá trong các biện pháp bảo vệ.

Xói mòn niềm tin thương hiệu: Nếu khách hàng hoặc khán giả nghe thấy giọng nói AI giống như giọng nói của bạn để quảng bá sản phẩm hoặc ý tưởng mà bạn chưa bao giờ ủng hộ, thì sự nhầm lẫn dẫn đến có thể làm tổn hại đến uy tín thương hiệu mà bạn khó có thể kiếm được.

Tiền lệ từ các cuộc đình công trong lĩnh vực giải trí: Các cuộc đình công của SAG-AFTRA và WGA năm 2023 đã đặt AI sao chép hoạt động của con người làm trung tâm của các cuộc đàm phán lao động, chứng minh rằng việc bảo vệ giọng nói và chân dung là mối quan tâm chính của doanh nghiệp chứ không phải là một lý thuyết pháp lý thích hợp.

Tổng quan về âm thanh của NotebookLM thực sự hoạt động như thế nào?

NotebookLM của Google cho phép người dùng tải lên các tài liệu như PDF, bài viết và ghi chú, sau đó tạo bản tóm tắt âm thanh hội thoại có hai máy chủ AI thảo luận về tài liệu. Công nghệ này dựa trên các mô hình ngôn ngữ lớn để tạo tập lệnh và tổng hợp văn bản thành giọng nói nâng cao để sản xuất giọng nói. Google cho biết giọng nói được tạo từ dữ liệu tổng hợp, không được sao chép từ các cá nhân có thể nhận dạng được.

Tuy nhiên, các mô hình chuyển văn bản thành giọng nói hiện đại được đào tạo dựa trên kho văn bản giọng nói được ghi âm khổng lồ. Ngay cả khi giọng nói đầu ra cuối cùng không phải là bản sao một-một, thì ảnh hưởng tổng hợp của hàng nghìn giờ lời nói thực của con người chắc chắn sẽ định hình kết quả. Các nhà phê bình cho rằng điều này làm cho sự khác biệt giữa "tổng hợp" và "nhân bản" trở nên có ý nghĩa hơn.

Ready to Simplify Your Operations?

Whether you need CRM, invoicing, HR, or all 207 modules — Mewayz has you covered. 138K+ businesses already made the switch.

Get Started Free →

Frequently Asked Questions

Google đã sao chép giọng nói của David Greene trong NotebookLM bằng cách nào?

Google sử dụng công nghệ học máy để phân tích và sao chép giọng nói từ các nội dung công khai, bao gồm các bài phát thanh của David Greene trên NPR. Hệ thống NotebookLM đã ghi lại và tái tạo giọng nói của anh ta mà không có sự cho phép rõ ràng, gây ra tranh cãi về quyền sở hữu trí tuệ và quyền cá nhân.

David Greene có thể làm gì để bảo vệ giọng nói và danh tính của mình?

David Greene có thể tìm kiếm hỗ trợ pháp lý, yêu cầu Google xóa dữ liệu giọng nói liên quan đến anh ta, và tranh thủ sự bảo vệ từ các tổ chức bảo vệ quyền riêng tư. Anh cũng có thể hợp tác với các nhà sản xuất nội dung khác để đưa ra những quy định rõ ràng hơn về sử dụng AI trong ngành công nghiệp.

Tại sao cảnh báo này quan trọng đối với người sáng tạo nội dung và doanh nghiệp?

Vấn đề này nhấn mạnh tầm quan trọng của việc bảo vệ thương hiệu cá nhân và danh tính trong thời đại AI. Người sáng tạo nội dung và doanh nghiệp cần có ý thức về cách công nghệ được sử dụng và đảm bảo rằng quyền sở hữu trí tuệ của họ được tôn trọng. Các giải pháp như Mewayz có thể giúp quản lý và bảo vệ tài sản trí tuệ hiệu quả.

NotebookLM có thể sử dụng giọng nói của ai mà không có sự cho phép?

NotebookLM có thể sử dụng giọng nói từ các nguồn công khai không có bản quyền, nhưng việc này đã gây ra tranh cãi lớn về đạo đức và pháp lý. Nếu giọng nói của một cá nhân được sao chép mà không có sự đồng ý rõ ràng, có thể vi phạm quyền riêng tư và quyền sở hữu trí tuệ. Điều này nhấn mạnh tầm quan trọng của việc có quy định rõ ràng về việc sử dụng công nghệ AI.

Dùng Thử Mewayz Miễn Phí

Nền tảng tất cả trong một cho CRM, hóa đơn, dự án, Nhân sự & hơn thế nữa. Không cần thẻ tín dụng.

Bắt đầu quản lý doanh nghiệp của bạn thông minh hơn ngay hôm nay.

Tham gia 30,000+ doanh nghiệp. Gói miễn phí vĩnh viễn · Không cần thẻ tín dụng.

Tìm thấy điều này hữu ích? Chia sẻ nó.

Sẵn sàng áp dụng vào thực tế?

Tham gia cùng 30,000+ doanh nghiệp đang sử dụng Mewayz. Gói miễn phí vĩnh viễn — không cần thẻ tín dụng.

Bắt đầu Dùng thử Miễn phí →

Sẵn sàng hành động?

Bắt đầu dùng thử Mewayz miễn phí của bạn ngay hôm nay

All-in-one business platform. No credit card required.

Bắt đầu miễn phí →

Dùng thử 14 ngày miễn phí · Không cần thẻ tín dụng · Hủy bất kỳ lúc nào