Mới đây, CEO Mark Zuckerberg của Meta đã trình diễn khả năng phiên dịch trực tiếp bằng AI thông qua một loại ngôn ngữ không có chữ viết chính thức. Đây được xem là bước đi đầu tiên trong chiến lược phổ cập hóa Metaverse của hãng.
Loại tiếng được sử dụng là tiếng Phúc Kiến (Hokkien) một loại ngôn ngữ nói không có chữ viết. Ngôn ngữ này hiện tại được sử dụng bởi 45 triệu người tới từ Trung Quốc, Đài Loan, Malaysia, Singapore hay Philippines. Điểm khác biệt so với các loại ngôn ngữ khác là hình thức thể hiện, nếu các loại ngôn ngữ khác quy được về chữ viết thì tiếng Phúc Kiến phụ thuộc hoàn toàn vào âm điệu để phiên dịch.
Thông thường, AI sẽ được nhập liệu các loại ngôn ngữ dưới dạng chữ viết. Trí tuệ nhân tạo từ chữ viết sẽ kết nối với âm điệu để xác định câu hoàn chỉnh, thế nhưng ngoài tiếng Phúc Kiến, có tới 3.000 ngôn ngữ khác nhau không có chữ viết chính thống, khiến việc chuyển ngữ chúng khó khăn hơn rất nhiều.
Trong giới thiệu của Meta, CEO Mark Zuckerberg có thể giao tiếp trực tiếp với một người nói tiếng Phúc Kiến. Trí tuệ nhân tạo khi đó sẽ phiên dịch trực tiếp ngôn ngữ của người đối diện để cả hai có thể đối thoại tức thì mà không cần sử dụng tới công cụ nào khác.
Video mô phỏng khả năng phiên dịch qua lại giữa tiếng Anh và tiếng Phúc Kiến của Meta.
Đại diện nhóm nghiên cứu tại Meta, ông Juan Pino cho rằng: "Trí tuệ nhân tạo sẽ phiên dịch tiếng Anh hoặc tiếng Phúc Kiến thành tiếng Trung ở dạng chữ viết, từ chữ viết tiếng Trung này AI sẽ chuyển ngữ lại thành tiếng đối ngược sau đó tiếp tục được một trí tuệ nhân tạo khác ghép thành câu có nghĩa cho người đối diện có thể hiểu được đối phương đang nói gì".
Bước đột phá lớn về công nghệ này khi được xây dựng hoàn chỉnh và áp dụng với nhiều loại ngôn ngữ khác nhau sẽ xóa bỏ rào cản về giao tiếp, giúp kết nối hàng tỷ người toàn cầu dù không sử dụng ngôn ngữ chung. Dù vậy, giới thạo tin cho rằng khả năng của AI nói trên vẫn chỉ đang ở mức sơ khai và sẽ cần nhiều phiên bản nữa trước khi tính năng chuyển ngữ này được áp dụng rộng rãi.
Rào cản lớn nhất ở thời điểm hiện tại chính là việc sắp xếp các cụm từ sau khi dịch thành câu có nghĩa. Các loại ngôn ngữ khác nhau sử dụng cấu trúc và nhiều khi ý nghĩa từ ngữ khác nhau. Các dữ liệu được nhập vào sẽ giúp AI có thêm cơ sở để phát triển hoàn thiện hơn trong tương lai.