نشرت شركة OpenAI النتائج الأولية لاختبار ميزة جديدة تتيح للذكاء الاصطناعي قراءة الكلمات بصوت عالٍ بطريقة تشبه صوت بشري مقنع، مما يسلط الضوء على حدود جديدة للتكنولوجيا ويثير مخاوف بشأن خطر التزوير الصوتي.
نُشرت مقترحات واستخدامات مبكرة من معاينة نموذج تحويل النص إلى كلام المسمى “Voice Engine” بالتعاون مع نحو 10 مطورين حتى الآن، ولكن قررت الشركة عدم إطلاق هذه الميزة على نطاق واسع بعد استلام تعليقات من أصحاب المصلحة.
كانت الشركة تخطط في البداية لإطلاق الأداة لما يصل إلى 100 مطور من خلال عملية تقديم الطلبات، إلا أنها قررت تقليص النطاق بناءً على التعليقات الواردة.
تعمل OpenAI على التعاون مع شركاء مختلفين، بما في ذلك الحكومات ووسائل الإعلام والترفيه والتعليم والمجتمع المدني، لضمان أن تُدمج ملاحظاتهم في عملية التطوير.
تم استخدام تقنيات أخرى للتلاعب بالأصوات في بعض السياقات، مثل حالات التلاعب الصوتي التي أثرت على الانتخابات.
بالمقابل، يمكن لنموذج Voice Engine من OpenAI إنشاء كلام يشبه الأصوات البشرية بشكل دقيق، ويُمكن استخدامه في ترجمة الصوت إلى لغات مختلفة وإنشاء محتوى صوتي متنوع للأغراض التعليمية وغيرها.
تشجع OpenAI شركائها على الامتثال لسياسات الاستخدام والحصول على موافقة المتحدث الأصلي قبل استخدام صوته، كما تقوم بإضافة علامة مائية غير مسموعة لتحديد الأصوات التي تم إنشاؤها باستخدام التقنية.