• English
    • العربية
  • English
  • تسجيل الدخول
  • جامعة قطر
  • مكتبة جامعة قطر
  •  الصفحة الرئيسية
  • الوحدات والمجموعات
  • المساعدة
    • إرسال الأعمال الأكاديمية
    • سياسات الناشر
    • أدلة المستخدم
    • الأسئلة الأكثر تكراراً
  • عن المستودع الرقمي
    • الرؤية والرسالة
عرض التسجيلة 
  •   مركز المجموعات الرقمية لجامعة قطر
  • المستودع الرقمي لجامعة قطر
  • أكاديمية
  • مساهمة أعضاء هيئة التدريس
  • كلية الهندسة
  • علوم وهندسة الحاسب
  • عرض التسجيلة
  • مركز المجموعات الرقمية لجامعة قطر
  • المستودع الرقمي لجامعة قطر
  • أكاديمية
  • مساهمة أعضاء هيئة التدريس
  • كلية الهندسة
  • علوم وهندسة الحاسب
  • عرض التسجيلة
  •      
  •  
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Generative emotional AI for speech emotion recognition: The case for synthetic emotional speech augmentation

    Thumbnail
    عرض / فتح
    اصدار الناشر (بإمكانك الوصول وعرض الوثيقة / التسجيلةمتاح للجميع Icon)
    اصدار الناشر (تحقق من خيارات الوصول)
    تحقق من خيارات الوصول
    التاريخ
    2023
    المؤلف
    Latif, Siddique
    Shahid, Abdullah
    Qadir, Junaid
    البيانات الوصفية
    عرض كامل للتسجيلة
    الملخص
    Despite advances in deep learning, current state-of-the-art speech emotion recognition (SER) systems still have poor performance due to a lack of speech emotion datasets. This paper proposes augmenting SER systems with synthetic emotional speech generated by an end-to-end text-to-speech (TTS) system based on an extended Tacotron 2 architecture. The proposed TTS system includes encoders for speaker and emotion embeddings, a sequence-to-sequence text generator for creating Mel-spectrograms, and a WaveRNN to generate audio from the Mel-spectrograms. Extensive experiments show that the quality of the generated emotional speech can significantly improve SER performance on multiple datasets, as demonstrated by a higher mean opinion score (MOS) compared to the baseline. The generated samples were also effective at augmenting SER performance. 2023 Elsevier Ltd
    DOI/handle
    http://dx.doi.org/10.1016/j.apacoust.2023.109425
    http://hdl.handle.net/10576/45566
    المجموعات
    • علوم وهندسة الحاسب [‎2428‎ items ]

    entitlement

    وثائق ذات صلة

    عرض الوثائق المتصلة بواسطة: العنوان، المؤلف، المنشئ والموضوع.

    • Thumbnail

      Speech Command Recognition in Computationally Constrained Environments with a Quadratic Self-Organized Operational Layer 

      Soltanian M.; Malik J.; Raitoharju J.; Iosifidis A.; Kiranyaz, Mustafa Serkan; Gabbouj M.... more authors ... less authors ( Institute of Electrical and Electronics Engineers Inc. , 2021 , Conference)
      Automatic classification of speech commands has revolutionized human computer interactions in robotic applications. However, employed recognition models usually follow the methodology of deep learning with complicated ...
    • Thumbnail

      Distinct neuropsychological correlates in positive and negative formal thought disorder syndromes: The thought and language disorder scale in endogenous psychoses 

      Nagels A.a Fahrmann; Stratmann M.a; Ghazi S.a; Schales C.a; Frauenheim M.a; Turner L.a; Hornig T.b; Katzev M.b; Muller-Isberner R.c; Grosvald M.d; Krug A.a; Kircher T.a; Kircher, Tilo... more authors ... less authors ( S. Karger AG , 2016 , Article Review)
      The correlation of formal thought disorder (FTD) symptoms and subsyndromes with neuropsychological dimensions is as yet unclear. Evidence for a dysexecutive syndrome and semantic access impairments has been discussed in ...
    • Thumbnail

      Decoding silent speech: a machine learning perspective on data, methods, and frameworks 

      Chowdhury, Adiba Tabassum; Newaz, Mehrin; Saha, Purnata; AbuHaweeleh, Mohannad Natheef; Mohsen, Sara; Bushnaq, Diala; Chabbouh, Malek; Aljindi, Raghad; Pedersen, Shona; Chowdhury, Muhammad E. H.... more authors ... less authors ( Springer Science and Business Media Deutschland GmbH , 2025 , Article Review)
      At the nexus of signal processing and machine learning (ML), silent speech recognition (SSR) has evolved as a game-changing technology that allows for communication without audible voice. This study offers a thorough ...

    مركز المجموعات الرقمية لجامعة قطر هو مكتبة رقمية تديرها مكتبة جامعة قطر بدعم من إدارة تقنية المعلومات

    اتصل بنا | ارسل ملاحظاتك
    اتصل بنا | ارسل ملاحظاتك | جامعة قطر

     

     

    الصفحة الرئيسية

    أرسل عملك التابع لجامعة قطر

    تصفح

    محتويات مركز المجموعات الرقمية
      الوحدات والمجموعات تاريخ النشر المؤلف العناوين الموضوع النوع اللغة الناشر
    هذه المجموعة
      تاريخ النشر المؤلف العناوين الموضوع النوع اللغة الناشر

    حسابي

    تسجيل الدخول

    إحصائيات

    عرض إحصائيات الاستخدام

    عن المستودع الرقمي

    الرؤية والرسالة

    المساعدة

    إرسال الأعمال الأكاديميةسياسات الناشرأدلة المستخدمالأسئلة الأكثر تكراراً

    مركز المجموعات الرقمية لجامعة قطر هو مكتبة رقمية تديرها مكتبة جامعة قطر بدعم من إدارة تقنية المعلومات

    اتصل بنا | ارسل ملاحظاتك
    اتصل بنا | ارسل ملاحظاتك | جامعة قطر

     

     

    Video