<?xml version="1.0" encoding="utf-8"?>
 <journal>
 <language></language>
 <journal_id_issn></journal_id_issn>
 <journal_id_issn_online></journal_id_issn_online>
 <journal_id_pubmed></journal_id_pubmed>
 <journal_id_pii></journal_id_pii>
 <journal_id_doi></journal_id_doi>
 <journal_id_isnet></journal_id_isnet>
 <journal_id_iranmedex></journal_id_iranmedex>
 <journal_id_magiran></journal_id_magiran>
 <journal_id_sid></journal_id_sid>

 <pubdate>
	<type>jalali</type>
	<year>1390</year>
	<month>2</month>
	<day>12</day>
 </pubdate>
 <pubdate>
	<type>gregorian</type>
	<year>2011</year>
	<month>5</month>
	<day>2</day>
 </pubdate>
 <volume>سوم</volume>
 <number>اول</number>

 <publish_type>online</publish_type>
 <publish_edition>1</publish_edition>
 <article_type>fulltext</article_type>

<articleset>
	<article>
	<language></language>
	<article_id_issn></article_id_issn>
	<article_id_issn_online></article_id_issn_online>
	<article_id_pubmed></article_id_pubmed>
	<article_id_pii></article_id_pii>
	<article_id_doi></article_id_doi>
	<article_id_isnet></article_id_isnet>
	<article_id_iranmedex></article_id_iranmedex>
	<article_id_magiran></article_id_magiran>
	<article_id_sid></article_id_sid>
	
	<title_fa>ارائه روشی مبتنی بر نرمال سازی اکوستیکی و خوشه بندی برای بهبود بازشناسی گفتار کودکان فارسی زبان</title_fa>
	<title>Improving Speech Recognition of Persian Children Based on Normalization and Clustering</title>
	<subject_fa/>
	<subject/>
	
	<content_type_fa></content_type_fa>
	<content_type></content_type>
	
	
	<abstract_fa>چکیده - بررسی کاربردهای بازشناسی گفتار نشان دهندۀ تفاوتهای طیفی در سیگنال های گفتار کودکان می باشد. این تنوع، باعث ایجاد مشکلاتی در بازشناسی خودکار گفتار کودکان می شود. تجربه نشان داده در صورتی که از دادۀ گفتار کودکان به عنوان ورودی در مدل های اکوستیکی استفاده شود که با گفتار بزرگسالان آموزش یافته اند، کارایی به اندازۀ قابل توجهی کاهش می یابد. به طور میانگین نرخ خطای کلمه برای بازشناسی گفتار کودکان دو تا چهار بار بیشتر از بزرگسالان است. میزان درستی بازشناسی گفتار در کودکان به عواملی مثل سن، جنسیت، فرکانس مبنایی و قد بستگی دارد. در این مقاله برخی از روش های افزایش کارایی بازشناسی گفتار کودکان شامل هنجارسازی طول محدودۀ صوتی (VTLN)، آموزش تطبیقی گوینده (SAT) و هنجارسازی گوینده بر اساس رگرسیون خطی با بیشترین درست نمایی محدود شده (CMLSN) مطرح و روش VTLN برای بهبود کارایی بازشناسی گفتار کودکان فارسی زبان پیاده سازی شده است. نهایتا روشی برمبنای ترکیب روشهای هنجارسازی و خوشه بندی برای بازشناسی گفتار کودکان پیشنهاد شده است. با استفاده از خوشه بندی گفتار ورودی و تخصیص آن به مدل مناسب، درستی بازشناسی به طور متوسط 50% افزایش می یابد.</abstract_fa>
	<abstract>There are high variability in acoustic features of children\&amp;amp;#039;s speech signals compared to adults\&amp;amp;#039; which is the causes some problems in automatic recognition of children\&amp;amp;#039;s speech. Using children\&amp;amp;#039;s speech as input in acoustic models trained by adults\&amp;amp;#039; speech reduces performance significantly. Error rate for children speech recognition is about 2 to 4 times more than adults\&amp;amp;#039;. The recognition rate depends on many factors like age, gender, fundamental frequency and height. In this paper some approaches for improving recognition performance including vocal tract length normalization (VTLN), speaker adaptive training (SAT) and Constrained MLLR based Speaker Normalization (CMLSN) are studied and VTLN is implemented to improve recognition of Persian children\&amp;amp;#039;s speech. Finally an approach based on combining normalization methods and clustering is proposed for recognition of children\&amp;amp;#039;s speech. Using clustering of input speech and assigning to appropriate model, recognition rate will improve about 50%.</abstract>

	<keyword_fa>بازشناسی گفتار کودکان، تبدیل صوت، مدل سازی تطبیقی، نرمال سازی گوینده، خوشه بندی گفتار.</keyword_fa>
	<keyword>بازشناسی گفتار کودکان، تبدیل صوت، مدل سازی تطبیقی، نرمال سازی گوینده، خوشه بندی گفتار.</keyword>
	<start_page>113</start_page>
	<end_page>0</end_page>
	<web_url></web_url>
	<web_url></web_url>
	<author_list>
	<author>
		<first_name></first_name>
		<middle_name/>
		<last_name></last_name>
		<suffix/>
		<affiliation></affiliation>
		<first_name_fa>قمرناز</first_name_fa>
		<middle_name_fa></middle_name_fa>
		<last_name_fa>تدین</last_name_fa>
		<suffix_fa/>
		<email></email>
		<code>37</code>
		<coreauthor>No</coreauthor>
		<affiliation_fa></affiliation_fa>
	</author>
	<author>
		<first_name>saeed</first_name>
		<middle_name/>
		<last_name>setayeshi</last_name>
		<suffix/>
		<affiliation></affiliation>
		<first_name_fa>سعید</first_name_fa>
		<middle_name_fa></middle_name_fa>
		<last_name_fa>ستایشی</last_name_fa>
		<suffix_fa/>
		<email></email>
		<code></code>
		<coreauthor>No</coreauthor>
		<affiliation_fa></affiliation_fa>
	</author>
	</author_list>
</article>
</articleset></journal>
  
