Nhận diện giọng nói tiếng việt

Bạn vẫn xem phiên bản rút gọn của tài liệu. Coi và cài ngay bản đầy đủ của tư liệu tại phía trên (2.33 MB, 99 trang )


Bạn đang xem: Nhận diện giọng nói tiếng việt

Trang | 1 c Lung  Tôn Thanh Hùng CHƯƠNG 1. TỔNG quan 1.1. Giới thiệu đề tài Đề tài này mang tên “Nghiên cứu vớt về dìm dạng giọng nói tiếng Việt và áp dụng trong điều khiển”. Để thực hiện được bài toán nhận dạng giọng nói, ta nên xây dựng một hệ thống gọi là hệ thống nhân dạng tiếng nói tự động hóa (Automatic Speech Recognition -ASR), đó là hệ thống chuyển đổi chuỗi âm nhạc tiếng nói thành chuỗi từ. Vấn đề xây dựng một hệ thừa nhận dạng giờ đồng hồ nói không phải là một công việc đơn giản, yên cầu nhóm trở nên tân tiến phải am hiểu các kỹ thuật, kim chỉ nan từ các kiến thức khác nhau như: âm học - đồ gia dụng lý, ngữ âm học, ngôn từ học, kim chỉ nan xác suất thống kê, thứ học, trí óc nhân tạo, … Trên chũm giới, những nhóm phân tích đã cải tiến và phát triển thành công hệ dìm dạng tiếng nói cho những ngôn ngữ lớn như: giờ Anh, giờ đồng hồ Trung Quốc, giờ Nhật, … nhưng giải pháp nhận dạng đến tiếng Việt vẫn còn đấy nhiều mặt hạn chế. 1.2. Các phân tích có liên quan đến khóa luận 1.2.1. Trên vắt giới giao tiếp người-máy là một nghành nghề dịch vụ nghiên cứu bự và khó nhưng lại có nhiều ứng dụng thực tiễn. Giờ nói là một phương tiện tiếp xúc tự nhiên duy nhất của con bạn và bởi vì vậy, nghiên cứu để trang bị tính rất có thể hiểu ngôn ngữ của con người, hay nói một cách khác là nhận dạng giờ đồng hồ nói tự động hóa (Automatic Speech Recognition –ASR), đã từng qua quá trình 70 năm phát triển. Những cố gắng nỗ lực nghiên cứu thứ nhất về ASR đang được tiến hành trong những năm 50 với ý tưởng chính là dựa trên ngữ âm. Vì chưng kĩ thuật xử lí dấu hiệu số tương tự như khả năng máy vi tính còn giới hạn, các khối hệ thống nhận dạng cơ hội đó chỉ tập trung khai thác đặc trưng phổ cộng hưởng (spectral resonances) đối với các nguyên âm của tín hiệu, sau thời điểm đi qua các bộ thanh lọc tương tự. Trong quy trình này, tất cả các khối hệ thống đáng chăm chú như: hệ thống nhận dạng ký số rời rộc rạc của Bell-lab (1952), bộ nhận dạng 13 âm vị của trường đh College–Anh (1958) <1, p. 8>… vào thập kỉ 1960, điểm đáng ghi dìm nhất là ý tưởng của người sáng tác người Nga, Vintsyuk khi ông đề xuất cách thức nhận dạng giờ đồng hồ nói dựa vào qui hoạch động theo thời gian (Dynamic Time Warping –DTW) <2, phường 1>. Đáng tiếc là mãi đến
những năm 1980, cách thức này new được trái đất biết đến. Cuối những năm 1960, Reddy sinh hoạt trường đại học CMU (Mỹ) đã lời khuyên những ý tưởng trước tiên về nhấn Trang | 2 c Lung  Tôn Thanh Hùng dạng tiếng nói liên tiếp bằng kĩ thuật khắc ghi đường đi cùng truy lốt lùi tìm công dụng <2, phường 2>. Đến trong thời gian 70, nghiên cứu và phân tích về dìm dạng ngôn ngữ đã những bước đầu tiên thu được các hiệu quả khích lệ, làm căn nguyên cho những cách tân và phát triển sau này. Trước hết là vấn đề nhận dạng từ rời rạc được xử lý dựa trên phát minh của các nhà khoa học fan Nga với Nhật. Velichko với Zagoruyko (ở Nga) là những người dân đi đón đầu trong bài toán áp dụng ý tưởng phát minh về phân lớp mẫu đến ASR. Sakoe cùng Chiba (Nhật) đề xuất các kỹ năng sử dụng phương pháp qui hoạch động. Với Itakura, trong thời gian ở Bell-lab, đã gửi ra cách thức mã hoá dự báo con đường tính (Linear Predictive Coding –LPC) làm cho tiền đề cho câu hỏi áp dụng các tham số phổ LPC vào ASR. Các hệ thống ASR đáng chăm chú của tiến độ này gồm: Harpy cùng Hearsay-II của trường đại học CMU-Mỹ, khối hệ thống HWIM của BBN… <2, phường 2> nghiên cứu và phân tích về ASR vào thập kỉ 80 ghi lại phép dịch chuyển trong phương pháp luận: từ giải pháp tiếp cận tương quan mẫu sang biện pháp tiếp cận sử dụng quy mô thống kê. Ngày nay, hầu như các khối hệ thống ASR hầu hết dựa trên mô hình thống kê được trở nên tân tiến ở thập kỉ này, với những cách tân ở thập kỉ 90. Trong số những phát minh quan trọng nhất sinh hoạt thập kỉ 80 là quy mô Markov ẩn (Hidden Markov mã sản phẩm –HMM). Mặc dù HMM được áp dụng thành công ở một số trong những phòng LAB (chủ yếu hèn là IBM cùng viện nghiên cứuthuộc bộ Quốc chống Mỹ) nhưng yêu cầu đợi cho vài năm tiếp theo đó, mô hình này new được xuất bản và thông dụng trên thay giới. Kế bên ra, nhị đề xuất quan trọng khác của tiến độ này là tổng hợp Cepstrum và quy mô ngôn ngữ:  Furui khuyến nghị sử dụng tổ hợp của các hệ số phổ cùng rất đạo hàm bậc 1 và bậc 2 của chúng, như là những đặc trưng cơ sở đến ASR. Cách thức này cho dù được khuyến cáo cuối trong thời điểm 70 nhưng đang không được áp dụng suốt một thời gian dài. Ngày nay, phần nhiều các khối hệ thống nhận dạng giờ nói hồ hết
sử dụng tổ hợp đặc trưng này. <2, p. 4>  phần đông nhà công nghệ thuộc công ty IBM là những người dân đi mũi nhọn tiên phong trong việc phát triển quy mô ngôn ngữ (Language model –LM). Đây là 1 trong công cụ hiệu quả trong vấn đề lựa chọn chuỗi từ nhận dạng cùng đã được áp dụng thành công trong toàn bộ các hệ thống ASR ngày nay, nhất là các khối hệ thống nhận dạng giờ đồng hồ nói liên tiếp với bộ từ vựng lớn. Trang | 3 c Lung  Tôn Thanh Hùng Các khối hệ thống ASR thành lập và hoạt động trong thời gian này có thể kể đến: khối hệ thống Sphinx của trường đh CMU, Byblos của người tiêu dùng BBN, Decipher của viện SRI, và các hệ thống khác của Lincoln Labs, MIT với AT&T Bell Labs. Thập niên 90 ghi dấn một số hiệu quả nghiên cứu mới trong nghành nghề phân lớp mẫu. Vắt thể, câu hỏi phân lớp theo mô hình thống kê (dựa bên trên luật quyết định Bayes), đòi hỏi cách thức ước lượng những phân tía cho dữ liệu, được đưa thành vấn đề tối ưu, bao gồm phép rất tiểu lỗi phân lớp bởi thực nghiệm. Sự đổi khác này về mặt thực chất xuất phát từ ý tưởng phát minh sau đây: mục tiêu của phân lớp là cực tiểu lỗi chứ không hề phải cung cấp hàm phân bố cân xứng với tài liệu nhận dạng. định nghĩa cực tiểu lỗi này đã làm nảy sinh một số kĩ thuật như cách thức huấn luyện đơn lẻ (Discriminative Training). Hai dạng điển hình của phép đào tạo này là: CME (Minimum Classification Error) và MMI (Maximum Mutual Information). Hiệu quả thực nghiệm cho biết thêm các phương pháp huấn luyện bắt đầu đưa ra hiệu quả nhận dạng xuất sắc hơn so với cách thức huấn luyện cực lớn xác suất trước đó. Ngoại trừ ra, nhấn dạng ngôn ngữ trong môi trường nhiễu cũng rất được quan tâm. Để nâng cao hiệu suất nhận dạng cho tài liệu nhiễu, một số trong những kỹ thuật đang được lời khuyên như: MLLR (Maximum Likelihood Linear Regression), PMC (Parallel mã sản phẩm Combination)… <2, phường 3> Cuối cùng, các ứng dụng được phát triển trong quy trình này gồm: khối hệ thống trả lời thông tin auto cho các chuyến bay (Air Travel Information Service –ATIS), hệ thống lưu lại các bản tin phạt thanh (Broadcast News Transcription System)…. Đến những năm đầu của núm kỷ 21, các nghiên cứu tập trung vào việc nâng cao
kết quả dấn dạng giờ nói, trải qua chương trình có tên gọi EARS (Effective Affordable Reusable Speech-to-tee8academy.com) <2, p. 3>. Tới thời khắc này, tiếng nói của một dân tộc được giả thiết là đã có thu âm trong môi trường bình thường, không bị ràng buộc bởi bất cứ điều kiện nào (các đk giả thiết trước đây thường bao hàm tiếng nói được thu trong chống sạch biện pháp âm và vày người bản xứ đọc). Đích hướng về của chương trình này là năng lực nhận dạng, cầm tắt và đưa ngữ các đoạn audio, giúp cho những người đọc hiểu nhanh nội dung của chúng cố vì bắt buộc nghe toàn bộ. Hiện tại nay, với những ngôn ngữ phổ biến như giờ Anh, giờ Pháp, tiếng Tây Ban Nha, các công trình phân tích về nhấn dạng giờ đồng hồ nói sẽ thu được những kết quả rất tốt, có không ít ứng dụng trong thực tiễn được thực hiện như: Trang | 4 c Lung  Tôn Thanh Hùng  Hệ thống tiếp xúc hỏi đáp thông tin tự động hóa qua điện thoại.  hệ thống truy vấn tin tức thoại.  khối hệ thống thông dịch tiếng nói của một dân tộc xuyên ngữ từ động.  những trạm kiểm soát, khối hệ thống điều khiển thực hiện tiếng nói.  các ứng dụng tiếng nói của một dân tộc trên sản phẩm di động. Về mặt kinh tế và yêu thương mại, technology nhận dạng ngôn ngữ đã biến đổi cách nhỏ người shop với hệ thống và thiết bị, không còn gò bó trong phương thức tương tác truyền thống cuội nguồn (như thông qua bàn phím của dòng sản phẩm tính hay điện thoại) mà gửi sang liên tưởng trực tiếp bằng giọng nói. Trong môi trường kinh tế cạnh tranh, các ứng dụng từ từ đã chuyển sang tích phù hợp tính năng liên tưởng âm thanh. Việc ứng dụng và khách hàng hàng có thể tương tác với nhau thông qua âm thanh không tức là loại quăng quật giao diện đồ vật họa truyền thống mà nó cung cấp thêm một cách truy vấn thông tin và dịch vụ tiện lợi, thoải mái và tự nhiên hơn. Về mặt nghiên cứu và phân tích khoa học, các hệ thống nhận dạng giờ đồng hồ nói bây giờ đều dựa trên phương thức thống kê và so khớp mẫu. Phương pháp này đòi hỏi các tri thức về ngữ âm cùng một lượng lớn dữ liệu huấn luyện, bao hàm cả dạng âm thanh và dạng văn bản, để đào tạo và huấn luyện bộ dấn dạng. Lượng dữ liệu huấn luyện càng lớn, cỗ dạng dạng
càng có rất nhiều khả năng giới thiệu kết quả đúng mực hơn. 1.2.2. Trong nước tại Việt Nam, có 2 nhóm nghiên cứu và phân tích chính về bài toán nhận dạng giờ nói liên tục với bộ từ vựng mập (LVCSR). Nhóm thứ nhất thuộc Viện công nghệ Thông tin vày PGS. Lương chi Mai đứng đầu, với cách thức ANN và giải pháp CSLU <3> được sử dụng. Nhóm trang bị hai thuộc trường Đại học khoa học Tự nhiên tp hcm do PGS. Vũ hải quân đứng đầu, với phương pháp HMM và nguyên tắc HTK được sử dụng, những nghiên cứu của group tập trung vào việc truy vấn thông tin tiếng Việt, thừa nhận dạng giờ nói, hệ thống giao tiếp giữa tín đồ và máy, tìm kiếm kiếm bởi giọng nói, ko kể ra, gần đây có phân tích của LIG (Laboratoire Informatique de Grenoble) hợp tác với phòng thử nghiệm MICA ở thủ đô hà nội về sự khả đưa của các quy mô ngữ âm (acoustic mã sản phẩm portability). Trang | 5 c Lung  Tôn Thanh Hùng Ở vào nước còn có các đề tài liên quan như: “c chủ yếu t, sử dụng lượng hóa vector VQ, hạn chế về thừa nhận dạng tiếng nói liên tục. “Phát trin những kt qu tng hp, nhn dng câu lnh, chui s ting Vit liên tng n tho <4>, “ chính xác ca h thng mng neuron nhn dng ting Vi <5>, “  n dng lnh 10 ch s liên t  n tho của Viện technology thông tin sử dụng công thay CSLU <6>, cách thức mô hình Artificial neural network - ANN, giải mã bằng thuật toán Viterbi, cơ sở dữ liệu mẫu âm học tập của CSLU. 1.3. Kim chỉ nam của khóa luận kim chỉ nam chung nhất: search hiểu, vận dụng các kiến thức về dấn dạng ngôn ngữ đề xây cất mộ lịch trình nhận dạng tiếng nói của một dân tộc tiếng Việt và ứng dụng trong điều khiển thiết bị mô phỏng và thiết bị thật. Phương châm chi tiết: a. Tìm hiểu các tư tưởng có liên quan đến hệ dấn dạng tiếng nói để gia công rõ
hơn một số yếu tố đặc trưng trong việc sử dụng công ráng hỗ trợ. B. Search hiểu cách thức cài đặt công cụ cung ứng xây dựng hệ thừa nhận dạng tiếng nói. C. Mày mò xây dựng quy mô âm học, quy mô ngôn ngữ thích hợp cho giờ đồng hồ Việt. D. Phát hành chương trình tế bào phỏng, thực nghiệm, test nghiệm thân các quy mô với nhau từ bỏ đó chuyển ra kết luận và dấn xét. 1.4. Phạm vi giải quyết bài toán dấn dạng những câu lệnh điều khiển và tinh chỉnh cơ bản qua 2 thực nghiệm (demo) kia là:  Điều khiển trình để ý web Google Chrome bằng giọng nói với tổ hợp câu lệnh điều khiển gồm 45 từ.  Điều khiển mô hình xe điều khiển bằng giọng nói với tổ hợp những câu lệnh gồm 24 từ. Bởi thời gian, và số lượng giới hạn phạm vi khóa luận đề xuất demo chỉ mới tiến hành nhận dạng thành công với một, hai người dùng (sinh viên thực hiện khóa luận), xác suất nhận dạng (thực tế) đúng sấp xỉ 90%. Trang | 6 c Lung  Tôn Thanh Hùng 1.5. Phần đa điểm nỗi bật của khóa luận Khóa luận được trình diễn với đề mục rõ ràng và lượng kiến thức vừa đủ, giúp các người phát triển sau này dễ dãi tiếp cận và phát triển khóa luận. Triển khai demo không chỉ là trên máy tính mà còn có cả điều khiển và tinh chỉnh cho thiết bị thể thật. Tuy về nguyên tắc là hoàn toàn giống nhau, nhưng lại em đã nỗ lực thực hiện triển khai trên những một ngôi trường và áp dụng để tăng tính thực tiển cũng như xác thực của đề tài. Không giống với những đề tài nhấn dạng trước đa phần chỉ mang ý nghĩa demo dìm dạng. 1.6. Cấu tạo khóa luận  trình diễn tổng quan: reviews về đề tài, xác định mục tiêu những vấn đề mà đề tài đề nghị giải quyết, số lượng giới hạn phạm vi đề tài, xác định phương thức giải
quyết và ở đầu cuối chỉ ra những điểm nổi bật của đề tài.  trình diễn cơ sở triết lý bao gồm: triết lý cơ bạn dạng về âm học, ngữ âm học, đặc điểm trong giờ đồng hồ Việt, các kiến thức cơ phiên bản để xây đắp và sử dụng một hệ dấn dạng giờ đồng hồ nói. Cơ sở định hướng về rút trích đặc trưng, giữa những khái niệm quan trọng đặc biệt trong các hệ nhận dạng tiếng nói. Triết lý về mô hình Hidden Markov mã sản phẩm (HMM). Bao gồm khái niệm, các thuật toán liên quan, ý nghĩa của HMM trong một hệ thừa nhận dạng giờ đồng hồ nói. 3: Giới thiêu các khái niệm cơ bản, đặc biệt của hai Framework hổ trợ chế tạo một hệ dìm dạng tiếng nói phổ cập nhất bây giờ là HTK, Sphinx 4. Khóa luận này sử dụng Sphinx 4 để xây cất chương trình test thực nghiệm. Chương 4: Trình bày chi tiết quá trình thiết lập Sphinx4, thu âm, xây dựng cỗ huấn luyện, tiến hành huấn luyện, giải thích hiệu quả huấn luyện, thực hiện thử nghiệm đối chiếu HTK với Sphinx ở đầu cuối là gây ra chương trình demo. : nêu ra kết luận, trình bày những tác dụng đạt được, đầy đủ điểm còn hạn chế, tương tự như kinh nghiệm đúc kết sau quy trình thực hiện tại khóa luận, từ đó nêu lên những hướng cải thiện, phân tích và phạt triền. Trang | 7 c Lung  Tôn Thanh Hùng CHƯƠNG 2. CƠ SỞ LÝ THUYẾT 2.1. Tổng quan tiền Về Âm Học với Tiếng Nói 2.1.1. Âm học tập 2.1.1.1. Có mang Khi bao gồm nguồn phạt ra âm thanh (như giờ trống, giờ nhạc cụ, tiếng nói), ta vẫn nghe và cảm nhận được music phát ra. Vật tạo ra được âm thanh có cách gọi khác là nguồn phạt âm, âm thanh chính là sự xê dịch cơ của các thành phần vật chất trong một môi trường thiên nhiên nào đó viral và mang đến tai ta và khi ấy ta cảm giác được âm thanh. Trong môi trường không tồn tại vật chất tồn tại như chân không, không có dao động song cơ cho nên vì thế cũng không tồn tại âm thanh tồn tại. Trong cuộc sống xã hội, âm nhạc là phương
tiện giao tiếp, truyền đạt thông tin phổ biến và xấu hiện từ tương đối lâu đởi tuyệt nhất của nhỏ người. Khi nghiên cứu về âm thanh, người ta thường lưu ý đến 2 sệt điểm: đặc thù vật lý và đặt trưng sinh học. 2.1.1.2. Màn trình diễn tín hiệu âm nhạc trong miền thời hạn và tần số. Thông thường, fan ta sử dụng hàm toán học tập x(t) để biểu diễn âm thanh trong miền thời gian. Trong đó: - t: thời hạn - x: biên độ biến hóa thiên, hay còn được gọi là ly độ. Như vậy, ta có thể biểu diễn x(t) bằng đồ thị theo thời gian.Đặt x(t) = A.sin t = A. Sin 2F0t 2.1 Biu din tín hiu âm thanh Trang | 8 c Lung  Tôn Thanh Hùng Phổ tính hiệu: là cách biểu diễn các thành phần kết cấu nên x(t) theo tần số. Với biểu đạt Sin nói trên, đồ thị phổ là 1 trong vạch tất cả cao độ là A tại điển bao gồm tần số F0. Ta nói chính là phổ vạch. Trong thực tế, với x(t) bất kỳ, biến hóa thiên, không tuần hoàn, bạn ta sẽ sử dụng phân tích Fourier để đo lường và thống kê phổ tín hiệu. Khi đó, ta gồm phổ tiếp tục X(). 2.1.1.3. Các loại âm thanh Những giao động cơ nhưng mà con tín đồ nghe được gọi music (sound). Âm thanh hoàn toàn có thể biểu diễn theo thời gian, song cũng rất có thể biểu diễn theo tần số do rất có thể phân tích một tín hiệu music thành tổ hợp những thành phần tần số khác biệt (Chuỗi Fourier, tích phân Fourier). Hoặc nói một cách đơn giản thực tiễn hơn,
một âm thanh rất có thể là tổ hợp từ không ít đơn âm, từ rất nhiều nhạc cụ, mà mỗi cái bao gồm một tần số dao động nhất định. Dải tần số nghe được là từ 20 Hz - 20000 Hz. Rất âm là âm giao động ngoài 20000 Hz. Hạ âm là những âm xê dịch dưới trăng tròn Hz. Tai fan không nghe được siêu âm cùng hạ âm.  ngôn ngữ (voice, speech) là âm thanh phát ra từ miệng người, được tương truyền trong không khí cho tai fan nghe . Dải tần số của giờ đồng hồ nói đầy đủ nghe rõ là tự 300 Hz đến 3500 Hz, là dải tần tiêu chuẩn áp dụng mang đến điện thoại. Còn dải tần tiếng nói có rất tốt có thể là từ bỏ 200 Hz-7000 Hz, áp dụng cho những ampli hội trường.  Âm nhạc (music) là âm thanh phát ra từ những nhạc cụ. Dải tần số của music là từ đôi mươi Hz cho 15000 Hz.  giờ đồng hồ kêu là âm nhạc phát ra trường đoản cú mồm động vật. Giờ đồng hồ của Cá Heo (dolphins) là 1 trong những loại music trong dảy tần số 1-164 kHz, của con Dơi (bats) trăng tròn - 115 kHz, của Cá Voi (whale) 30-8000 Hz. (Cần xác minh lại số liệu).  Tiếng rượu cồn là âm nhạc phát ra trường đoản cú sự va va giữa những vật. Tỉ dụ tiếng va chạm của 2 dòng cốc, tiếng va va của cánh cửa, giờ đồng hồ sách rơi.  tiếng ồn ào (noise) là số đông âm không muốn muốn. Nhìn toàn diện lại, xét về phương diện biểu thị và sự cảm thụ của tai người, tất cả hai nhiều loại âm:  tuần hoàn bao gồm tiếng nói, âm nhạc  ko tuần trả như biểu thị tạp nhiễu, một vài phụ âm tắc xát như sh, s. Trang | 9 c Lung  Tôn Thanh Hùng 2.1.1.4. Đơn vị đo âm thanh Người ta thấy rằng con tín đồ cảm nhận độ to của âm thanh không tỉ trọng thuận với cường độ music mà theo hàm số mũ. Bel = 10lg P2/P1. (Phát âm là Ben) decibel = 20lg I2/I1 (Phát âm là Đề xi ben)
2.1.2. Tiếng nói của một dân tộc Tiếng nói là music phát ra từ miệng (người). Phân tích tiếng nói gồm: máy bộ phát âm của con người. Thụ cảm âm thanh của tai người. Phân nhiều loại tiếng nói. Bộ máy phát âm của con người gồm:  Phổi đóng vai trò là dòng bơm ko khí, tạo tích điện hình thành âm.  Đôi dây thanh (vocal fold, vocal cord)là nhị cơ thịt làm việc trong cuống họng, tất cả hai đầu bám nhau, còn hai đầu giao động với tần số cơ phiên bản là Fo, giờ Anh call là pitch, fundamental frequency. Fo của nam giới nằm trong khoảng 100-200 Hz, của nữ giới là 300-400 Hz, của trẻ nhỏ là 500-600 Hz.  Thanh quản cùng vòm miệng: c cng, tạo nên sự phân biệt tần số lúc tín hiệu xấp xỉ từ đôi dây thanh phân phát ra. Đáp ứng tần số của hốc công hưởng này có khá nhiều đỉnh cùng hưởng khác biệt được điện thoại tư vấn là những formant.  Miệng vào vai trò phạt tán âm thanh ra ngoài.  Lưỡi biến đổi để tạo thành tần số formant không giống nhau.  các âm khác nhau là vì vị trí tương đối của formants. Phân các loại tiếng nói theo thanh:  Âm hữu thanh (voiced, giờ đồng hồ Pháp là voisé) là âm lúc phát ra có sự xê dịch của song dây thanh, vì thế nó tuần hoàn với tần số Fo. Bởi vậy phổ của nguyên âm là phổ vạch, khoảng cách giữa các vạch bằng chính Fo.  Âm vô thanh (unvoiced, giờ đồng hồ Pháp là non voisé) phạt ra khi đôi dây thanh không dao động. Ví dụ phần cuối của phát âm English, chữ sh đã cho ra âm xát. Phổ tín hiệu có dạng là nhiễu trắng, phổ phân bổ đều. Phân loại tiếng nói: Trang | 10 c Lung  Tôn Thanh Hùng  Nguyên âm (vowel) là âm phát ra rất có thể kéo dài. Tất cả nguyên âm gần như là âm hữu thanh, nghĩa là tuần hoàn và khá bình ổn trong một đoạn thời hạn vài chục ms.
 Phụ âm (consonant) là âm chỉ vạc ra một nhát, không kéo dãn dài được. Tất cả phụ âm hữu thanh và phụ âm vô thanh. Thanh điệu của giờ đồng hồ Việt tương ứng với những dấu: ko dấu, huyền, hỏi, ngã, sắc, nặng lúc viết. Phân tích lắp thêm móc cho thấy thanh điệu là sự biến đổi Fo, tần số cơ bản pitch, trong quá trình phát âm những nguyên âm cùng tai tín đồ cảm nhận được. Giờ đồng hồ Việt gồm 6 thanh mô tả sự phong phú và độc đáo, trong khi tiếng trung quốc có 4 thanh. Tuy vậy cư dân một vài vùng sinh hoạt Việt Nam hoàn toàn có thể không minh bạch dấu ? với dấu ~ đề nghị hay viết sai chính tả. Giọng bổng (high voiced pitch, hay high pitched) giỏi giọng trầm (low voiced pitch) là Fo cao giỏi thấp. Bởi thế Fo nhập vai trò rất đặc biệt quan trọng trong cảm nhận, trong thụ cảm âm thanh của bé người. Giờ đồng hồ bổng tốt tiếng trầm tương xứng với dải tần số cao hay thấp. Vào thợc tế tín đồ ta dùng loa trầm là loa loa bass tốt loa sub woofer, loa tép hay loa bổng tương ứng với loa say mê ứng phát các âm vào vùng tần số cao, treble. 2.2. Hệ thống Ngữ Âm tiếng Việt 2.2.1. Đặc điểm của giờ Việt không giống với một vài ngôn ngữ khác như tiếng Anh, Pháp …, giờ đồng hồ Việt là ngôn ngữ đơn âm tiết, có nghĩa là các từ lúc viết ra chỉ hiểu lên thành một tiếng, không tồn tại từ làm sao (thuần Việt) phân phát âm từ 2 tiếng trở lên. Một tự có kết cấu gồm 2 phần là: nguyên âm V (vowel) với phụ âm C (consonant) với được phối hợp theo 3 phương pháp để tạo đề nghị từ trong giờ đồng hồ Việt: - C+V (phụ âm + nguyên âm). Ví dụ: ba, mẹ, đi - C+V+C (phụ âm + nguyên âm + phụ âm). Ví dụ: bàn, con, muốn - V+C (nguyên âm + phụ âm). Ví dụ: an, ông, én Trong giờ đồng hồ Việt, ko kể 2 thành phần đó là nguyên âm, phụ âm, còn tồn tại các nhân tố khác giúp cho Việt phân một số loại trong âm huyết trở nên ví dụ như nhị vừa lòng âm, tam đúng theo âm, phụ âm đơn, phụ âm kép. Lúc học tiếng Việt, ngay từ đọc đề xuất học thuộc các nguyên âm, phụ âm, nhị hòa hợp âm, tam hợp âm, phụ âm đơn, phụ âm kép, quy tác

*
kỹ thuật nhấn dạng tiếng nói và ứng dụng trong điều khiển và tinh chỉnh 5 836 13

Xem thêm: Top 20 Cây Sung Bonsai Mini Đẹp Nhất Của Hội Chỉ Sung Việt Nam Fb

*
phân tích về quality dịch vụ mạng IP cùng ứng dụng nâng cấp chất lượng vào dịch vụ clip conference 10 638 0

*
phân tích về thừa nhận dạng chữ in tiếng việt 55 527 0
*
nghiên cứu và phân tích nuôi cấy tế bào rìa giác mạc và áp dụng trong điều trị một số tổn thương giác mạc 85 823 2
*
nghiên cứu và phân tích về cỗ khuếch đại ghép lai hfa và vận dụng vào con đường cáp quang vtn 80gbs nortel vih - đng 85 833 7
*
LUẬN VĂN: NGHIÊN CỨU VỀ NHẬN DẠNG CHỮ IN TIẾNG VIỆT pdf 55 448 0
*
phân tích nuôi ghép tế bào rìa màng mắt và ứng dụng trong điều trị một số trong những tổn thương giác mạc 120 503 0
*
Nghiên cứu công nghệ nhận dạng tiếng nói tiếng việt và vận dụng 119 2 12
*
NHẬN DẠNG GIỌNG nói TIẾNG VIỆT nhằm điều KHIỂN xe pháo lăn THÔNG MINH 46 1 38
*
Nghiên cứu chế tạo mực in nano kim loại và vận dụng trong technology in những mạch điện tử NCS. Đặng Thị Mỹ Dung 26 1 3