문리더에서 삼성TTS쓸 때 필터 : 클리앙

위치는 기타설정/TTS 설정/TTS 문자 필터


아래설정은 괄호안의 한자,문리더에서삼성TTS쓸때필터클리앙 일본어, 영문등은 스킵하고 길게 늘어지는 의성어는 짧게 줄임.

말줄임표와 쉼표는 마침표로 치환하고 #, *은 스킵 또는 하나로 줄이고 몇몇 기호문자는 스킵.


아래 내용을 확장자는 .ttsfilter로 이름은 현재 불러들인 텍스트이름으로 저장하고 TTS문자필터에서 불러오기. 또는 이름을 임의로 정하고 경로명을 정확히 입력하고 불러오기.

필요한 부분만 쓴다면 #->#은 제외하고 하나씩 입력해도 됨.


한자와 영문등 많은 부분에 정규표현식을 사용했으니 필터에 정규식사용에 체크.


[—ㅡ_]|[ㅠㅜ]|ㅂㅅ|-$|\[|\.?\]#->#

[♥♣♠◀▶★♪♫♬]#->#

;|……?\.?#->#,

([\.\* ?]){ 2,}#->#$1

- ?(\D)#->#$1

^#\d+화?#->#

\(([一-鿕]|[㐀-䶵]|[豈-龎]).*?\)#->#

\([a-zA-Z].*?\)#->#

\([ぁ-ー].*?\)#->#

(가){ 3,}|(과){ 3,}|(구){ 3,}#->#$1$1$1$2$2$2$3$3$3

(기){ 3,}|(두){ 3,}|(드){ 3,}#->#$1$1$1$2$2$2$3$3$3

(라){ 3,}|(르){ 3,}|(버){ 3,}#->#$1$1$1$2$2$2$3$3$3

(아){ 3,}|(어){ 3,}|(에){ 3,}#->#$1$1$1$2$2$2$3$3$3

(오){ 3,}|(우){ 3,}|(으){ 3,}#->#$1$1$1$2$2$2$3$3$3

(이){ 3,}|(저){ 3,}|(지){ 3,}#->#$1$1$1$2$2$2$3$3$3

(콰){ 3,}|(타){ 3,}|(터){ 3,}#->#$1$1$1$2$2$2$3$3$3

(투){ 3,}|(하){ 3,}|(그){ 3,}#->#$1$1$1$2$2$2$3$3$3

(땡){ 3,}|(다){ 3,}|(탕){ 3,}#->#$1$1$1$2$2$2$3$3$3

No\.#->#넘버

LV\.#->#레벨.

(\d+)[kK][gG] #->#$1킬로그램

(\d+)[kK][mM] #->#$1킬로미터

[kK][mM]([가-힣])#->#킬로미터$1

([가-힣])[kK][mM]#->#$1킬로미터

 

한글 뒤에 괄호없이 바로 붙어 한자가 나오는 경우 한자는 스킵


([가-힣])([一-鿕]|[㐀-䶵]|[豈-龎])+#->#$1



커뮤니티에서 쓰는 초성줄임말등 


ㄱㄱ+#->#,고고,

ㅇㅇ+#->#,응,

ㅈㄴ#->#졸라

ㅅㅂ#->#,스바,

ㄹㅇ#->#,리얼,

ㄴㄴ#->#,노노,

ㅇㅈ#->#,인정,

ㅅㄱ#->#,수고,

ㅋㅋ+#->#,크크,

ㅎㅎ+#->#,흐흐,

ㄷㄷ+#->#,덜덜,

ㅁㅊ#->#,미친,

ㅉㅉ#->#,쯔쯔,

ㄴㅈ#->#,노잼,

ㅎㄷ#->#후덜

ㅎㄷㄷ#->#,후덜덜,

 


삼성 TTS에서 분수와 분기를 자연스럽게 읽게하고 숫자사이 쉼표를 스킵해서 한덩어리로 취급하고 1마리 1명등과 같이 아리비아 숫자와 단위명사를 섞어 쓴 경우 우리말숫자 표현과 한자어 숫자 표현을 구분하게 하는 항목. 로마자 숫자를 영어식으로 읽게 하는 항목중 Ⅰ,Ⅴ는 영문자 I,V와는 구분하여 입력해야 됨.


(\d),(\d),?#->#$1$2

([1-4])/4 ?분기#->#$1사분기

([1-9])/([1-9][0-9])#->#$2분지$1

([0-9]):([0-9])#->#$1대$2

(\d)([가-힣])#->#$1~$2

(\d)~([개시월배명살달병])#->#$1$2

(\d)~(마리|번째|공기|가지)#->#$1$2

(\d)(개국|개월|대대)#->#$1~$2

1달[^라러]#->#한달

2달[^라러]#->#두달

3달[^라러]#->#세달

 119 ?([가-힣])#-># 일일구$1 

 911 ?([가-힣])#-># 구일일$1

Ⅰ#->#원

Ⅱ#->#투

Ⅲ#->#쓰리

Ⅳ#->#포

Ⅴ#->#파이브



삼성 TTS의 일부 TTS음성에서 경음과 연음 버그를 피하기위해 추가한 항목.


간략#->#갈략

6월#->#유월

10월#->#시월

것이리라#->#거시리라

없어#->#업서

없었#->#업섰

권력#->#궐력

붙인#->#부친

붙이#->#부치

붙여#->#부쳐

뱉어#->#배터

뱉었#->#배텄

짙어#->#지터

없앨#->#업샐

없애#->#업새

곤란#->#,골란

헛웃음#->#허두슴

웃음#->#우슴

집터#->#집 터

 못이([기겨긴겼길])#-># 못 이$1

([볼줄])게\.#->#$1께.

짓이([겨겼])#->#진니$1

아랫입술#->#아랫 입술



삼성 TTS의 추가음성에서 고,지로 끝나는 말에서 음성이 길게 늘어지다가 끊기는 버그를 피하기 위한 항목. 기본음성에선 제거해야 자연스럽게 나옴.


거라고[\.!\?,]#->#거라 고.

([해어])야지[\.!\?,]#->#$1야 지.


원문:  https://ntxlds.blogspot.com/2022/03/tts.html

모두의공원