비정형 텍스트데이터 전처리시 파이썬과 아래아한글을 활용하는 방법 : 클리앙

안녕하세요?비정형텍스트데이터전처리시파이썬과아래아한글을활용하는방법클리앙

업무자동화 관련 블로그 "일상의코딩"을 운영하고 있는 일코입니다.


데이터분석 관련해서 조금 특이한(?) 튜토리얼 영상을 하나 제작했습니다.

클리앙에도 관심있는 분이 계실까 싶어 글을 남깁니다.


파이썬+한/글로 가장 강력한 문자열 가공 프로그램 만들기



파이썬과 함께 아래아한글을 위지윅 도구로 활용해 

비정형 문자열데이터 및 txt파일을 가공하는 짧은 튜토리얼입니다.

text_manipulation.mp4_20230101_182656.603.jpg



엔지니어링이나, 데이터 분석용으로 비정형 텍스트 전처리시 

파이썬 많이 사용하실텐데요. 

간편하면서도 강력한 문자열 메서드와 정규식, 

그리고 다양한 모듈 덕분에 비교적 수월하게 일련의 문자열 가공작업을 할 수 있지요.

text_manipulation.mp4_20230101_182805.454.jpg




그럼에도 간혹 복잡한 비정형 텍스트 데이터는, 

분량과 형태에 따라 시간도 무척 많이 걸립니다. 

작업이 상당히 까다로워져서 

'이럴 바에야 수작업 노가다가 낫겠다!' 싶은 경우도 종종 있을 거고요.

text_manipulation.mp4_20230101_182747.280.jpg



그런데 아래아한글은 

키보드와 마우스로 입력할 수 있는 거의 모든 조작을 API로 제공해주고, 

결과를 화면에 실시간으로 반영해 주는 덕분에, 

간편하면서도 엄청난 자유도로 

위지윅처럼문자열을 조작할 수 있게 도와줍니다. 

영상에서 확인해보세요.



참고로 본 영상은 파이썬과 아래아한글을 통해 

동영상의 영문 스크립트를 srt포맷의 자막파일 포맷으로 직접 변환하는 예제와, 

그에 사용된 매크로 및 함수를 상세하게 설명하는 20분 분량의 초급 튜토리얼입니다.

text_manipulation.mp4_20230101_182723.744.jpg



파이썬+한/글로 가장 강력한 문자열 가공 프로그램 만들기


새해 복 많이 받으시고, 🙆

행복한 하루 되세요🐰📈😍 


일코 드림


모두의공원