TTS

포스트: 56|아이템:TTS(9)
Tags

Posts

56 posts

유튜브 주소를 입력하면 2인 팟캐스트 음성으로 만들어주는 구글 노트북 LM에 놀라다

사진은 권력이다|2025년 5월 2일|사진

STT, TTS를 구분할 줄 아는 분이라면 AI를 잘 활용하는 분이라는 판단이 습니다. 왜냐하면 이 둘은 현재 AI로 생산하는 콘텐츠에서 아주 중요한 역할을 합니다. STT는 말을 텍스트로 변환해 주는 기술로 자동 자막 형성에 사용하며 TTS는 오래된 기술이지만 최근 AI에 의해 보다 자연스러워진 텍스트를 말로 변환해 주는 인공 성우 역할을 합니다. 유튜브 영상을 요약해서 2인 대화식 팟 캐스트로 만들어주는 구글 노트북 LM 오픈 AI가 AI 서비스를 가장 잘한다고 생각하지만 구글은 다양한 AI 서비스를 선보이고 있어서 다양성에서는 구글이 더 낫습니다. 구글은 노트북 LM을 선보였습니다. 마인드맵이나 문서 및 논문 분석을 도와주는 서비스입니다. 복잡한 정보를 이해하기 편한 탐색 도구입니다. 예를 들어서 논문이 담긴 PDF 파일이나 영문 자료가 올라온 URL을 입력한 후에 그 긴 내용을 다 읽을 수 없을 때 그냥 URL을 업로드한 후 그 내용을 AI와 채팅하면서 알아가는 것이죠. 그런데 이 구글 노트북LM이 업그레이드를 하면서 한국어 음성 요약 서비스를 시작했습니다. 사용하면서 이게 가능한가 할 정도로 엄청난 기능이네요. 먼저 이걸 들어보세요. 두 AI 음성대화인데 말 안 하면 그냥 팟 캐스트로 이해하실 겁니다. 실제로 너무 자연스러워서 깜짝 놀랐네요. 그럼 이건 어떻게 만들었냐? 바로 위 영상 링크를 넣어서 한 5분 만에 만든 내용입니다. 영어로 된 TED 강연으로 15분짜리 강연입니다. 이걸 구글 노트북 LM에 넣으면 한 5~10분 사이에 5분짜리 짧은 AI 음성 팟캐스트를 만들어 줍니다. 그럼 이게 왜 필요하냐? 시간 때문입니다. 이동하면서 15분짜리 영상 보는 게 낫긴 하죠. 그런데 운전하면서 듣거나 작업하면서 내 업무에 관련된 정보를 얻고 싶을 때는 라디오나 팟캐스트가 최고입니다. 저는 경제관련 라디오 방송 팟캐스트를 산책하면서 듣습니다. 그걸 통해서 최신 AI 기술과 IT 기술과 요즘 트렌드와 경제 트렌드를 듣죠. 운동이나 산책하면서 들을 수 있기에 아주 편리합니다. 그럼 환각현상이 없냐? 있긴 합니다. 있긴 한데 영상이나 텍스트에 없는 내용을 추가하긴 하는데 그 내용이 오히려 더 유용하고 팩트에 가까워서 좀 놀라기도 합니다. 물론 오류도 있죠. 그럼에도 대체적으로 꽤 영상 및 텍스트 요약을 아주 잘 해주네요. 구글 노트북 LM 사용법 사용법은 아주 간단합니다. 구글 노트북LM은 문서, 웹사이트, 유튜브에서 소스를 공급받을 수 있습니다. 유튜브나 웹사이트는 링크를 통해서 업로드가 가능합니다. 유튜브를 선택하고 유튜브 링크를  넣어줍니다. 그럼 가운데에 요약본이 나옵니다. 그리고 하단에 입력창이 있는데 영상 내용을 보고 채팅을 묻고 답할 수 있습니다. 그리고 오른쪽에 AI 음성 개요가 있는데 여기서 생성을 누르면 영상 내용을 5분 내외의 짧은 팟캐스트 음성 대화로 만들어 줍니다. 맞춤 설정을 통해서 어떤 정보에 좀 더 가중치를 올릴 수 있습니다. 카메라 정보 팟캐스트를 음성 팟캐스트로 만들어보다 페타픽셀은 카메라 정보 사이트로 아주 유명하죠. 여기에 올라온 캐논 R50 V 기사를 넣어봤습니다. 캐논 R50 V가 전자식 선막 셔터라는 기계식 셔터가 있어서 롤링 셔터로 인한 젤리처럼 휘는  젤로 현상이 없다는 말에 깜짝 놀랐네요. 이 내용은 원문 글에 간단하게 소개했는데 이걸 좀 더 쉽게 이해할 수 있게 설명하고 있네요. 순간 이걸로 카메라 팟 캐스트 만들어도 되겠다는 생각이 들었습니다. 너무 좋은데요. 팟 캐스트 내용은 2명의 화자가 제가 제공한 페타픽셀 웹 문서를 다 읽어보고 대화를 하는 내용입니다. 그래서 수시로 문서에 따르면 내용에 따르면이라는 소리가 나와요. 여기에 가끔 추가 설명이나 재미있는 말도 넣어주네요. 그리고 시작할까요? 이상으로 마치겠습니다 등 설명 안 하고 들으면 카메라 관련 두 전문가의 대화로 알겠습니다. 구글 노트북LM은 영어 영상으로 공부하는 학생과 연구자들에게 좋다. 공부를 하고 싶은데 국내에는 관련 영상도 글도 없으면 우리는 영문으로 된 자료나 영상을 보죠. 그러나 영어 모르는 분들은 자막을 생성해서 봅니다. 이제는 번역의 벽도 거의 허물어졌어요. 그런데 이걸 음성 팟캐스트로 듣는다? 눈 감고 지하철에서 영어 동영상을 음성 팟캐스트로 듣는다? 놀랄 노짜네요. 환각 현상이 약간 있습니다. 자기가 아는 정보 분야부터 테스트 해보시고 환각 현상이 어느 정도인지 파악하고 사용해 보시길 바랍니다. 전 너무 좋네요. https://notebooklm.google.com/ 로그인 - Google 계정 이메일 또는 휴대전화 accounts.google.com 위 링크를 눌러서 들어가 보세요

AI 음성 만들기 텍스트 음성 변환 TTS 고퀄 찾는다면 위메이크보이스

AI 음성 만들기 텍스트 음성 변환 TTS 고퀄 찾는다면 위메이크보이스

광고 AI 음성 만들기 텍스트 음성 변환 TTS 고퀄 찾는다면 위메이크보이스 세상은 점점 더 빠르게 변하고 있습니다. 특히 디지털 콘텐츠 시장에서는 글을 읽는 시대에서 '듣는 시대'로의 변화가 두드러지고 있습니다. 유튜브, 팟캐스트, 오디오북뿐만 아니라 홍보 영상, 교육 자료, 안내 방송까지, 우리가 일상에서 접하는 수많은 콘텐츠가 이제는 '음성'을 통해 전달됩니다. 하지만 좋은 음성을 만드는 것은 결고 쉬운 일이 아닙니다. 전문 성우를 섭외하면 시간과 비용이 많이 들고, 퀄리티가 낮은 TTS(텍스트 음성 변환) 서비스를 사용하면 어색한 발음과 기계적인 톤이 듣는 이들에게 피로감을 줄 수도 있죠. 그렇다면 해.......

AI 목소리 만들기, 텍스트 음성 변환 TTS 사이트 위메이크보이스 활용하기

AI 목소리 만들기, 텍스트 음성 변환 TTS 사이트 위메이크보이스 활용하기

안녕하세요. 소라윙즈입니다. 유튜브, 틱톡, 클립 등 동영상 콘텐츠 제작부터 안내 멘트, 제품 내 음성 지원, 교육, 홍보 등 정말 다양한 분야에서 AI 목소리가 사용되고 있습니다. 기존의 딱딱한 기계음과는 달리 실제 사람이 말하는 것처럼 자연스럽고, 다양한 언어를 지원하는데다 비용 면에서도 확실한 메리트가 있기 때문입니다. 오늘 제가 소개드릴 위메이크보이스는 별도의 프로그램 설치 없이 웹브라우저에서 바로 쓸 수 있는 TTS 사이트로, 텍스트 음성 변환을 통해 손쉽게 AI 목소리 만들기를 할 수 있습니다. 처음 써보는 분도 5분 정도만 투자하면 능숙하게 다를 수 있을 정도입니다. 그럼 주요 특징과 함께 어떻게 사용하면 되는지.......

AI목소리 음성 만들기 TTS사이트 추천 위메이크보이스

AI목소리 음성 만들기 TTS사이트 추천 위메이크보이스

AI목소리 음성 만들기 TTS사이트 추천 위메이크보이스 안녕하세요. 사진&IT 크리에이터 자유분방입니다. 요즘 유튜브 쇼츠 영상을 보다 보면, AI 보이스로 TTS를 만들어 영상을 제작하는 경우가 많아졌습니다. TTS는 Text to Speech의 약자로 '음성합성'이라 불리고 있는데요. 초기에만 하더라도 굉장히 이질적이고 밋밋하여 실 사용은 현실적으로 어려운 상황이었습니다. 요즘 쇼츠에 나오는 AI 음성들은 점차 퀄리티가 올라가면서, 종종 사람 목소리로 착각하게 될 정도의 퀄리티를 보여주는 경우도 있습니다. 이번 글에서는 TTS사이트, AI목소리 음성 만들기를 위한 '위메이크보이스'를 소개 드려보려고 합니다. 위메.......