Posts
8 posts
동영상 STT 자동 자막과 AI 번역, 릴스 쇼츠에 다국어 자막 넣기
안녕하세요, 제이디입니다 :) 릴스나 쇼츠 콘텐츠를 만들기 위해 편집을 할 때, 생각보다 시간이 오래 걸리는 작업은 자막 텍스트를 타이핑하고 영상과 싱크를 맞추는 일입니다. 영상 내내 나오는 말소리를 일일이 키보드로 받아 적다 보면 컷 편집을 본격적으로 시작하기도 전에 지쳐버리게 되죠. 제가 5년 넘게 사용하고 있는 툴인 필모라15에 AI 기능들이 강화되면서 이런 지루한 과정을 마우스 클릭 몇 번으로 해결할 수 있게 되었는데요. 동영상 STT 기술을 이용한 자동 자막 생성 과정부터 쇼츠 자막 디자인, 그리고 다국어 ai 번역까지 Filmora15로 가능한 다양한 작업들을 순서대로 정리해 봤습니다. 1. 텍스트 자막 추출 바탕화면에서 필.......

음성 텍스트 변환 STT 활용해 유튜브 자막 추출하기
자막 있는 유튜브 콘텐츠를 선호합니다. 음량을 낮추거나 무음으로 시청이 가능한데다 정확하게 이해할 수 있거든요. 예전에는 하나하나 자막을 입력해야 했지만 지금은 음성 텍스트 변환 기능으로 쉽고 빠르게 자막 작업이 가능하더라고요. 요즘 대학생활 하면서 알바하는 분들이 많잖아요. 영상 콘텐츠 관련 분야가 확대되면서 영상 편집에 관한 일자리나 알바도 점차 늘어나고 있는데요. 프리미어 프로 및 영상 편집 기능을 익혀두면 취업뿐만 아니라 N잡으로도 활용할 수 있습니다. 그래서 오늘은 프리미어 프로를 활용한 음성 텍스트 변환 STT(Speech to Text) 기능 및 유튜브 자막 추출 방법에 대해서 알아보고요. Creative Cloud 학생 할.......
유튜브 주소를 입력하면 2인 팟캐스트 음성으로 만들어주는 구글 노트북 LM에 놀라다
STT, TTS를 구분할 줄 아는 분이라면 AI를 잘 활용하는 분이라는 판단이 습니다. 왜냐하면 이 둘은 현재 AI로 생산하는 콘텐츠에서 아주 중요한 역할을 합니다. STT는 말을 텍스트로 변환해 주는 기술로 자동 자막 형성에 사용하며 TTS는 오래된 기술이지만 최근 AI에 의해 보다 자연스러워진 텍스트를 말로 변환해 주는 인공 성우 역할을 합니다. 유튜브 영상을 요약해서 2인 대화식 팟 캐스트로 만들어주는 구글 노트북 LM 오픈 AI가 AI 서비스를 가장 잘한다고 생각하지만 구글은 다양한 AI 서비스를 선보이고 있어서 다양성에서는 구글이 더 낫습니다. 구글은 노트북 LM을 선보였습니다. 마인드맵이나 문서 및 논문 분석을 도와주는 서비스입니다. 복잡한 정보를 이해하기 편한 탐색 도구입니다. 예를 들어서 논문이 담긴 PDF 파일이나 영문 자료가 올라온 URL을 입력한 후에 그 긴 내용을 다 읽을 수 없을 때 그냥 URL을 업로드한 후 그 내용을 AI와 채팅하면서 알아가는 것이죠. 그런데 이 구글 노트북LM이 업그레이드를 하면서 한국어 음성 요약 서비스를 시작했습니다. 사용하면서 이게 가능한가 할 정도로 엄청난 기능이네요. 먼저 이걸 들어보세요. 두 AI 음성대화인데 말 안 하면 그냥 팟 캐스트로 이해하실 겁니다. 실제로 너무 자연스러워서 깜짝 놀랐네요. 그럼 이건 어떻게 만들었냐? 바로 위 영상 링크를 넣어서 한 5분 만에 만든 내용입니다. 영어로 된 TED 강연으로 15분짜리 강연입니다. 이걸 구글 노트북 LM에 넣으면 한 5~10분 사이에 5분짜리 짧은 AI 음성 팟캐스트를 만들어 줍니다. 그럼 이게 왜 필요하냐? 시간 때문입니다. 이동하면서 15분짜리 영상 보는 게 낫긴 하죠. 그런데 운전하면서 듣거나 작업하면서 내 업무에 관련된 정보를 얻고 싶을 때는 라디오나 팟캐스트가 최고입니다. 저는 경제관련 라디오 방송 팟캐스트를 산책하면서 듣습니다. 그걸 통해서 최신 AI 기술과 IT 기술과 요즘 트렌드와 경제 트렌드를 듣죠. 운동이나 산책하면서 들을 수 있기에 아주 편리합니다. 그럼 환각현상이 없냐? 있긴 합니다. 있긴 한데 영상이나 텍스트에 없는 내용을 추가하긴 하는데 그 내용이 오히려 더 유용하고 팩트에 가까워서 좀 놀라기도 합니다. 물론 오류도 있죠. 그럼에도 대체적으로 꽤 영상 및 텍스트 요약을 아주 잘 해주네요. 구글 노트북 LM 사용법 사용법은 아주 간단합니다. 구글 노트북LM은 문서, 웹사이트, 유튜브에서 소스를 공급받을 수 있습니다. 유튜브나 웹사이트는 링크를 통해서 업로드가 가능합니다. 유튜브를 선택하고 유튜브 링크를 넣어줍니다. 그럼 가운데에 요약본이 나옵니다. 그리고 하단에 입력창이 있는데 영상 내용을 보고 채팅을 묻고 답할 수 있습니다. 그리고 오른쪽에 AI 음성 개요가 있는데 여기서 생성을 누르면 영상 내용을 5분 내외의 짧은 팟캐스트 음성 대화로 만들어 줍니다. 맞춤 설정을 통해서 어떤 정보에 좀 더 가중치를 올릴 수 있습니다. 카메라 정보 팟캐스트를 음성 팟캐스트로 만들어보다 페타픽셀은 카메라 정보 사이트로 아주 유명하죠. 여기에 올라온 캐논 R50 V 기사를 넣어봤습니다. 캐논 R50 V가 전자식 선막 셔터라는 기계식 셔터가 있어서 롤링 셔터로 인한 젤리처럼 휘는 젤로 현상이 없다는 말에 깜짝 놀랐네요. 이 내용은 원문 글에 간단하게 소개했는데 이걸 좀 더 쉽게 이해할 수 있게 설명하고 있네요. 순간 이걸로 카메라 팟 캐스트 만들어도 되겠다는 생각이 들었습니다. 너무 좋은데요. 팟 캐스트 내용은 2명의 화자가 제가 제공한 페타픽셀 웹 문서를 다 읽어보고 대화를 하는 내용입니다. 그래서 수시로 문서에 따르면 내용에 따르면이라는 소리가 나와요. 여기에 가끔 추가 설명이나 재미있는 말도 넣어주네요. 그리고 시작할까요? 이상으로 마치겠습니다 등 설명 안 하고 들으면 카메라 관련 두 전문가의 대화로 알겠습니다. 구글 노트북LM은 영어 영상으로 공부하는 학생과 연구자들에게 좋다. 공부를 하고 싶은데 국내에는 관련 영상도 글도 없으면 우리는 영문으로 된 자료나 영상을 보죠. 그러나 영어 모르는 분들은 자막을 생성해서 봅니다. 이제는 번역의 벽도 거의 허물어졌어요. 그런데 이걸 음성 팟캐스트로 듣는다? 눈 감고 지하철에서 영어 동영상을 음성 팟캐스트로 듣는다? 놀랄 노짜네요. 환각 현상이 약간 있습니다. 자기가 아는 정보 분야부터 테스트 해보시고 환각 현상이 어느 정도인지 파악하고 사용해 보시길 바랍니다. 전 너무 좋네요. https://notebooklm.google.com/ 로그인 - Google 계정 이메일 또는 휴대전화 accounts.google.com 위 링크를 눌러서 들어가 보세요
유튜브 주소를 입력하면 2인 팟캐스트 음성으로 만들어주는 구글 노트북 LM에 놀라다
STT, TTS를 구분할 줄 아는 분이라면 AI를 잘 활용하는 분이라는 판단이 습니다. 왜냐하면 이 둘은 현재 AI로 생산하는 콘텐츠에서 아주 중요한 역할을 합니다. STT는 말을 텍스트로 변환해 주는 기술로 자동 자막 형성에 사용하며 TTS는 오래된 기술이지만 최근 AI에 의해 보다 자연스러워진 텍스트를 말로 변환해 주는 인공 성우 역할을 합니다. 유튜브 영상을 요약해서 2인 대화식 팟 캐스트로 만들어주는 구글 노트북 LM 오픈 AI가 AI 서비스를 가장 잘한다고 생각하지만 구글은 다양한 AI 서비스를 선보이고 있어서 다양성에서는 구글이 더 낫습니다. 구글은 노트북 LM을 선보였습니다. 마인드맵이나 문서 및 논문 분석을 도와주는 서비스입니다. 복잡한 정보를 이해하기 편한 탐색 도구입니다. 예를 들어서 논문이 담긴 PDF 파일이나 영문 자료가 올라온 URL을 입력한 후에 그 긴 내용을 다 읽을 수 없을 때 그냥 URL을 업로드한 후 그 내용을 AI와 채팅하면서 알아가는 것이죠. 그런데 이 구글 노트북LM이 업그레이드를 하면서 한국어 음성 요약 서비스를 시작했습니다. 사용하면서 이게 가능한가 할 정도로 엄청난 기능이네요. 먼저 이걸 들어보세요. 두 AI 음성대화인데 말 안 하면 그냥 팟 캐스트로 이해하실 겁니다. 실제로 너무 자연스러워서 깜짝 놀랐네요. 그럼 이건 어떻게 만들었냐? 바로 위 영상 링크를 넣어서 한 5분 만에 만든 내용입니다. 영어로 된 TED 강연으로 15분짜리 강연입니다. 이걸 구글 노트북 LM에 넣으면 한 5~10분 사이에 5분짜리 짧은 AI 음성 팟캐스트를 만들어 줍니다. 그럼 이게 왜 필요하냐? 시간 때문입니다. 이동하면서 15분짜리 영상 보는 게 낫긴 하죠. 그런데 운전하면서 듣거나 작업하면서 내 업무에 관련된 정보를 얻고 싶을 때는 라디오나 팟캐스트가 최고입니다. 저는 경제관련 라디오 방송 팟캐스트를 산책하면서 듣습니다. 그걸 통해서 최신 AI 기술과 IT 기술과 요즘 트렌드와 경제 트렌드를 듣죠. 운동이나 산책하면서 들을 수 있기에 아주 편리합니다. 그럼 환각현상이 없냐? 있긴 합니다. 있긴 한데 영상이나 텍스트에 없는 내용을 추가하긴 하는데 그 내용이 오히려 더 유용하고 팩트에 가까워서 좀 놀라기도 합니다. 물론 오류도 있죠. 그럼에도 대체적으로 꽤 영상 및 텍스트 요약을 아주 잘 해주네요. 구글 노트북 LM 사용법 사용법은 아주 간단합니다. 구글 노트북LM은 문서, 웹사이트, 유튜브에서 소스를 공급받을 수 있습니다. 유튜브나 웹사이트는 링크를 통해서 업로드가 가능합니다. 유튜브를 선택하고 유튜브 링크를 넣어줍니다. 그럼 가운데에 요약본이 나옵니다. 그리고 하단에 입력창이 있는데 영상 내용을 보고 채팅을 묻고 답할 수 있습니다. 그리고 오른쪽에 AI 음성 개요가 있는데 여기서 생성을 누르면 영상 내용을 5분 내외의 짧은 팟캐스트 음성 대화로 만들어 줍니다. 맞춤 설정을 통해서 어떤 정보에 좀 더 가중치를 올릴 수 있습니다. 카메라 정보 팟캐스트를 음성 팟캐스트로 만들어보다 페타픽셀은 카메라 정보 사이트로 아주 유명하죠. 여기에 올라온 캐논 R50 V 기사를 넣어봤습니다. 캐논 R50 V가 전자식 선막 셔터라는 기계식 셔터가 있어서 롤링 셔터로 인한 젤리처럼 휘는 젤로 현상이 없다는 말에 깜짝 놀랐네요. 이 내용은 원문 글에 간단하게 소개했는데 이걸 좀 더 쉽게 이해할 수 있게 설명하고 있네요. 순간 이걸로 카메라 팟 캐스트 만들어도 되겠다는 생각이 들었습니다. 너무 좋은데요. 팟 캐스트 내용은 2명의 화자가 제가 제공한 페타픽셀 웹 문서를 다 읽어보고 대화를 하는 내용입니다. 그래서 수시로 문서에 따르면 내용에 따르면이라는 소리가 나와요. 여기에 가끔 추가 설명이나 재미있는 말도 넣어주네요. 그리고 시작할까요? 이상으로 마치겠습니다 등 설명 안 하고 들으면 카메라 관련 두 전문가의 대화로 알겠습니다. 구글 노트북LM은 영어 영상으로 공부하는 학생과 연구자들에게 좋다. 공부를 하고 싶은데 국내에는 관련 영상도 글도 없으면 우리는 영문으로 된 자료나 영상을 보죠. 그러나 영어 모르는 분들은 자막을 생성해서 봅니다. 이제는 번역의 벽도 거의 허물어졌어요. 그런데 이걸 음성 팟캐스트로 듣는다? 눈 감고 지하철에서 영어 동영상을 음성 팟캐스트로 듣는다? 놀랄 노짜네요. 환각 현상이 약간 있습니다. 자기가 아는 정보 분야부터 테스트 해보시고 환각 현상이 어느 정도인지 파악하고 사용해 보시길 바랍니다. 전 너무 좋네요. https://notebooklm.google.com/ 로그인 - Google 계정 이메일 또는 휴대전화 accounts.google.com 위 링크를 눌러서 들어가 보세요



![[CV] [Comi] 'ファイブスター物語'(더 파이브 스타 스토리즈) 19권. 연재분에서 벌어지는 '검성 대 검성'](https://img.zoomtrend.com/2026/06/06/1780766083-ECB2ABEB93B1EC9EA5EB8DB0ECBD94EC8AA4.jpg)