1. PDF파일 Word 변환 및 문자 자동추출에 대해서
회사에서 일을 할때 혹은 다른 회사에서 PDF로 문서를 공유받았을 때, PDF파일은 특성상 수정이 불가능하도록 되어 있는 경우가 많습니다. 일반적으로 Word파일이나 PPT파일을 이하와 같이 다른이름으로 저장시 PDF로 저장하면 수정이 불가능한 PDF형식의 파일로 변환되는데요. 오늘은 이 PDF파일을 자동으로 수정가능한 Word 혹은 PPT로 변환시키고, 해당 파일에서 문자를 추출해서 엑셀로 가져오는 자동화 TOOL에 대해서 소개하겠습니다.
일반적으로 Word 혹은 PPT를 PDF로 변환하는 방법은 하기와 같습니다.
하기와 같이 특정 파일을 다른이름으로 저장하여 파일형식을 "PDF"로 저장함. 그러면 PDF파일로 보존되며 PDF파일은 수정이 일반적으로는 불가능함.
2. PDF파일 Word 변환 및 문자 자동추출의 원리 및 코드설명
VBA 코드의 경우 생각보다 대단히 간단합니다. 하기 예시는 PDF로 되어있는 파일을 Word로서 열어주고 연 Word파일에서 컨텐츠(문자)를 추출해서 엑셀의 A7셀에 붙여넣은 간단한 예시인데요. 이와같이 PDF파일의 경우 기존의 Word형식 혹은 PPT형식으로 열어주면 간단하게 파일을 원복시킬 수 있습니다.
Sub ImportPDF()
Dim wdApp As Object
Dim wdDoc As Object
Dim strFilePath As String
Dim strFileName As String
Application.DisplayAlerts = False
strFilePath = Range("d1")
Set wdApp = CreateObject("word.application")
Set wdDoc = wdApp.Documents.Open(strFilePath) wdApp.Visible = True wdDoc.Content.Copy
Sheets("sheet1").Range("a7").PasteSpecial xlPasteValues '
' wdDoc.Close savechanges:=False ' wdApp.Quit
' Set wdApp = Nothing ' Set wdDoc = Nothing '
Application.DisplayAlerts = True
End Sub
3. 자동화 TOOL 공유
직접 VBA로 만든 엑셀 PDF 변환 자동화 TOOL을 공유합니다. 하기 파일은 PDF를 Word로 변환하고, 변환된 Word의 글자를 추출하여 엑셀에 넣는 기능을 구현하였습니다. 사용방법의 문의 혹은 PPT버전에 대한 문의는 댓글을 남겨주세요.