1、Doc格式文件轉換為Pdf文件 Doc文件向Pdf格式轉換還是比較容易的,主要通過Adobe 公司提供的Adobe Distiller虛擬服務器實現的,在安裝了Adobe Acrobat完全版后,在Windows系統的打印機任務中就會添加一個Acrobat Distiller打印機,如圖1所示: 圖1 現在比較流行的DoctoPdf類軟件如Pdfprint等的機理都是調用Adobe Distiller打印機實現的,如果想把一個Doc文件轉換為Pdf文件,只要用Office Word打開該Doc文件,然后在“文件”—>“打印”中選擇Acrobat Distiller打印機即可,如圖2所示: 圖2 這樣,就可以很輕松的將Doc格式的文件轉換為Pdf文件。 2、Pdf格式文件轉換為Doc文件 Pdf格式文件向Doc文件轉換相對比較難,因為Pdf格式與Doc格式解碼格式不同,在Pdf下的回車符、換行符以及相關的圖片格式無法直接轉換為Doc文件,筆者之前一直使用復制文本,然后粘貼到Word中實現Pdf向Doc格式的轉換。 今天突然發(fā)現了一款非常好的Pdf向Doc格式轉換的工具,ScanSoft PDF Converter for Microsoft Word v1.0。它是由ScanSoft公司同微軟共同組隊開發(fā)了一個全新的Office 2003 插件。該插件可以幫助你通過Word直接將Pdf文檔轉換為Word文檔,并且完全保留原來的格式和版面設計。 這個名為 ScanSoft PDF Converter for Microsoft Word 的插件是首先捕獲Pdf文檔中的信息,分離文字同圖片,表格和卷,再將其統一到Word格式?,F在你可以重新利用早先你從網絡上下載或Email中收到的Pdf文件中的信息,而無需添加任何其他軟件。 ScanSoft PDF Converter for Microsoft 已經非常緊密的同Office 2003整合在一起了,有兩種方式可以將Pdf格式轉換成Doc文件。 第一種方式,在Microsoft Word 2003中你可以直接通過“文件”—>“打開”來打開Pdf文件。ScanSoft PDF Converter for Microsoft Word插件會自動彈出了,如圖3所示,經過轉換后我們就可以得到想要的Doc文件。 圖3 第二種方式,ScanSoft公司也已經開發(fā)了基于此的Smart Tag(Office 2003中重要的功能元件)能夠輕松的通過右鍵來將PDF文件轉換成為 Microsoft Word 文件(如圖4所示)。 圖4 注意,在安裝ScanSoft PDF Converter for Microsoft Word的時候建議關閉正在運行的Office Word,Internet Explorer和Outlook等軟件。 |
在 Microsoft Office Document Imaging 2003 中使用掃描儀
2009-04-22 12:01
Microsoft Office Document Imaging 程序包含兩個組件,掃描組件和圖像處理組件。掃描組件通過使用安裝的任何掃描儀來控制將文檔掃描到計算機中的過程。掃描完成后,將立即自動對掃描文檔執(zhí)行 光學字符識別 (OCR) (OCR:將文本圖像(如掃描的文檔)轉換為實際的文本字符。也稱為文本識別。) 。您可以輕松地將多個頁面掃描到單個文件中。圖像處理組件使在屏幕上查看和處理掃描文檔變得更容易。 掃描儀驅動程序:TWAIN 驅動程序和 WIA 驅動程序 大多數掃描儀使用 TWAIN 驅動程序在掃描儀與計算機之間傳輸狀態(tài)和設置信息。在 Microsoft Windows? XP 以及更高版本中,掃描儀還可以包括 Windows 圖像采集 (WIA) 驅動程序。Microsoft Office Document Imaging 使用這些驅動程序來確定掃描儀的性能以及從掃描儀獲取圖像。 Document Imaging 包含一個已識別掃描儀和驅動程序的數據庫。如果 Document Imaging 識別到掃描儀,您可以選擇在每次掃描時顯示掃描儀驅動程序對話框并自己調整掃描設置,也可以讓 Document Imaging 為您管理掃描過程。 在帶有自動文檔送紙器的掃描儀上,WIA 驅動程序可能無法正常工作。如果掃描儀帶有自動文檔送紙器,則應該安裝并使用 TWAIN 驅動程序以獲得最佳效果。 一些掃描儀使用 TWAIN 仿真驅動程序。Document Imaging 不支持仿真驅動程序。如果您的掃描儀使用 TWAIN 仿真驅動程序,請與制造商聯系以獲取最新版本的可兼容 TWAIN 或 WIA 驅動程序。 掃描文件的格式和壓縮 Document Imaging 使用“Microsoft Document Imaging 格式 (MDI)”或“Tag 圖像文件格式 (TIFF)”存儲掃描的圖像。結果文件比以“聯合圖像專家組 (JPEG)”格式存儲的同一圖像的文件要大。兩種格式都可用于存儲由 OCR 識別的文本和圖像。 Microsoft Document Imaging 格式 (MDI) MDI 文件格式基于專為按頁面版式保存圖像而設計的 TIFF 格式。在 Document Imaging 中,您可按 MDI 格式和 IFF 格式打開和保存掃描的文件。 通常,圖像保存為 MDI 文件格式比保存為 TIFF 文件格式占用更少的磁盤空間。以 MDI 文件格式保存的圖像質量與以 TIFF 格式保存的同一圖像的質量相當。 Tag 圖像文件格式 (TIFF) TIFF 是一種適用于多種圖像處理程序(包括掃描和傳真程序)的常用格式。您可以使用多種其他圖形處理程序來打開和編輯使用 Document Imaging 創(chuàng)建的 TIFF 文件。請注意:只能在 Microsoft Office Document Imaging 2003 中打開或編輯 MDI 文件。如果希望與正在使用 Microsoft Office Document Imaging 2002 或其他文檔圖像處理程序的用戶共享文件,請將文件保存為 TIFF 格式以與其他人員使用的程序相兼容。 聯合圖像專家組 (JPEG) JPEG 是 Web 圖形最常用的文件格式。因為 JPEG 文件具有很高的文件壓縮比,所以它們的下載速度很快。JPEG 文件使用的壓縮方法會導致圖像細節(jié)和清晰度方面的損失。細節(jié)的損失會影響 OCR 質量,因此不容易得到滿意的 OCR 效果。這就是 Document Imaging 文件存儲為 MDI 或 TIFF 格式而非 JPEG 格式的原因。 JPEG 格式用于保存從 Document Imaging 復制到其他程序的圖像,包括使用“復制”或“復制圖像”命令(“編輯”菜單)或者“將文本發(fā)送到 Word”命令(“工具”菜單)的場合。Document Imaging 支持復制最大為 2 兆字節(jié) (MB) 的圖像。這意味著如果在 Document Imaging 中復制一個較大的高分辨率 (600 dpi) 圖像,粘貼圖像的圖像保真度可能會比較低,這樣可以在保留原始圖像尺寸的同時使文件大小保持在 2 MB 的限制內。 關于壓縮和 OCR 效果的提示 Document Imaging 可用于查看使用其他程序創(chuàng)建的標準 TIFF 文件。通過電子郵件或計算機上的傳真程序收到的傳真經常存儲為 TIFF 文件。為了使用傳真中的文本(如將文本復制到其他程序中),您可以在 Document Imaging 中打開該 TIFF 文件,然后在“工具”菜單上,單擊“使用 OCR 識別文本”以運行 OCR。在 Document Imaging 中保存 MDI 或 TIFF 文件時,會將 OCR 信息添加到文件中并壓縮原始圖像。運行 OCR 并保存文件后,就可以對傳真中的文本進行搜索了。 以 300 dpi 左右的分辨率掃描圖像可獲得最佳的 OCR 效果。大多數掃描圖像的分辨率是 300 dpi,而 Document Imaging 中的默認掃描預設被設置為 200 dpi 或 300 dpi。在 Document Imaging 中,最高可以使用 1200 dpi 的分辨率來掃描文檔。但是,將分辨率設置高于 300 dpi 會顯著增大掃描時間和文件大小,并且較高的分辨率設置不一定會獲得更好的 OCR 效果。 向多頁掃描文件中添加頁面 在 Document Imaging 中,您可以將多個文件拖動到單獨的文件中以創(chuàng)建一個較大的文件。例如,您可以掃描上次出差或住宅建設項目的所有收據,然后將它們放到一個文件中以便參考。如果忘記了某個收據,您可以很容易地將其添加到文件中:
您還可以使用縮略圖窗格來重排多頁文件中的頁面。 |