根據(jù)網(wǎng)站建設的需要,從各種可能的渠道收集要建網(wǎng)站的企業(yè)的相關文字資料。網(wǎng)站制作公司怎么用數(shù)碼相機獲取文字素材?
(1)用一臺300萬像素、3倍以上光學變焦的數(shù)碼相機把原稿拍攝下來。
(2)在計算機硬盤中建立一個文件夾,把拍攝到的圖片存入其中。
(3)用ACDSee或Windows自帶的“畫圖”程序、Photoshop進行轉(zhuǎn)換。由于這些圖片反差很小,整個畫面很灰,而且各種數(shù)碼相機的圖片格式也不同,OCR識別軟件不一定都能支持,所以宜先用ACDSee或Windows自帶的“畫圖”程序、Photoshop進行轉(zhuǎn)換。
比如在Windows自帶的“畫圖”程序中進行轉(zhuǎn)換。首先依次選擇“文件”→“打開”命令,在“查找范圍”下拉列表框中找到需要的圖片,打開后選擇“文件”→“另存為”命令,在“保存類型”下拉列表框中選擇“單色位圖”選項,單擊“保存”按鈕后,會跳出提示語,繼續(xù)單擊“是”按鈕,就完成了轉(zhuǎn)換。轉(zhuǎn)換后得到的新圖片沿用原名,擴展名改為bmp。
(4)自動保存在原文件夾中。運行OCR軟件(掃描儀都有附帶,網(wǎng)上也有下載)。如果需要全部識別,即可單擊“全部識別”按鈕OCR軟件即進行識別。軟件窗口的上部是經(jīng)過拍攝、轉(zhuǎn)換后的原稿圖片,下部是識別出來的文字,識別結(jié)束后自動建立沿用原名的TXT文件,保存在原文件夾中。如果只需識別部分文字,可在需要識別的文字部位拖動出方框,出現(xiàn)整塊黃色后,單擊“識別”按鈕即可。
(5)整理。在開始建立的文件夾中找出擴展名為TXT的文本文件,這便是需要的資料,對識別錯誤的字進行修改,特別是原文中加著重號和下劃線的文字,識別率還較低。同時在文件夾中,有許多擴展名為CHR、TRC、SIM的文件,這些是OCR識別時產(chǎn)生的臨時文件,可全部刪除。深圳網(wǎng)站制作公司本文關于“網(wǎng)站制作怎么用數(shù)碼相機獲取文字素材”的知識就介紹分享到這里,謝謝關注,博納網(wǎng)絡編輯整理。