之前在測試 MOSS 的時候成經用過 IFilter 6.5 ,但是後來發現有 IFilter 9 版本出現,不過 Adobe 網站上面的卻是提供 64-bit 版本的,經過一番的檢視文件才發現,原來 IFilter 在 8 以後,已經內建於 Adobe Reader 裡面了,因此以後可以不用特地去找 IFilter 了。
言歸正傳,來說明一下如何設定才能讓 SharePoint 可以檢索 PDF 檔案的內容。
1. 下載並安裝包含 IFilter 9 的 Adobe Reader 9
2. 為了讓 MOSS 搜尋畫面標示出 PDF 的檔案格式的小圖,請在下載 pdficon_small.gif 於http://www.adobe.com/misc/linking.html
3. 新增一個讓 MOSS 可以辨認的附檔名 PDF 於註冊表 (registry)
3.1 打開註冊表,開始 → 執行 → 打上 regedit → 確定
3.2 開啟 HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Shared Tools\Web Server Extensions\12.0\Search\Applications\{Site GUID}\Gather\Search\Extensions\ExtensionList
3.3 新增一個字串值,如果你的清單中最後一個值是 37 的話,新增一個 38 ,數值資料為 pdf
4. 建立或修改 IFilter 的對應值
4.1 開啟 HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Shared Tools\Web Server Extensions\12.0\Search\Setup\ContentIndexCommon\Filters\Extension\
4.2 修改或建立一個 .pdf 的機碼
4.3 確定 <REG_MULTI_SZ> 值是否為 {E8978DA6-047F-4E3D-9C78-CDBE46041603},如果為 {4C904448-74A9-11D0-AF6E-00C04FD8DC02} 為 MOSS SP1 後新增上去的舊值,請修改之。
4.4 開啟 HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office Server\12.0\Search\Setup\ContentIndexCommon\Filters\Extension\
4.5 與步驟 4.2 4.3 相同
5. 新增 Adobe 的路徑至環境變數 path 下,如:C:\Program Files\Adobe\Reader 9.0\Reader
6. 讓 MOSS 呈現 PDF 檔案的小圖
6.1 將步驟 2 所下載下來的檔案 pdficon_small.gif 複製到 %programfiles%\Common Files\Microsoft Shared\Web Server Extensions\12\TEMPLATE\IMAGES
6.2 開啟 12 Hive\TEMPLATE\XML\DOCICON.XML 檔案
6.3 找尋 <DocIcons> 下的 <ByExtension>
6.4 加入 <Mapping Key="pdf" Value="pdficon_small.gif" OpenControl="" /> 對應字串
7. 在 SharePoint 加入要 爬行 ( crawl ) 的檔案類型
7.1 開啟 SharePoint 管理中心 的 共用服務 的搜尋設定
7.2 開啟 檔案類型
7.3 新增 檔案類型,副檔名為 pdf
8. 重新啟動 搜尋服務
9. 重新爬行 PDF 文件
- net stop osearch
- net start osearch
留言列表