| Hi
Please check that you have the HTMLPlug options specified correctly.
There should be no spaces in the value for metadata_fields, eg
-metadata_fields Title,Creator,Subject
Make sure that you do not have the -description_tags option set.
Once you have built the collection, you should see all your extracted
metadata.
If it does not appear, try changing the mode to Expert and rebuilding.
Do you get any error messages?
Once you can see the metadata, if you want it to be indexed, you will
need to assign indexes on that extracted metadata - use the Search
Indexes part of the Design pane to do this.
Regards,
Katherine Don
Cao Minh Kiem wrote:
> Dear List members,
> I have some problem when using Greenstone Library Interface to create a
> collection from HTML document.
> All document have emberded metadata fields (like <meta name="creator"
> content="Cao Minh Kiem">.
> I have modified the HTMLPluginh with parameter like this:
> -metadata_fields Title, Creator,...
>
> I want the GLI automatically extract metadata and create indexes
> from emberded metadata fields. But it seems to me that GLI does not
> work. I thinh that it is becauce the RecPlugin use the parameter :
> Use_metada_...
> This cannot be changed in GLI?
>
> Can you tell me how to modify the configuration file so that GLI can
> automatically index thousand of HTML documents without being enriched
> mannually?
>
> Thanh you.
> I attach two test short HTML document for reference
> Thanh you
>
>
> Cao Minh Kiem
> Deputy-Director
> National Center for S&T Information
> 24 Ly Thuong Kiet, Hanoi. VIETNAM
> Tel: (84-4)-9349491. Fax (84-4)-9349127
> Email: kiemcm@vista.gov.vn <mailto:kiemcm@vista.gov.vn>
>
> ------------------------------------------------------------------------
>
> Â số TL: BB-00012/(t.Việt)
> /Nhan đề: /Chứng đau nhức
> /Âc giả/Chủ bÂn: /Phạm Quốc Anh
> /Nguồn: /Khoa học phổ tÂng, 2002, số 637, tr: 20
> /Từ khÂ: /đau nhức; lÂng xương; thÂi h khớp; vÂm khớp; bệnh; bệnh
> xương khớp
> /PÂn loại :/KDM: 76.29.31
> Âịa chỉ Âi liệu: /TVLHH,
> Xem tÂn văn </toanvanKHPTkhpt02(S637-T20).pdf>
> ------------------
>
> ------------------------------------------------------------------------
>
> Â số TL: BB-00003/(t.Việt)
> /Nhan đề: /NghÂn cứu mới: tÂm một phương pÂp chống thấm hiệu quả
> /Âc giả/Chủ bÂn: /Trường Sơn
> /Nguồn: /Khoa học phổ tÂng, 2002, số 634, tr: 31
> /Từ khÂ: /Âng tÂnh Ây dựng; chống thấm; vữa xi măng;
> styren-butadien; phụ gia polyme hữu cơ; phụ gia; polime hữu cơ
> /PÂn loại :/KDM: 67.13.51
> Âịa chỉ Âi liệu: /TVLHH,
> Xem tÂn văn </toanvanKHPTkhpt02(S634-T31).pdf>
> ------------------
>
> ------------------------------------------------------------------------
>
> Â số TL: BB-00002/(t.Việt)
> /Nhan đề: Âứt Âa tay cÂn Âch bảo quản phần đứt Âa
> /Âc giả/Chủ bÂn: /Â Văn CÂu
> Âịa chỉ : /Khoa vi phẫu tạo Ânh, Trung Âm chấn thương chỉnh Ânh,
> TÂnh phố Hồ CÂ Minh
> /Nguồn: /Khoa học phổ tÂng, 2002, số 634, tr: 24
> /Từ khÂ: /đứt tay; đứt cÂn; phần chi đứt Âa; chỉnh Ânh; bảo quản; vi
> phẫu; ngoại khoa
> /PÂn loại :/KDM: 76.29.39
> Âịa chỉ Âi liệu: /TVLHH,
> Xem tÂn văn </toanvanKHPTkhpt02(S634-T24).pdf>
> ------------------
>
>
> ------------------------------------------------------------------------
>
> _______________________________________________
> greenstone-devel mailing list
> greenstone-devel@list.scms.waikato.ac.nz
> https://list.scms.waikato.ac.nz/mailman/listinfo/greenstone-devel |