Re: [greenstone-devel] Using GLI to create collection

From Katherine Don
DateWed, 30 Mar 2005 10:05:40 +1200
Subject Re: [greenstone-devel] Using GLI to create collection
In-Reply-To (000b01c53483$cf4e4320$7302a8c0-caokiem)

Please check that you have the HTMLPlug options specified correctly.
There should be no spaces in the value for metadata_fields, eg
-metadata_fields Title,Creator,Subject
Make sure that you do not have the -description_tags option set.

Once you have built the collection, you should see all your extracted
If it does not appear, try changing the mode to Expert and rebuilding.
Do you get any error messages?

Once you can see the metadata, if you want it to be indexed, you will
need to assign indexes on that extracted metadata - use the Search
Indexes part of the Design pane to do this.

Katherine Don

Cao Minh Kiem wrote:
> Dear List members,
> I have some problem when using Greenstone Library Interface to create a
> collection from HTML document.
> All document have emberded metadata fields (like <meta name="creator"
> content="Cao Minh Kiem">.
> I have modified the HTMLPluginh with parameter like this:
> -metadata_fields Title, Creator,...
> I want the GLI automatically extract metadata and create indexes
> from emberded metadata fields. But it seems to me that GLI does not
> work. I thinh that it is becauce the RecPlugin use the parameter :
> Use_metada_...
> This cannot be changed in GLI?
> Can you tell me how to modify the configuration file so that GLI can
> automatically index thousand of HTML documents without being enriched
> mannually?
> Thanh you.
> I attach two test short HTML document for reference
> Thanh you
> Cao Minh Kiem
> Deputy-Director
> National Center for S&T Information
> 24 Ly Thuong Kiet, Hanoi. VIETNAM
> Tel: (84-4)-9349491. Fax (84-4)-9349127
> Email: <>
> ------------------------------------------------------------------------
> € số TL: BB-00012/(t.Việt)
> /Nhan đề: /Chứng đau nhức
> /€c giả/Chủ b€n: /Phạm Quốc Anh
> /Nguồn: /Khoa học phổ t€ng, 2002, số 637, tr: 20
> /Từ kh€: /đau nhức; l€ng xương; th€i h€ khớp; v€m khớp; bệnh; bệnh
> xương khớp
> /P€n loại :/KDM: 76.29.31
> €ịa chỉ €i liệu: /TVLHH,
> Xem t€n văn </toanvanKHPTkhpt02(S637-T20).pdf>
> ------------------
> ------------------------------------------------------------------------
> € số TL: BB-00003/(t.Việt)
> /Nhan đề: /Ngh€n cứu mới: t€m một phương p€p chống thấm hiệu quả
> /€c giả/Chủ b€n: /Trường Sơn
> /Nguồn: /Khoa học phổ t€ng, 2002, số 634, tr: 31
> /Từ kh€: /€ng t€nh €y dựng; chống thấm; vữa xi măng;
> styren-butadien; phụ gia polyme hữu cơ; phụ gia; polime hữu cơ
> /P€n loại :/KDM: 67.13.51
> €ịa chỉ €i liệu: /TVLHH,
> Xem t€n văn </toanvanKHPTkhpt02(S634-T31).pdf>
> ------------------
> ------------------------------------------------------------------------
> € số TL: BB-00002/(t.Việt)
> /Nhan đề: €ứt €a tay c€n €ch bảo quản phần đứt €a
> /€c giả/Chủ b€n: /€ Văn C€u
> €ịa chỉ : /Khoa vi phẫu tạo €nh, Trung €m chấn thương chỉnh €nh,
> T€nh phố Hồ C€ Minh
> /Nguồn: /Khoa học phổ t€ng, 2002, số 634, tr: 24
> /Từ kh€: /đứt tay; đứt c€n; phần chi đứt €a; chỉnh €nh; bảo quản; vi
> phẫu; ngoại khoa
> /P€n loại :/KDM: 76.29.39
> €ịa chỉ €i liệu: /TVLHH,
> Xem t€n văn </toanvanKHPTkhpt02(S634-T24).pdf>
> ------------------
> ------------------------------------------------------------------------
> _______________________________________________
> greenstone-devel mailing list