Re: [greenstone-users] Word an Mails in GSDL

From John R. McPherson
DateFri, 30 Apr 2004 07:57:35 +1200
Subject Re: [greenstone-users] Word an Mails in GSDL
In-Reply-To (000701c42de9$7c199de0$59a2d2aa-unsj-edu-ar)
On Thu, Apr 29, 2004 at 09:57:10AM -0300, Luis Alberto Olguin wrote:

> En mi "caso real" debo armar una colección con los
> documentos WORD y MAILs que diariamente maneja la
> Institución, es decir si genero la colección con cada
> docuemnto word, al cabo de un tiempo, la cantidad de carpetas HASH
> que utiliza GSDL será muy grande. Lo mismo para los mbx
> tomados de Outlook. Que hacer entonces?. Posibles soluciones que
> se me ocurren son: - Agrupar los docuementos WORD del día (o
> la semana) en un solo documento (cuyo nombre será la fecha de
> la semana "d042004-1.doc"), con lo que lograría tener un
> máximo de 48 carpetas al año, pero al cabo de varios
> años, esto tambien crece, creo, excesivamente.

> In my "real case" I must arm a collection with the WORD documents
> and MAILs that daily handles the Institution, is to say if I
> generate the collection with each docuemnto Word, after a time, the
> amount of folders HASH that uses GSDL will be very great.The same
> for mbx taken from Outlook.

In <collectname>/etc/collect.cfg:

groupsize 100
or
groupsize 300
etc.

will put 100 (or 300) Word / Email documents into 1 single HASH.../doc.xml
file:

import.groupsize:Number of import documents to group into one XML file.

import.groupsize:El número de documentos de importación para agruparse en un archivo de XML.


John McPherson