Documento de Trabajo - Favor de NO DISTRIBUIR sin autorización del grupo


Programa Nacional de Bibliotecas Digitales

Índice

Resumen

1. Introducción
2. Antecedentes
    2.1 Orígenes de Bibliotecas Digitales
    2.2 Definición
    2.3 Principales enfoques y aspectos de investigación
    2.4 Bibliotecas Digitales en México
        2.4.1 Grupo de trabajo en bibliotecas digitales
        2.4.2 Trabajo actual en Bibliotecas Digitales en México
3. Programa Nacional de Bibliotecas Digitales
    3.1 Objetivo General
    3.2 Objetivos específicos
    3.3 Arquitectura de Referencia de Bibliotecas Digitales

Referencias

Anexos
    A. Grupo de trabajo: Integrantes
    B. Proyectos en desarrollo en Mexico
        B.1 CICESE
        B.2 IIMAS-UNAM
        B.3 INAOE
        B.4 IPN-CIC
        B.5 ITESM Campus Monterrey
        B.6 ITESM Campus Morelos
        B.7 UDLA-P
        B.8 Universidad de Colima
        B.9 FIMPES
    C. Proyectos y colaboraciones potenciales


Resumen

Las bibliotecas digitales son un área clave para difundir y generar conocimientos basándose en tecnologías de información y telecomunicaciones. Está demostrado que estas actividades tienen un impacto amplio sobre el nivel de competitividad de un país y el bienestar de sus ciudadanos.

Este documento presenta el Programa Nacional de Bibliotecas Digitales, el cual define dirección y metas para el avance de este campo multi-disciplinario en México, e integra los equipos que actualmente realizan investigación y desarrollo en áreas relacionadas.

Se describen las estrategias y el plan de acción para alcanzar las metas propuestas, incluyendo los recursos y avances actuales así como los recursos adicionales necesarios.
 

1. Introducción

Es cada vez más evidente que en el futuro próximo, el éxito de todas las actividades de investigación y educación dependerá, en gran medida, de un uso efectivo del vasto universo de información disponible a través de diversos medios electrónicos y de la capacidad de los individuos para comunicarse electrónicamente con colegas, investigadores y académicos en todo el mundo. Considerando esto, varios países han identificado las bibliotecas digitales como un reto nacional y un área clave de competitividad y de impacto potencial amplio sobre el bienestar de sus ciudadanos [ACM 1995, Akscyn y Witten 1998, Fox 1993, Lesk 1997]. Se han iniciado programas destinados a impulsar la investigación en bibliotecas digitales y producir avances en cada una de las áreas que pueden impactar su rápido desarrollo, incluyendo aspectos tecnológicos, sociales, legales y de cooperación internacional.

Aunque con una comunidad profundamente interesada en el desarrollo del área, México no cuenta actualmente con un programa formal para promover y apoyar la investigación y el desarrollo en bibliotecas digitales, con los consiguientes riesgos de rezago y mayor dependencia tecnológica del exterior. El presente documento presenta una propuesta de Programa Nacional de Bibliotecas Digitales, integrando los equipos que actualmente realizan investigación y desarrollo en áreas relacionadas y definiendo dirección y metas para una comunidad con grandes deseos de cooperar en el avance de este campo multi-disciplinario.

2. Antecedentes

El origen del concepto de biblioteca digital puede ubicarse en los escritos de visionarios como Vannevar Bush [1945, 1959], en los que se planteaba la posibilidad y la necesidad de utilizar los adelantos tecnológicos acelerados por la Segunda Guerra Mundial para generar nuevas formas de almacenar y mantener conocimientos, así como nuevos ambientes y prácticas para el trabajo intelectual. Muchas de estas ideas han servido de inspiración para conceptos hoy populares como hipertextos [Nelson 1977], hipermedios y sistemas para trabajo cooperativo.  En los años sesenta, J. C. R. Licklider [1965] desarrolla una visión ya sobre el uso de las computadoras como un elemento que revolucionaría el funcionamiento de las bibliotecas tradicionales, introduciendo entre otras funciones el indexado "inteligente" de documentos.

No es sino hasta la presente década cuando se identifica a las bibliotecas digitales como un factor clave de competitividad y varios países inician programas encaminados a apoyar su desarrollo y a buscar avances dramáticos en los medios de recolectar, almacenar, organizar, hacer disponibles y explotar grandes volúmenes de datos en forma digital. En este sentido, sobresalen [Lesk 1997]:

La Tabla 1 sintetiza la información relevante de algunos de los proyectos actualmente en proceso sobre bibliotecas digitales.
Tabla 1. Algunos proyectos sobresalientes en el area de bibliotecas digitales. 
             
Características generales (Proyectos pertenecientes a la DLI)
Institución  Stanford  Carnegie-Mellon  UC Berkeley  Michigan  UC Santa Barbara  University of Illinois
Proyecto  Infobus  Informedia  Digital Library Project  Digital Library Project  Alexandria  DLI Project
Países involucrados  EEUU  EEUU  EEUU  EEUU  EEUU  EEUU
Patrocinadores/Socios  NSF, NASA, DARPA, Dialog Information Services, HP Labs, ACM, Interconnect Technologies, Enterprise Integration Technologies, Bellcore, Interval, O'Reilly, WAIS Inc, Xerox Corp.  NFS, NASA, DARPA, WQED, DEC, Bell Atlantic, Microsoft, Intel, Motorola, CNN, Visa, Boeing, Telecom Italia, Allegheny-Singer Research Institute, British Open University, Winchester-Thurson School.  NFS, NASA, DARPA, Gobierno del Estado de California, HP, Informix, IBM, Philips, Ricoh, Sun, Xerox  NFS, NASA, DARPA, Apple, Kodak, HP, IBM, Sybase, Ann Arbor Public Libray, New York Public Library, McGraw Hill, Enyclopedia Britanica, Groliers, Cambrige University Press  NFS, NASA, DARPA, State Univ. Of New York, Univ. of Maine, Excalibur, DEC, Xerox, Libray of Congress, U.S. Geological Survey  NFS, DARPA, NASA, HP, Microsoft, NETBILL, OpenText, SoftQuad
Presupuesto asignado  3.6 Millones de dólares  4.8 Millones de dólares  4 Millones de dólares  4 Millones de dólares  4 Millones de dólares  4 Millones de dólares
Status  Operativo, creciendo  Operativo, creciendo  Operativo, público, creciendo  Prototipo de evaluación  Prototipo funcional  Operativo, creciendo
Mayor información  http://walrus.stanford.edu/diglib/ http://www.informedia.cs.cmu.edu http://elib.cs.berkeley.edu/ http://www.si.umich.edu/UMDL http://alexandria.sdc.ucsb.edu http://dli.grainger.uiuc.edu
Contenido de la biblioteca (Proyectos pertenecientes a la DLI)
Institución  Stanford  Carnegie-Mellon  UC Berkeley  Michigan  UC Santa Barbara  University of Illinois
Tipo de material manejado  Multimedios  Video digitalizado  Imágenes, mapas  Imágenes, texto  Mapas, imágenes, multimedia  Artículos de ingeniería
Enfoque  Interoperabilidad  Video digital  Colecciones distribuídas  Agentes de búsqueda  Búsqueda sin necesitar saber dónde se encuentra el material  Indexación, concept spaces
Material con Copyright  Si  No  No  No  No  Si
Acceso al publico en general  Si  No  Si  No  No  No
Cantidad  No aplicable  1,000 horas de video  1,724 documentos, 55,064 fotografís: 370 GB totales  No disponible  No disponible  18,000 artículos
Planteamiento del problema y solución (Proyectos pertenecientes a la DLI)
Institución  Stanford  Carnegie-Mellon  UC Berkeley  Michigan  UC Santa Barbara  University of Illinois
Áreas de interés  Interfaz de usuario, modelos de compra  Interfaz hombre-máquina, PLN, reconocimiento de la voz, transporte de datos y cobro de servicios a través de red.  Acceso a bases de datos distribuídas de gran tama&ntildeo  Interacción de agentes de búsqueda, interfaces de usuario, búsquedas inteligentes  Interacción a través de Internet, extensiones digitales a bibliotecas actuales  Búsquedas por concepto, relacionar términos de un mismo tema
Tecnologías utilizadas  Tecnología Orientada a Objetos  Reconocimiento del habla, reconocimiento de imágenes, procesamiento de lenguaje natural  Acceso por web  Acceso por web  Acceso por web  SGML, concept spaces
Productos utilizados  CORBA, SONIA, Java, HTTP, Z39.50, TCP/IP, Phyton  MPEG, Ethernet, Frame Realay, SMDS (Red de Bell Atlantic), TCP/IP  Java, Illustra/Informix  Java  Java  No disponible
Productos Desarrollados  Protocolo Infobus, DLIOP  Informedia, Netbill, News on Demand  Applets en Java para el acceso y visualización de mapas  Prototipo para evaluación  Prototipo para evaluación  Ninguno
             
Características generales    
Institución  G-7  De Monfort University  Comisión Comunidades Europeas  Yale    
Proyecto  Bibliotheca Universalis  ELINOR  ELISE  Project Open Book    
Países involucrados  Francia, Inglaterra, Japón, EEUU, Alemania, Canadá, Italia  Inglaterra  Inglaterra, Holanda, Bélgica, Irlanda  EEUU     
Patrocinadores/Socios  Líder de proyecto: Francia, con el Ministerio de la Cultura y la Biblioteca Nacional de Francia, Japón con la National Diet Library.  DMU, el Departamento de Desarrollo de Investigación sobre Bibliotecas de Gran Bretaña, y el Centro Científico de IBM en el Reino Unido  Instituto Internacional para Investigación de Bibliotecas Electrónicas (IIELR), DMU, IBM UK Scientific Centre, The Victoria and Albert Museum, Katholieke Universiteit Brabant (Tilburg University) de Holanda, Universidad de Limerick, Museo Hunt, Rad XEROX    
Presupuesto asignado  Designado por cada país  No disponible  No disponible  $31.32 dlls por libro para el equipo, $23.71 para el proceso de conversión     
Status  En progreso  Terminado, operativo  Primera fase (piloto) terminada. Iniciando segunda fase  Operativo, creciendo número de imágenes    
Mayor información  http://www.culture.fr/index.html http://ford.mk.ac.uk/Projects/Elinor http://severn.dmu.ac.uk/elise http://www.library.yale.edu/preservation/pobweb.htm    
Contenido de la biblioteca    
Institución  G-7  De Monfort University  Comisión Comunidades Europeas  Yale    
Tipo de material manejado  De dominio público  Libros de texto  Imagenes  Microfichas    
Enfoque  Documentos multimedia  Biblioteca texto completo  Biblioteca de imágenes de 24 bits  Conservación de material histórico    
Material con Copyright  No  Si  No  No    
Acceso al público en general  Si  No  Si  No    
Cantidad  No disponible  150 libros de texto  13,000 imágenes  2,000 volúmenes    
Planteamiento del problema y solución    
Institución  G-7  De Monfort University  Comisión Comunidades Europeas  Yale    
Áreas de interés  Interoperabilidad, distribución de informació;n  Digitalización de textos e imágenes, manejo de derechos de autor, indexación de documentos  Estándares, banco de imá;genes con texto asociado, integración de varios bancos de imágenes en un solo banco virtual.  Imágenes de todas las páginas de los libros     
Tecnologías utilizadas  A través de la Internet  OCR, TIFF, WWW  TIFF, JPEG, Cliente-Servidor, TCP/IP  Escaneo de imágenes con equipo Xerox, acceso al catálogo por web    
Productos utilizados  Información no disponible  EFS de Excalibur  INDEX+, Kodak PhotoCD, Visual Basic  Xerox's Document on Demand    
Productos Desarrollados  Ninguno concreto a la fecha  Biblioteca texto completo de 120 libros de texto, ELVIS, ERCOMS  Prototipo funcional, GUIs  Prototipo para acceso por WEB    

2.1 Surgimiento del área multidisciplinaria de Bibliotecas Digitales

La competencia por el financiamiento asignado para bibliotecas digitales en 1993 por DLI generó una serie de actividades y alianzas entre integrantes de la academia e industria en los Estados Unidos, de tal suerte que la convocatoria para un Primer Congreso Internacional sobre Bibliotecas Digitales (DL'94) obtuvo una respuesta muy entusiasta [Schnase et al. 1994]. En este evento, realizado en College Station, Texas, se discutieron los  diferentes aspectos de investigación, enfoques y proyectos en desarrollo y se formalizaron los esfuerzos para establecer una comunidad internacional de investigación y desarrollo en bibliotecas digitales. Se presentaron aquí también los resultados del Taller sobre Acceso Inteligente a Bibliotecas en Línea (IEEE CAIA'94) [Gladney et al. 1994], financiado por NSF.

DL'94 dio lugar a DL'95 [Shipman et al. 1995] y a la serie de conferencias (ACM DL'96-'98) que en 1996 fue adoptada por la ACM como el foro internacional por excelencia en el área. Paralelamente, la Sociedad de Computación de IEEE ha auspiciado la serie de congresos denominada "Avances en Bibliotecas Digitales" (ADL'94-'98) [IEEE 1998]. Otros foros para el trabajo actual en bibliotecas digitales incluyen el Simposio Internacional sobre Bibliotecas Digitales, celebrado anualmente en Japón [ISDL 1997], y el Congreso Anual sobre Bibliotecas Digitales del Reino Unido [ELVIRA 1997].

Entre las revistas arbitradas importantes que han surgido al establecerse bibliotecas digitales como área de investigación, sobresalen IJDL [1998], JoDI [1998] y la revista electrónica D-Lib [1998].

2.2 Definición

Como en toda área emergente, una definición universalmente aceptada de lo que es una biblioteca digital aun no se ha alcanzado, pero existen varios acercamientos que pueden ser de utilidad. La siguiente es una definición operacional:

Aunque las bibliotecas digitales heredan las funciones de sus análogos convencionales y comparten algunas de sus características, su importancia radica en lo que las hace diferentes. El medio digital hace posible, entre otras cosas, liberar a los usuarios de las limitaciones de los objectos físicos y sus contenedores (edificios, pastas, libreros), y hace posible nuevas prácticas y oportunidades, como el trabajo  cooperativo remoto, la visualización de información desde múltiples perspectivas y la personalización de recursos y servicios de la biblioteca.

2.3 Principales enfoques y aspectos de investigación

Entre los proyectos actualmente en desarrollo en el área, pueden notarse dos grandes vertientes que dan lugar a diferentes cuestiones que requieren investigación. Por un lado se encuentra la necesidad de construir las vastas colecciones digitales comprendiendo información validada y de utilidad para investigadores y estudiantes. Por otro lado, es indispensable desarrollar una gran variedad de servicios, aplicaciones, ambientes e interfaces que lleven al usuario las bondades del medio digital, permitiendo la efectiva utilización de las colecciones digitales y la interaccion con los demás usuarios de la biblioteca. Para autores como Lesk [1997], en los proyectos actuales en desarrollo en Japón es claro un énfasis en la primera de estas vertientes (digitalización), mientras que la mayoria de los proyectos estadunidenses se han enfocado a la segunda (construcción de servicios). En la comunidad europea se ha apreciado un balance en cuanto a los enfoques de los proyectos sobre estas dos vertientes.

Entre otros aspectos de investigación de la construcción de colecciones, son importantes los relacionados con:

En cuanto a la provisión de servicios, los aspectos de comunicación importantes incluyen: 2.4 Bibliotecas digitales en México

En México existe un interés creciente por participar en el desarrollo de bibliotecas digitales, conjuntar esfuerzos para producir avances y un efecto sinérgico que beneficie a todos los grupos interesados, así como la promoción del área para generar una comunidad de investigación y desarrollo en bibliotecas digitales.

2.4.1 Grupo de trabajo en bibliotecas digitales

Hasta ahora, los proyectos en el área se han dado en forma un tanto aislada. Por parte de la comunidad de bibliotecas, la mayoría de los esfuerzos se han orientado al uso de la tecnología para la automatización de catálogos y su consulta a través de la red global. En una investigación reciente [Trace 1998], se documenta que en el Sistema de Bibliotecas de la Facultad de Medicina de la Universidad Nacional Autónoma de México se planea la creación de una Biblioteca Médica Nacional Digital que aproveche la infraestructura con que ya se cuenta para hacer accesible su información a alumnos, académicos y profesionistas a nivel nacional.

Por parte de la comunidad de ciencias de la computación, los proyectos son variados y algunos apenas empiezan a insertarse al contexto de bibliotecas digitales. Sin embargo, varios eventos han propiciado un aceleramiento en el intercambio y la integración de los investigadores del área.

En el Encuentro de Computación de junio de 1997 se impartió un tutorial sobre bibliotecas digitales al que asistieron una veintena de miembros de la comunidad de computación del país. El material del tutorial se encuentra actualmente disponible en línea en http://ict.udlap.mx/dl/docs/dl-tutorial.ps). En mayo de 1997 se efectuó una primera reunión de investigadores interesados en el área, con la participación de los grupos del ITESM Campus Monterrey, ITESM Campus Morelos y de la Universidad de las Américas-Puebla.

Un mes después, durante el Tercer Taller de Computación NSF-Conacyt, uno de los grupos de trabajo se enfocó a la discusión del desarrollo e investigación en bibliotecas digitales. Participaron, por parte de México, investigadores de la BUAP, ITESM Campus Monterrey y Morelos, CICESE, INAOE, LANIA, UDLA-P, y CENIDET. Por parte de los Estados Unidos, estuvieron en este grupo investigadores de la Universidad Estatal de Nuevo México, de la Universidad de California - Irvine, de la Universidad Estatal de California en San Marcos y de la Universidad de Nuevo México. Entre los resultados de este encuentro [NSF 1998] pueden mencionarse:

  1. La definición de mecanismos para la difusión en México de los conceptos, beneficios y problemas de bibliotecas digitales, incluyendo páginas en WWW (actualmente en http://ict.pue.udlap.mx/dl) y un taller bi-nacional a celebrarse en 1999;
  2. La identificación de algunas áreas de cooperación y definición de proyectos bi-nacionales, como el desarrollo de medios de acceso multi-lingüe y la creación de colecciones de tesis electrónicas; y
  3. La identificación de algunas áreas de aplicación (por ejemplo, salud pública, medio ambiente y biodiversidad) como temas de interés especial para el desarrollo de bibliotecas digitales en México.
Para dar seguimiento a las actividades propuestas en el Taller de Computación NSF-Conacyt, la Red de Desarrollo e Investigación en Informática (REDII) del Conacyt convocó a tres reuniones de trabajo, celebradas en la Ciudad de México (11 de Agosto) y en la UDLA-Puebla (22 de Septiembre y 26 de Noviembre) [REDII 1998]. En éstas reuniones se ha dado a conocer con más detalle el trabajo de investigación que los participantes se encuentran realizando y se decidió formular el presente Programa Nacional de Bibliotecas Digitales para proporcionar un marco coherente e impartir dirección a los múltiples esfuerzos que se desarrollanen el país en esta área.

2.4.2 Trabajo actual en Bibliotecas Digitales en México

Refiriéndose a las vertientes señaladas en la Sección 2.3, el trabajo que ha venido realizándose en México puede ubicarse de la siguiente manera general:

Cada uno de estos proyectos se describen con mayor detalle en el Anexo B. Como puede apreciarse, existe ya una actividad importante en bibliotecas digitales, aunque los intereses de investigación y desarrollo de los grupos son diversos. Dada la importancia estratégica del área, se hace necesaria la definición y la promoción de un Programa Nacional de Bibliotecas Digitales que impulse el trabajo de los grupos actuales, genere oportunidades para nuevos proyectos, y en general que apoye el avance en esta nueva disciplina en México.

3. Programa Nacional de Bibliotecas Digitales

3.1 Objetivo General.

Promover la colaboración entre los miembros de las comunidades mexicanas de computación, bibliotecología y otras áreas relacionadas para impulsar la investigación y propiciar el desarrollo de bibliotecas digitales, con el fin de apoyar las actividades de difusión y generación de conocimientos mediante el uso de tecnologías de información y telecomunicaciones.

3.2 Objetivos específicos

3.3 Estrategia

El Programa Nacional de Bibliotecas Digitales provee un marco amplio para coadyuvar a la integración de los diferentes esfuerzos en el área y facilitar la colaboración entre quienes participan en los proyectos de investigación y desarrollo, tanto en el contexto nacional como con la comunidad internacional de bibliotecas digitales. Para ello, el Programa define una arquitectura general de bibliotecas digitales que servirá como referencia para los diferentes proyectos. El Programa establece también mecanismos de apoyo para foros de cooperación y difusión a nivel nacional e internacional y para proyectos enfatizando el desarrollo de recursos humanos y la vinculación de la academia con la industria y el sector gubernamental.

3.3.1 Arquitectura General de la Biblioteca Digital

Con el fin de establecer un marco de trabajo para los participantes en el proyecto, se plantea una arquitectura general de una biblioteca digital distribuída. Las características de esta arquitectura están basadas en las más generales que tácitamente han acordado múltiples grupos que trabajan en el área [Birmingham et al. 1994; Crane 1996; Fox et al. 1993; Gladney et al. 1994; Kahn & Wilensky 1995; Nürnberg et al. 1995].

Las bibliotecas digitales dentro del Programa operarán en un ambiente altamente distribuído. Los recursos de la bibliotecas se servirán a clientes con frecuencia remotos que solicitarán información y recibirán resultados empleando  protocolos de comunicación variados. Los usuarios de la biblioteca tendrán acceso a sus servicios a través de una amplia gama de interfaces. Las colecciones de datos utilizarán mecanismos de almacenamiento y manejadores de bases de datos avanzados.

Los principales participantes de las bibliotecas digitales serán los autores y editores, quienes producirán y validarán la información que será parte de las colecciones; los usuarios finales, quienes recuperarán la información y colaborarán en la biblioteca; y los bibliotecarios, quienes auxiliarán tanto a los usuarios finales a localizar recursos como a los autores y editores a publicar en la biblioteca de la forma más apropiada. Estas relaciones se ilustran en la Figura 1.


Figura 1. Participantes de la biblioteca digital (adaptado de Nürnberg et al. 1995])




Las bibliotecas digitales a desarrollar dentro del Programa deberán ser distribuidas, abiertas, escalables, y extensibles. Los proyectos se ubicarán en uno o más de los niveles que se ilustran en la Figura 2. Así, por ejemplo, los proyectos orientados a la construcción de colecciones digitales podrían incluir aspectos de los niveles físico y de abstracción; aquellos orientados a explorar aplicaciones en dominios específicos podrían incluir elementos del nivel de servicios; mientras que los proyectos que se enfoquen a investigar y desarrollar mecanismos de acceso y ambientes de colaboración se ubicarían al nivel de interfaces de usuario.


Figura 2. Arquitectura general de la Biblioteca Digital

3.3.2 Apoyo a Proyectos
 

Referencias

ACM.  1995.  Special issue on digital libraries. Communications of the ACM 38, 4 (Abril).

Akscyn, R. M., Witten, H. I. 1998. Report of First Summit on International Cooperation on Digital Libraries. Electronic document available from http://www.ks.com/idla-wp-oct98.

Birmingham, W., Drabenstott, K., Frost, C., Warner, A., and Willis, K. 1994.  The University of Michigan digital library: This is not your father's library.  In Proceedings of Digital Libraries '94 (College Station, Tex., June).  Hypermedia Research Laboratory, Texas A&M University, College Station, Tex., 53-60.

Bush, V. 1959. Memex II. Unpublished manuscript reprinted in From Memex to Hypertext: Vannevar Bush and the Mind's Machine, edited by James M. Nyce and Paul Kahn (1991). Academic Press. 165-184.

Bush, V. 1945. As we may think. Atlantic Monthly 176, 1 (Julio), 101-108.

D-Lib. 1998. D-Lib Magazine. http://www.dlib.org/.

Fox, E., Hix, D., Nowell, L., Brueni, D., Wake, W., and Heath, L. 1993. Users, user interfaces, and objects: Envision, a digital library. Journal of the American Society for Information Science 44, 8 (Sept.), 480-491.

ELVIRA. 1997. Proceedings of Electronic Library & Visual Information Research 4 (ELVIRA4, Milton Keynes, UK, May) (http://www.iielr.dmu.ac.uk/ELVIRA/ELVIRA4/proceedings.html).

IEEE. 1998. 5th Advances in Digital Libraries Conference (ADL '98, Santa Barbara, Calif., Abril). IEEE Computer Society, Los Alamitos, Calif.

IJDL. 1998. International Journal of Digital Libraries. Springer-Verlag, Heidelberg. (http://link.springer.de/link/service/journals/00799/index.htm).

ISDL. 1997. Proceedings of the International Symposium on Research, Development and Practice in Digital Libraries (ISDL'97, Tsukuba Science City, Japan, Nov.) (http://www.dl.ulis.ac.jp/ISDL97/).

JoDI. 1998. Journal of Digital Information. The British Computer Society & Oxford University Press. (http://jodi.ecs.soton.ac.uk/).

Kahn, R., & Wilensky, R. 1995.  A framework for distributed digital object services.  Tech. Rep. TN95-01, Corporation for National Research Initiatives, Reston, Va.

Lesk, M. 1997. Practical Digital Libraries: Books, bytes and bucks. Morgan Kaufmann Publishers, San Francisco, Calif.

Licklider, J. C. R. 1965.  Libraries of the Future.  MIT Press, Cambridge, Mass.

Nelson, T. 1977. Computer Lib/Dream Machines. Tempus Books (reprinted by Microsoft Press., Redmond, Wash.).

NSF. 1998. Third NSF-Conacyt Computer Science Workshop: Minutes of the Digital Libraries Working Group. Documento en línea disponible vía http://ict.udlap.mx/nsf-conacyt/dl-group.html.

Sánchez, J. A., Flores, C. A., and Schnase, J. L. 1999. Mutant: Agents  as guides for multiple taxonomies in the Floristic Digital Library. Proceedings of the Fourth ACM International Conference on Digital Libraries (DL'99, Berkeley, Calif., Aug.), en impresión.

Schnase, J., Leggett, J., Furuta, R., and Metcalfe, T. (Eds.).  1994. Proceedings of Digital Libraries '94 (College Station, Tex., June). Hypermedia Research Laboratory, Texas A&M University, College Station, Tex. (http://www.csdl.tamu.edu/DL94).

Shipman, F., Furuta, R., and Levy, D. (Eds.).  1995.  Proceedings of Digital Libraries '95 (Austin, Tex., June).  Hypermedia Research Laboratory, Texas A&M University, College Station, Tex.  (http://www.csdl.tamu.edu/DL95).

REDII. 1998. Minuta de la Reunión del Grupo de Trabajo en Bibliotecas Digitales. Documento en línea disponible vía http://ict.pue.udlap.mx/dl/minuta_22Sep.txt.

Trace. 1998. Modelo de biblioteca con acervos digitales y bases para desarrollar una plataforma nacional de redes de alta velocidad. Informe de Trabajo. Parte II: Investigación sobre bibliotecas digitales y proyectos en marcha en México y en el extranjero. Trace, S. C. Consultores. México, D.F. (http://ict.pue.udlap.mx/dl/docs/INVESTIGACION.ps).

Anexo A.

Integrantes del grupo de trabajo en bibliotecas digitales
 

Nombre Institución Dirección electrónica Página personal
Gerardo Ayala UDLA-P ayalasan@mail.udlap.mx http://gente.udlap.mx/~ayalasan
Felipe Bracho REDII-Conacyt brachoc@servidor.unam.mx
Rogerio Enríquez ITESM-Morelos rogerio@campus.mor.itesm.mx http://w3.mor.itesm.mx/~rogerio
Jesús Favela CICESE favela@cicese.mx
Lourdes Feria Univ. Colima lferia@ucol.mx
Alberto García UDLA-P alberto@mail.udlap.mx
David Garza ITESM-Monterrey dgarza@campus.mty.itesm.mx http://dgicii.mty.itesm.mx:8095/~dgarza
Carlos Hernández Trace Consultores trace@trace-sc.com
Santa Hernández ITESM-Morelos
Aurelio López INAOE allopez@acm.org http://cseg.inaoep.mx/pub/allopez/
Cristina Loyo Lania/SMCC clv@xalapa.lania.mx
Josefina Rodríguez CICESE jacobo@cicese.mx
Manuel Romero UNAM/IIMAS romero@cic1.iimas.unam.mx http://cic1.iimas.unam.mx/~romero
Alfredo Sánchez UDLA-P alfredo@mail.udlap.mx http://ict.udlap.mx/people/alfredo
David Sol UDLA-P sol@mail.udlap.mx http://gente.udlap.mx/~sol
Homero Ríos Lania torres@xalapa.lania.mx

Anexo B.

Proyectos en desarrollo en Mexico
 

B.1 CICESE

QBICAT es una herramienta que recupera imagenes en el Web a partir de una imagen ejemplo o palabras clave que describen el contenido de la imagen. La herramienta indexa las imagenes encontradas en páginas Web y selecciona un texto como asociado a la imagen usando heurísticas propuestas en base a las etiquetas HTML. Para encontrar los índices por contenido de la imagen, el algoritmo propuesto utiliza una descomposición Wavelet obteniéndose los coeficientes de mayor valor absoluto y además se localizan las palabras clave con mayor frecuencia en el texto asociado a la imagen. Para probar el sistema se desarrolló una colección relacionada con especies biológicas de la región de Baja California. Este es un sistema que permite almacenar y recuperar documentos necesarios para la planeación y desarrollo de revisiones técnicas, tales como orden del día, actas de minutas, acuerdos tomados durante el proceso y documentos sometidos a revisiones técnicas con comentarios o anotaciones de errores. Los documentos incluyen texto y gráficas. Los usuarios pueden hacer anotaciones sobre los documentos durante la reunión. El sistema se usa actualmente como apoyo en el desarrollo de sistemas de software. El sistema permite crear bibliotecas digitales multimedios de presentaciones en WWW. Basado en el sistema WP desarrollado en CICESE [Aguilar 1997], el sistema permite la captura del audio y documentos electrónicos utilizados durante una presentación a audiencias locales y remotas. El sistema sincroniza la presentación.

Proyectos en desarrollo.

Se plantea el desarrollo de una biblioteca digital que en una primera etapa contará con un acervo referente a temas de cursos que se impartan en el posgrado de ciencias de la computación. En etapas posteriores se pretende que incluya información cursos de otros posgrados en CICESE.

Para aumentar el potencial de la biblioteca digital se le agregarán herramientas que faciliten las interacciones casuales de un usuario con otros que en ese momento esten consultando el mismo material permitiendo con esto, que se tenga una mayor retroalimentación y un mejor aprovechamiento del material ahi presentado.

Uno de los elementos tecnológicos y de investigación de las bibliotecas digitales es el que se refiere al indexado y recuperación de información. Si bien se han propuesto varios algoritmos y estrategias para el indexado de información digital, principalmente texto y recientemente imagenes, apenas se empieza a explorar el efecto sinérgico de integrar técnicas de indexado y recuperación de distintos medios que frecuentemente ofrecen información redundante y complementaria en bases de datos mixtas. En este proyecto buscamos probar y desarrollar mecanismos de indexado y recuperación de información multimedia en bibliotecas digitales.

B.2 IIMAS

Se ha comprobado que un conjunto de autores producen mejores resultados  (documentos de mejor calidad) y de manera más eficiente gracias a la combinación de sus conocimientos, a la confrontación de sus experiencias y a la contribución de cada uno de los participantes. Además, esta área responde a una necesidad real y de actualidad, en la cual un conjunto de personas requieren herramientas eficientes que les permitan organizar, producir y mantener una misma documentación. Este proyecto integra un sistema de íconos que permiten explotar los derechos con los que actúan los autores sobre el documento e informar sobre las modificaciones realizadas.

B.3 INAOE

En esta àrea se ha venido trabajando bàsicamente en dos líneas: modelos de recuperación de información y extracción de información de textos. En el primer rubro se han desarrollado herramientas para hacer indexamiento y recuperación de información [Sanchez-Lopez &  López-Lópe 1997] así como modelos para mejorar la recuperación de información [López-López & Myaeng 1998; López-López & Tenorio 1997] . Por otro lado se ha buscado contar con mayor información de contenido de documentos con el fin de mejorar las capacidades de los sistemas de búsqueda y recuperación. La extracción de información se ha enfocado a resúmenes y títulos [López-López & Tapia-Melchor 1998; López-López & Montes 1998]. Recientemente se ha empezado a desarrollar una solución para el problema de extraer información textual relativa a imágenes en documentos. El primer objetivo es darle un tratamiento especial a esta información que permita realizar directamente recuperación de información de este tipo. Posteriormente, se busca que esta información pueda guiar el análisis de la imagen con el fin de obtener mayor información de su contenido. Con el fín de poder realizar administración de información en español, nos hemos dado a la tarea de recopilar y en su caso desarrollar herramientas para hacer tratamiento de lenguaje natural en Español. Con apoyo de REDII se ha estado trabajando en la creación de un Diccionario de Sinónimos para el Español, permitiendo comparaciones entre representaciones que sea más flexible que una simple búsqueda de palabras exactas. Asimismo se está colaborando con el Dr. Favela del Cicese en la codirección de una tesis doctoral para desarrollar un léxico del Español. Además se colabora con el Dr. Gelbukh del CIC-IPN en la extracción de un diccionario de patrones de manejo para el análisis sintáctico del Español. Se está co-dirigiendo una tesis doctoral del CIC-IPN encaminada a lograr desarrollar un sistema que permita llevar a cabo tareas de minería o descubrimiento de conocimiento a partir de textos. Este trabajo se está haciendo coordinadamente con el Dr. A. F. Gelbukh.

B.4 ITESM Campus Monterrey

Este proyecto plantea desarrollar herramientas de dominio público que permitan la fácil creación de (y acceso a) acervos digitales en Internet. El trabajo realizado se ha enfocado en los niveles de manejo de datos, abstracción y servicios de Biblioteca Digital. En particular las áreas en las que se trabaja involucran aspectos de almacenamiento y recuperación de información.

Como resultado parcial se ha desarrollado  Servidor Phronesis, el cual permite que cualquier persona (bibliotecario, autor o editor) con acceso a Internet  pueda almacenar documentos enviandolos vía WWW. y especificando los metadatos necesarios para facilitar su recuperación. Los metadatos se basan en el estándar internacional Dublin Core definido por OCLC (On Line Computer Library Center). El Servidor Phronesis permite que los usuarios realicen búsquedas booleanas  y categorizadas (ranked search) . Las búsquedas se realizan en el contenido completo del documento (full text search) y en sus metadatos. Una vez que el usuario localiza el documento, es posible tener acceso directo al mismo. Es posible contar con varios Servidores Phronesis donde cada instancia podría almacenar documentos con una cierta temática. Los usuarios pueden realizar búsquedas en diferentes Servidores Phronesis en paralelo de una manera rápida y transparente. Actualmente una versión funcional del Servidor Phronesis se encuentra disponible para almacenar y consultar documentos en http://dgicii.mty.itesm.mx/~phron. Durante el primer trimestre de 1999 estará disponible la distribución del software para que pueda ser instalado en diferentes plataformas UNIX.

B.5 ITESM Campus Morelos

B.6 SEP-UNAM-Academia de Ciencias (Trace Consultores)

B.7 Universidad de las Américas-Puebla

Este proyecto (http://digital.udlap.mx/porfirio) tiene como objetivo digitalizar, codificar y hacer accesibles los aproximadamente 70 mil telegramas generados durante el Porfiriato (1876-1910). Al estar disponible esta fuente primaria de información se pretende fomentar estudios de la época porfiriana, así como nuevos análisis de los movimientos económicos y políticos de esa etapa.  En una primera etapa (a concluirse en verano de 1999), financiada parcialmente por el Fideicomiso de Cultura México-Estados Unidos, se han desarrollado mecanismos de búsqueda y se están digitalizando 2000 telegramas para estudiar formatos, problemas de digitalizacion, catalogacion y acceso, y para evaluar usos potenciales. Con base en estos resultados se planteará un esquema para la construccion del acervo que contenga la totalidad de los documentos y metadatos asociados. Se están considerando el uso de Text Encoding (TEI) y Extended Markup Language XML para manejar dichos metadatos. En 1996 se estableció un grupo que ha venido trabajando en la definición de una arquitectura, modelo de datos y ambientes e interfaces de usuario para una biblioteca digital que apoye las actividades de la comunidad interesada en biodiversidad. La Biblioteca Digital Florística (http://ict.udlap.mx/projects/fdl) ha recibido apoyo del Centro de Informática Botánica del Jardín Botánico de Missouri por más de 200 mil dólares incluyendo equipo de cómputo, becas para estudiantes, sueldos para asistentes de investigación y viáticos. Los resultados incluyen el planteamiento de una arquitectura distribuida orientada a servicios de usuario [Sánchez et al. 1997], interfaces basadas en agentes para agilizar la introducción masiva de datos [Sánchez et al. 1998a; Jaramillo 1998], ambientes de colaboración para grupos virtuales [Fernández 1998; Morales 1999; Sánchez et al. 1998b], interfaces para visualización de datos taxonómicos [Amavizca 1998; Flores 1997; Sánchez et al. 1999] y para personalización de grandes espacios de información [Cabrera 1998; Pérez 1997]. También en la UDLA-P se desarrolla el  proyecto BIDACI, el cual investiga los componentes de software necesarios para generar un ambiente de aprendizaje colaborativo basado en una biblioteca digital en ciencias de la computación. BIDACI propone apoyar a mantener la calidad de la educacion en informatica y computacion en las instituciones mexicanas, especialmente en aquellas instituciones modestas que cuentan con muchos estudiantes pero insuficientes académicos en su facultad. Entre los resultados de su primera fase se encuentra una interfaz ya en operación que permite a los miembros de la comunidad de computación contribuir via WWW a la generación de un acervo en la materia [Agosto 1999, Sánchez & Ayala 1998]. Este proyecto ha iniciado el planteamiento de modelos de datos e interfaces para el manejo de datos en una biblioteca digital georeferenciada. Entre los resultados iniciales se encuentra una interfaz gráfica para la definición de elementos y capas que representan información espacial [Briones 1998].

B.8 Universidad de Colima

Un esfuerzo de gran relevancia para el área de bibliotecas digitales es el que ha se ha venido realizando en la Universidad de Colima, principalmente en la producción de discos compactos y materiales educativos multimedios (http://www.ucol.mx/CGSTI)

B.9 Federación Mexicana de Instituciones Particulares de Eduación Superior (FIMPES)

En toda institución existen materiales didácticos producidos por los propios maestros para el apoyo de sus cursos. Muchos de estos materiales son apuntes que están esperando ser rescatados, preservados y usados más ampliamente. Aun más, existen catedráticos que han publicado libros y problemarios, cuyos derechos han sido pagados por la Institución que promovió la obra. Asimismo, hay libros que se han usado durante muchos años y se han convertido en clásicos y en algunos casos ya no se imprimen. Estos recursos representan un gran suministro de información para apoyar el proceso de enseñanza-aprendizaje de nuestros estudiantes y su manejo digital una necesidad en nuestros tiempos, por lo beneficios múltiples que acarrea. El proyecto en su fase inicial, arranca con aquellos recursos relacionados con la enseñanza de la Computación e Informática (CeI) para todas las instituciones participantes en la FIMPES.