2. Trabajos Relacionados *

2.1 Conceptos de Visualización *

2.1.1 Definiciones de Visualización *

2.1.2 Metas de la visualización *

2.2 Trabajos Relacionados *

2.2.1 SDM ( Manipulación Dinámica Selectiva ) *

2.2.2 Visualización de Datos Corporativos *

2.2.3 Campos de estrellas ("Starfields") *

2.2.4 Geometría Hiperbólica para la Visualización de Grandes Jerarquías. *

2.2.5 Árboles de Conos (ConeTrees) *

2.2.6 WebTOC *

2.2.7 Pared Perspectiva (Perspective Wall) *

2.2.8 Cheops: Un Explorador de Jerarquías Complejas (A Compact Explorer For Complex Hierarchies) *

2.2.9 Fractales para visualización de jerarquías*

2.2.10 Tabla comparativa de proyectos *


2 Trabajos Relacionados

En este capítulo se tratarán algunos conceptos y características de la visualización, con el fin de dar una introducción al tema. También se presentarán algunos proyectos de visualización de los cuales se describirán sus técnicas, enfatizando aquellas que sean de utilidad al proyecto 3DTree. Si el lector desea una síntesis de este capítulo, puede referirse a la tabla de la sección 2.11.

 

2.1 Conceptos de Visualización

 

2.1.1 Definiciones de Visualización

La visualización es más que un método de computación. Es el proceso que transforma la información a una forma visual. Este despliegue visual resultante permite a los científicos o ingenieros percibir características que pueden estar ocultas en los datos.

Una definición útil de la visualización puede ser la transformación de los datos a una representación que puede ser percibida por los sentidos. Los resultados de esta transformación pueden ser visuales, auditivos, táctiles o una combinación de estos [Foley & Kibasky 1994].

 

2.1.2 Metas de la visualización

El crecimiento del poder de las computadoras, que permite la generación y procesamiento de una gran cantidad de datos, crea una necesidad de técnicas que faciliten la exploración, análisis y comunicación de los datos. Estas necesidades han sido cubiertas por la capacidad de las computadoras de presentar los datos de manera gráfica. La visualización busca explorar y entender los datos y la información, manejar los conceptos y procesos, obtener nuevas formas de ver los datos, hacer los invisible visible, hacer una presentación efectiva de las características significativas de los datos, incrementar la productividad científica y ser un medio de comunicación y colaboración.

 

A continuación se describirán algunos métodos que determinan las técnicas apropiadas para expresar el significado de los datos. Estas técnicas nos sirven para definir la meta que se desea para la visualización [Keller & Keller 1993]. La meta se puede formular escogiendo dos palabras de las dos listas siguientes, por ejemplo el caso de esta tesis será: categorizar estructuras.

 

Tipos de acciones en la visualización

 

Identificar: es establecer las características colectivas por las cuales un objeto puede ser reconocido.

 

Localizar: es determinar una posición especifica. Esta posición puede ser absoluta o relativa. Localizar puede ser asociado frecuentemente con una región espacial extendida.

 

Distinguir: es reconocer lo diferente o distinto. Solo se necesita reconocer lo diferente.

Categorizar: es establecer específicamente las divisiones de una clasificación.

Agrupar: es conjuntar en grupos cosas del mismo tipo, o similar o relacionado. La agrupación se ocupa para reunir las cosas que necesitan ser agrupadas de una forma conceptual o física.

Clasificar: un tipo de dato es darle un orden o posición con respecto a otros objetos de tipo similar.

Comparar: es examinar o notar similitudes y diferencias. La comparación es similar a la clasificación con la diferencia de que se realiza la comparación sin un orden explícito, se quiere comparar dos cosas porque se necesita saber en que difieren.

Asociar: se asocia cuando existe una relación entre dos o más objetos que en un momento dado pueden no relacionarse.

 Correlacionar: correlacionar es establecer una conexión directa.

 

 

Tipos de datos en la visualización

 

Escalares: un escalar es una cantidad que puede ser representada específicamente por un número o escala apropiada.

 

Nominales: un nominal es un objeto o propiedad de un objeto que puede ser distinguida de otros.

 

Dirección: una dirección es una posición en la que se refiere otra posición.

 

Forma: una forma es un objeto abstracto o real distinguido por la configuración de su superficie.

 

Posición: una posición es la localización especifica de un objeto. La posición puede ser relativa a un objeto como una forma o relativa a la representación física de una región como un mapa.

 

Región: la región es una porción continua o superficie o espacio que cumple con ciertos postulados geométricos; esencialmente es una representación en donde las medidas relativas o absolutas tienen un significado.

 

Estructura: una estructura es el arreglo de cualquier tipo de dato previo a otro que pueden ser considerados como un solo objeto. Una estructura implica conexión. Algunos ejemplos de estructura pueden ser ordenados como cíclicos o jerárquicos [Keller & Keller 1993].

 

 2.2 Trabajos Relacionados

 

2.2.1 SDM ( Manipulación Dinámica Selectiva )

 

SDM es un proyecto que presenta un conjunto de técnicas para la visualización en 2D y 3D. A este conjunto de técnicas se les llama Manipulación Dinámica Selectiva. Es selectiva porque provee un alto grado de control al usuario al seleccionar un conjunto. Es dinámico por todas las interacciones que ocurren en tiempo real y por la animación interactiva que se utiliza para proveer información contextual a los usuarios en respuesta a una acción u operación. La manipulación indica los tipos de interacciones que provee el sistema, los usuarios pueden mover directamente los objetos y transformar su apariencia para desarrollar diferentes tareas [Chuah et al.1995].

 

Debido a que SDM es un proyecto de visualización, para el diseño de éste se enfrentaron los problemas que a continuación se enuncian:

 

1. Los usuarios no pueden enfocarse a diferentes conjuntos de objetos en una forma detallada cuando aún están en contexto con el ambiente. Esto se hace especialmente importante cuando la cantidad de información que tiene que ser desplegada en detalle al mismo tiempo es muy grande.

 

2. Cuando la cantidad de información es muy grande existe el problema de que los objetos se interpongan entre ellos o se pierdan. La interposición de los objetos es un problema serio porque algunas partes de la información pueden ser completamente invisibles al usuario. De esta forma lo que ocasiona es que el usuario no perciba el espacio que representa dicha información. De forma adicional la interposición de los elementos hace que no se entiendan los patrones de los subconjuntos de información.

 

3. Un conjunto de datos puede tener elementos con gran diferencia de valores. SDM ofrece técnicas que cambian temporalmente las escalas de las barras de información mientras los mantiene en contexto con el ambiente. Esto puede ser visualizado en la Figura 6. Los cambios de escala en las barras se utilizan para remarcar las diferencias de valores en cada uno de los objetos.

 

 

Figura 6. Escalamiento para diferenciar los objetos (imagen utilizada con autorización de los autores [Chuah et al.1995])

 

4. Cuando existen muchos tipos de información sólo se permite a los usuarios que vean datos superficiales. No existen herramientas que permitan clasificar los conjuntos de elementos y salvar esas clasificaciones como nueva información que ha sido descubierta. Por ejemplo, si el usuario ha identificado varios puntos de problemática importante, el usuario podría querer guardarlos en un conjunto o cambiar su color para así diferenciarlos de los demás elementos.

 

5. Es difícil hacer comparaciones de cantidad en objetos gráficos que no son espacialmente contiguos. Por ejemplo en la Figura 7, sería difícil establecer los tamaños de las barras que están en el fondo del plano, porque no están a la misma distancia del usuario.

 

 

Figura 7. Distancias de los objetos al usuario (imagen utilizada con autorización de los autores [Chuah et al.1995])

 

 

 

Componentes de SDM

 

1) Selección centrada a los objetos

 

En una selección centrada a los objetos el enfoque o conjunto seleccionado está hecho de objetos. La selección de esos objetos está dada a través de representaciones visuales o restricciones. La interfaz de SDM permite combinar las restricciones de los datos de forma conjuntiva o disyuntiva. Una vez que los conjuntos de objetos han sido creados, deben ser guardados y nombrados. Todos los conjuntos que sean guardados serán mostrados.

2) Operaciones dinámicas y flexibles

 

Los usuarios pueden manipular los parámetros de los conjuntos de objetos a través de manejadores que permitan controlar directamente la información.

 

3) Restricciones de objetos y técnicas de retroalimentación

 

SDM introduce técnicas para que el manejo de la información soporte un control flexible y maleable. Por ejemplo, los objetos pueden ser elevados (Figura 8) o trasladados (Figura 7) a otra parte del plano. También los objetos pueden cambiar su grosor o altura.

 

Esta técnica permite identificar claramente un conjunto dado, mantener una escena del contexto, sostener una continuidad temporal, permite ver la relación que existe entre un elemento dado y el ambiente, además de que el conjunto puede ser regresado sin problema a su lugar de origen.

 

 

Aplicación de SDM a los problemas de visualización

 

Enfoque a un conjunto de objetos mientras se mantiene la escena del contexto

 

Mientras se navega a través del espacio de información casi siempre es necesario que el usuario se enfoque a ciertas partes del espacio. Sin embargo a través del enfoque y después de este, es importante que los usuarios puedan saber en donde esta localizado ese espacio de información. Este problema es solucionado mediante el uso de colores que diferencian a los objetos de interés. También pueden hacerse sobresalientes al conjunto de la información por medio del tamaño. De manera alternativa el usuario puede cambiar el conjunto de objetos al frente del plano como puede observarse en la Figura 8.

 

 

 

Figura 8. Conjunto de objetos seleccionados para ser elevados (imagen utilizada con autorización de los autores [Chuah et al.1995])

 

Visualización y análisis de objetos

Las barras de la información son de grosores y alturas muy variadas. La gran cantidad de barras representadas en el plano no permite ver claramente la dimensión de cada una de ellas. Es por ello que es de gran utilidad ofrecer la posibilidad de diversificar la escala de los objetos representados.

 

Aumento de la visualización con nueva información clasificada

 

Este caso se da cuando se genera nueva información durante el análisis de los datos. Para este problema es recomendable que la información no sea agregada hasta que cumpla con todos los requerimientos.

 

Una de las tareas más importantes de las bases de datos es la de la clasificación de los objetos. Para soportar esta tarea, SDM permite que los usuarios puedan cambiar de forma interactiva cualquier propiedad de un objeto de manera que si un conjunto de objetos no presentaba las propiedades de los demás objetos se pueda establecer alguna que tengan en común.

 

Comparación de los patrones, grosores y alturas de los objetos

 

En el proceso de análisis de datos los usuarios comparten varios atributos de los objetos. En la visualización estos objetos son representados en forma gráfica, de esta forma se reduce la comparación de parámetros diferentes. Sin embargo la comparación de grosores y alturas de los objetos es muy difícil. SDM permite a los usuarios desarrollar comparaciones entre objetos de diferentes profundidades dándole a los usuarios la oportunidad de establecer una línea en el plano. De esta manera se pueden mover los objetos tomando en cuenta a esta línea como referencia. Los objetos pueden moverse de adelante hacia atrás a través de la línea [Chuah et al. 1995].

 

Características aplicables al proyecto 3DTree

 

Muchas de las técnicas de este proyecto pueden ser de gran utilidad para el funcionamiento del proyecto. Estas técnicas son:

 

- la visualización detallada de objetos mientras se sostiene el contexto con el resto del ambiente

 

- la visualización de objetos excluidos elevándolos o reduciendo su grosor o altura para diferenciarlos de los objetos de todo el ambiente

 

- la visualización de diferentes conjuntos de objetos por medio de diferentes escalas

 

- la adición de nueva información a la visualización que no forma parte de los datos que están siendo expuestos

 

2.2.2 Visualización de Datos Corporativos

 

En este proyecto desarrollado por AT&T se introducen varias técnicas de visualización de datos. Esta tecnología puede ser vista a través de 4 casos de estudio que serán descritos a continuación:

 

Primer caso: Llamadas Internacionales Fraudulentas

 

Cada día AT&T maneja millones de llamadas internacionales. Aunque el porcentaje de llamadas fraudulentas es pequeño, los cientos de llamadas fraudulentas representan una pérdida para la empresa. Estas llamadas son pagadas por los clientes a través del aumento de las tarifas y de un mal servicio. Este problema comienza con la necesidad de identificar las llamadas fraudulentas entre todas las llamadas legítimas. El proceso de identificación de llamadas fraudulentas es difícil pues una vez que se encuentra la forma de detectarlas se van generando nuevas técnicas de esquivar las normas de seguridad. Usando la visualización se pueden detectar las llamadas fraudulentas a través de su comportamiento, si estas cumplen con patrones inusuales. En la Figura 9 se puede ver un patrón de llamadas que después fueron confirmadas como fraudulentas de un cliente que hizo 126 llamadas en un período de 8 horas en un fin de semana festivo [Eick et al. 1996].

 

Segundo caso: Comunidades de interés en llamadas locales

 

La empresa también requiere identificar aquellos clientes que necesitan servicios especiales como conferencias, regreso de llamadas, espera de llamadas de manera que el servicio sea adecuado a los perfiles del cliente. La compañía quiso establecer las características de los clientes que necesitaban servicios especiales para identificarlos se implementó un sistema que en donde cada nodo representa a un cliente y las líneas entre ellos representa las llamadas entre esos clientes. El color y el tamaño de los nodos representan el número de llamadas que los clientes realizan. Los nodos están posicionados de manera en que se muestren las comunidades de interés. Existen patrones de llamadas representadas muy claramente como el que se muestra en la Figura 10. El centro representa un grupo de clientes que se llaman frecuentemente o casi siempre. Los patrones del perímetro representan a los clientes que realizan menos llamadas. Existen algunos nodos que tienen forma de estrellas que por lo general representan a aquellos clientes que tienen adolescentes en sus casas y requieren de algún servicio especial como llamadas en espera.

 

 

 

Figura 9. Patrón de llamadas internacionales fraudulentas (imagen utilizada con autorización de los autores [Eick et al. 1996])

 

 

Tercer caso: Retención de clientes

 

Para la empresa es necesario saber las preferencias de los usuarios para establecer las razones por las que abandonan el servicio. Para conocer estas preferencias, se implementó un sistema que permite visualizar el patrón de cada cliente, por ejemplo, permite ver las preferencias de los clientes nuevos para ver por qué razones tomaron el servicio.

 

Cuarto caso: Visualización de Programas Diferentes

 

Las empresas acumulan bases de datos muy extensas que contienen documentos. El interés que AT&T tenia es el de visualizar las bases de datos que contienen código. Existen muchas situaciones en los que los usuarios de las computadoras necesitan comparar las diferencias, se tomaron en cuenta dos tipos de comparaciones: tener muchas diferencias entre dos archivos o muchas diferencias distribuidas en varios archivos. Las diferencias son denotadas por colores para indicar si se agregó, borró, se cambió o simplemente es el mismo código. Los archivos pueden ser comparados de lado a lado con las versiones en la izquierda y derecha. Las dos áreas de texto que contienen el código están sincronizadas, el texto puede ser manipulado como el usuario desee. Las líneas que aparecen sólo del lado izquierdo son del color rojo, las líneas que aparecen del lado derecho son de color verde, las líneas que aparecen del lado izquierdo y derecho pero que no son las mismas son de color amarillo y las líneas que son idénticas son de color gris. Las partes en las que el código es diferente pueden ser visualizadas en otra ventana. SI existen varias versiones de un solo archivo también pueden ser visualizadas al mismo tiempo. Para las partes del código que han sido cambiadas frecuentemente se muestran en colores brillantes, mientras que las partes obscuras representan código más estable. La visualización muestra claramente si una zona de código a sido reemplazada últimamente y varias veces, y si continúa acumulando modificaciones a través del tiempo. Esta problemática puede mostrar claramente a los usuarios que tienen problemas de reingeniería o que requieren un proceso de pruebas más estricto.

 

Principios Guía

 

Para el análisis de datos se crearon algunos principios de diseño como guía para la visualización:

 

Enfoque a las tareas

 

Para una buena visualización es necesario entender las tareas del usuario y analizar sus metas así como establecer su dominio del conocimiento.

 

 

 

Figura 10. Patrón de llamadas de clientes para servicios especiales (imagen utilizada con autorización de los autores [Eick et al. 1996])

 

Representación Específica del Dominio

 

La representación determina la forma en que los elementos de la base de datos están representados en la pantalla de la computadora. Las mejores representaciones son Específicas del Dominio, por ejemplo: los mapas para datos geográficos, nodos y ligas para diagramas de datos de red. Es difícil inventar la representación de un nuevo dominio de datos es proceso creativo e iterativo. La representación debe tomar todas las ventajas que da la percepción. Para entender las tareas de los usuarios, la representación debe proveer detalles de forma local dentro de un contexto global.

 

El Color

 

Para mostrar los detalles es bueno utilizar el color, estos proveen información adicional en el despliegue. El procesamiento de colores es el sistema de visión humano es un proceso perceptual independiente haciendo que el color sea una forma natural de codificación de información.

 

Alta Densidad de Información

 

La meta es utilizar cada uno de los pixeles de la pantalla para desplegar todos los datos, para maximizar la información contenida en la visualización. En algunos casos es posible desplegar todo el conjunto de datos en una sola pantalla sin problemas de enfoque de pequeña porción de datos.

 

Vistas Ligadas Múltiples

 

El poder de la representación se magnifica a través de la interacción y las listas ligadas. Al seleccionar y filtrar los datos en una vista propaga inmediatamente a vistas adicionales.

 

Información Detallada

 

Los usuarios van descubriendo patrones interesantes, necesitan acceso a los valores de datos actuales. Existen dos mecanismos para proveer datos detallados. Cuando el usuario toca cualquier elemento con el "ratón", los valores de los datos son desplegados.

 

Animación y Movimiento

 

La animación con cada marco representa un período de tiempo, es una herramienta ideal para analizar grandes conjuntos de datos. La percepción puede ser orientada para detectar el movimiento haciendo que la animación sea una técnica para buscar dentro de conjuntos de datos muy grandes [Eick et al. 1996].

 

Características Aplicables al Proyecto

 

Algunas de las características utilizadas en el caso de visualización de programas diferentes pueden ser utilizadas para el proyecto. Como son:

 

- el establecimiento de las diferencias entre un archivo y otro o un archivo con todos los demás. Para el caso de las taxonomías múltiples esto sería entre taxonomías

 

- la idea de la utilización de colores como es la de código de sólo el lado izquierdo de color rojo, sólo la del lado derecho de color verde, líneas parecidas de color amarillo y líneas idénticas de color gris. Los colores brillantes para cambios actuales (si es que pueden existir en las taxonomías) o también remarcar aquellas taxonomías que han sido cambiadas muchas veces

 

- el establecimiento de la representación específica del dominio, queriendo decir con esto que debe determinarse la forma correcta en que los elementos que están en la base de datos están representados en la pantalla de la computadora

 

- la utilización de vistas ligadas múltiples que en el momento de seleccionar y filtrar los datos en una vista propaga inmediatamente a vistas adicionales de la información

 

- la información detallada que permite accesar la información de un elemento en específico

 

- la animación y movimiento, herramientas ideales para analizar grandes conjuntos de datos

 

2.2.3 Campos de estrellas ("Starfields")

 

El campo de estrellas es la representación de los elementos del conjunto de resultados en puntos de luz en un mapa indicando la localización de cada elemento. Existe un prototipo basado en esta técnica utilizado para buscar películas el cual despliega los resultados con los ejes de coordenadas que representan el tiempo en el eje de las "x" y el grado de popularidad en eje de las "y" (Figura 11). Este sistema permite acercarse a una parte de espacio de popularidad y tiempo. El desplegador ajusta los valores de los ejes de acuerdo al acercamiento que el usuario realice. También el usuario puede obtener la información de un elemento en particular si escoge el punto que representa el elemento. El sistema provee una tarjeta que proporciona los atributos de la película como actores, actrices, idioma y director. De esta forma puede realizarse una exploración rápida de la información [Ahlberg & Shneiderman 1992].

 

Desafortunadamente, si este proyecto es aplicado en bases de datos muy grandes, el desempeño de la interfaz es muy lento. Actualmente se han hecho modificaciones al diseño de la interfaz y puede trabajar bien con bases de datos grandes. Se ha investigado la forma de que la interfaz funcione de una forma más eficiente. Los cambios que se proponen para la interfaz son:

 

Un subconjunto activo: se define un subconjunto "activo" de la base de datos, de tamaño limitado, que se almacenará en la memoria principal.

 

Estructuras auxiliares de datos: al subconjunto activo se le agrega un conjunto de estructuras de datos que facilitará la consulta continua.

Reprocesado: las estructuras de datos auxiliares cambian solo cuando el usuario selecciona la opción. El usuario tiene que esperar solo un segundo o menos para poder reconstruir las estructuras de datos.

 

Despliegue incremental: el despliegue de la información puede ser actualizado continuamente.

 

 

Figura 11. Campo de estrellas para buscar películas (imagen utilizada con autorización de los autores [Ahlberg & Shneiderman 1992])

 

 

 

Ya con estos cambios se ha comprobado que la interfaz puede mejorar notablemente su desempeño en bases de datos de gran tamaño [Egemen et al.1996]

 

 

Características Aplicables al Proyecto

De este proyecto la característica principal aplicable al proyecto puede ser el despliegue de la información mediante una consulta continua realizada por barras de desplazamiento que establecen los atributos de la información que se quiere visualizar.

2.2.4 Geometría Hiperbólica para la Visualización de Grandes Jerarquías.

 

Esta técnica asigna una gran cantidad de espacio para el despliegue de información de una porción de la jerarquía mientras esta porción aún se encuentra en el contexto de la jerarquía completa. La esencia de este esquema es la de desplegar toda la jerarquía de manera uniforme en un plano hiperbólico y navegar en este plano a través de una región circular. Existe una relación directa entre el enfoque y el contexto, así como una redirección continua del enfoque [Lamping et al. 1994]. La Figura 12 ilustra la interfaz de un prototipo basado en esta técnica y descrito a continuación.

 

Características del Navegador Hiperbólico

 

El navegador reemplaza la forma convencional de despliegue de árboles a través de un plano Euclidiano estableciendo un DESPLIEGUE por medio de un plano hiperbólico y representa la información a través de un CIRCULO UNITARIO. El CAMBIO DE ENFOQUE es manejado mediante una serie de transformaciones en el plano hiperbólico, moviéndose a través de las ramas del árbol. El ESPACIO para que la información de los nodos sea desplegada está establecido durante el despliegue y se transforma automáticamente con cada cambio de enfoque. El desplegador hiperbólico tiene una característica interesante que es la PRESERVACIÓN DE ORIENTACIÓN pues durante una traslación simple la mayoría de los nodos rotan en el despliegue, pero existe una línea de ellos que no rota. Estos movimientos pueden ser vistos en una serie de marcos en la Figura 13. En un plano Euclidiano si un objeto gráfico es movilizado siempre mantendrá su orientación original (sin rotar). Pero no existe lo contrario en el plano hiperbólico sino que el usuario experimenta una sensación de rotación a través de la navegación por medio de traslaciones. El plano hiperbólico también tiene la característica de TRANSICIONES ANIMADAS las cuales pueden mantener a los objetos en forma constante y ayuda al usuario a asimilar los cambios a través de las vistas. La naturaleza del plano hiperbólico permite desarrollar transiciones de enfoque poco a poco mediante una secuencia de vistas intermedias [Lamping et al. 1994].

 

 

Figura 12. Enfoque a un nodo preservando el contexto (imagen utilizada con autorización de los autores [Lamping et al. 1994])

 

 

Figura 13. Transición animada

 

Características Aplicables al Proyecto

 

Para el manejo de muchas jerarquías que necesitan ser visualizadas completamente en el espacio de una pantalla de computadora el uso de un plano hiperbólico tiene grandes ventajas como son:

- la visualización de toda la jerarquía mientras se establece el enfoque de una zona en particular

- existe una relación de cada una de las zonas con la información completa mediante el enfoque

- preserva la orientación

tiene transiciones animadas

 

Las formas convencionales de visualización de jerarquías sólo permiten utilizar una parte de la información que es más grande que la zona de despliegue y sólo utiliza la barra de desplazamiento para moverse a través de la información [Lamping et al. 1994].

 

2.2.5 Árboles de Conos (ConeTrees)

 

Este proyecto fue realizado en la Universidad de Brown. Es una herramienta práctica para la visualización de información jerárquica. Hace uso del espacio tridimensional para desplegar más información de la que es posible en un espacio de bidimensional. Aprovecha las habilidades mentales del hombre para interpretar grandes conjuntos de datos de manera rápida. Hace uso de varias características visuales como son el color, la forma y el tamaño. Todas estas características han hecho que el árbol de conos sea una herramienta muy útil para la visualización de información [Robertson et al. 1991].

 

El árbol de conos funciona de la siguiente manera: los primeros conos de información que han de ser visualizados serán obtenidos de un grupo de objetos que el usuario seleccione para que después de esto el usuario indique a la herramienta que debe generar el árbol jerárquico. La jerarquía que resulta será desplegada en la pantalla. El modelo de conos que se genera es tridimensional y dichos conos pueden cambiar de tamaño si el usuario así lo desea. La modificación del tamaño de uno de los conos provocará que los demás cambien su tamaño automáticamente de forma proporcional. La herramienta también permite "podar" los nodos del árbol y cambiar de lugar los nodos con los controles del ratón. Se puede visualizar la sombra del árbol en el plano inferior de la pantalla para que el usuario pueda obtener información de adicional de los datos que están siendo desplegados.

 

Para dar más características de la información que está siendo visualizada el árbol de conos proporciona información de los archivos como su tamaño, antigüedad y tipo utilizando tamaño, color y forma, respectivamente. El principio se basa en que la mente puede interpretar la forma, color, tamaño y relaciones espaciales de forma muy rápida y otras características similares sin que tenga que navegar para obtener esa información. Pero el árbol de conos no es una herramienta que pueda utilizarse para la búsqueda de archivos en la estructura de un árbol. Es una herramienta excelente para determinar características generales.

 

Tamaño de los nodos

 

En la representación de la información puede ocurrir que los nodos del árbol sean de diferentes tamaños de forma dramática. La diferencia de tamaños puede hacer de cierto modo difícil la visualización para los usuarios. Para solucionar este problema lo que se hizo es permitir el escalamiento de los nodos aunque se dice que el escalamiento puede ocasionar que se destruya el enfoque que se crea a través de una vista perspectiva. Pero esto puede ser compensado al utilizar la sombra del árbol, con las sombras se puede distinguir si un nodo es del doble de tamaño que otro. Sin las sombras los nodos podrían tener formas tridimensionales idénticas.

 

Colores

 

Los colores se utilizan para distinguir la antigüedad de los archivos. Los tonos pueden variar de rojo a color de rosa indicando el tiempo de acceso que tiene un archivo o directorio

 

 

Iconos

 

Se utilizaron iconos de forma trivial para indicar el tipo de archivo. Las pirámides indican que es ejecutable, las elipses indican que son directorios y los cubos escalados que son archivos normales.

 

Control del rango

 

En ocasiones el usuario desea saber si los archivos han sido modificados en los días anteriores o si tienen años sin ser utilizados, pero sería realmente difícil distinguir que color representa archivos modificados en ese tiempo. Para resolver este problema se permite que el usuario tenga un control interactivo con el mapa de colores.

 

Control de la Complejidad Visual

 

Para el usuario es de gran utilidad que pueda habilitar o no la complejidad. El sistema permite que el usuario habilite o no todos los canales visuales. La habilidad para seleccionar la complejidad de la escena es importante porque asegura que el usuario no se sature de información. También es de gran utilidad agregar herramientas de simplificación. Se piensa por ejemplo en podar una rama o disminuir su tamaño. También sería de gran utilidad que a los nodos se les puedan cancelar el despliegue de los hijos [Robertson et al. 1991].

 

 

Características Aplicables al Proyecto

 

Esta tesis puede beneficiarse de diferentes características introducidas por ConeTrees. Por ejemplo:

 

- la utilización de un árbol jerárquico tridimensional para la representación de información;

- la distribución de los nodos en forma de "cono";

- la habilidad del árbol para cambiar de tamaño según lo pida el usuario;

- la opción de la herramienta para realizar la poda de nodos

- el uso de colores para diferenciar el tipo de información que se está representando;

- el tamaño de los nodos para representar que existe diferencia de tamaño entre los objetos representados en el árbol;

- el uso de colores, para distinguir cada uno de los nodos;

- el control que permite que el usuario maneje el rango de colores para poder diferenciar los objetos de acuerdo a las características que el usuario requiere visualizar.

 

2.2.6 WebTOC

 

Esta es una herramienta utilizada en la Biblioteca Digital del Congreso de los E.E.U.U. Fue diseñada debido a que los administradores y usuarios de una biblioteca digital tienen que manejar gran cantidad de información y su distribución a través de un conjunto ligado de documentos. Los bibliotecarios digitales tienen que manejar directorios de gran magnitud y necesitan herramientas que les faciliten la visualización de las estructuras de los directorios y el tipo de datos contenidos en ellos. La navegación de grandes cantidades de documentos en colecciones que van creciendo constantemente no es una tarea fácil dado que el tamaño de estas colecciones es tan grande que es difícil de entender. WebTOC es una herramienta que ayuda a los usuarios a navegar y organizar las colecciones de información generando automáticamente una tabla jerárquica del contenido de un "site". Esta herramienta tiene dos estrategias: seguir las ligas existentes o utilizar los directorios. WebTOC consiste en dos partes: una es un programa que genera la tabla de contenidos representando el "site", y la interfaz del usuario que permite la interacción con un navegador de Web convencional. Tiene dos marcos de despliegue en donde permite al usuario expandir o reducir la tabla de contenidos presentada en forma de resumen en el marco izquierdo, mientras se inspecciona cualquier elemento de la tabla de contenidos en el marco derecho [Nation et al. 1997].

 

Características de WebTOC aplicables al proyecto

 

- la separación de la pantalla en dos marcos, una para el árbol de visualización jerárquica y otro para la visualización de cada uno de los objetos obtenidos al final de los nodos.

 

- la utilización de barras para la representación de la cantidad de documentos contenida en los nodos del árbol

 

- la sombra que representa la cantidad de documentos

 

- los colores para diferenciar el tipo de datos desplegados

 

- la utilización de la cercanía de una zona de elementos separada del contexto

 

- la colocación de un elemento al centro de la pantalla al momento en que este es seleccionado

 

- la búsqueda de elementos parecidos a un elemento seleccionado

 

2.2.7 Pared Perspectiva (Perspective Wall)

 

Los problemas principales de visualización de estructuras de información lineal son: la gran cantidad de información que debe ser desplegada y la dificultad de acomodar toda la información dentro de la pantalla. Una técnica común para la visualización de información lineal mientras se integra lo que es el detalle al contexto es el tener dos vistas simultáneas: una vista que acerca una región de trabajo y una vista detallada que distingue una región de trabajo del resto. Una vista por lo general contiene una indicación de su localización en forma detallada que puede ser manipulada por movimientos rápidos a través del espacio de trabajo. Sin embargo cuando una región es acercada para visualizarla el espacio de trabajo se hace menor [Mackinlay et al. 1991].

 

La Pared Perspectiva integra las vistas detalladas y contextuales para soportar la visualización de espacios de información estructurados de forma lineal utilizando la animación interactiva en 3D para resolver los problemas de integración. La pared perspectiva integra un despliegue de 2D en una "pared" en 3D que tiene una región central para ver los detalles por medio de dos perspectivas, una en cada lado, para visualizar el contexto. Esta distorsión intuitiva del despliegue permite utilizar el espacio de manera eficiente y permite pequeñas transiciones en las vistas.

 

 

Implementación de la Pared Perspectiva

 

La metáfora de la Pared Perspectiva se utiliza para distorsionar un despliegue arbitrario en 2D en una visualización en 3D (que es la pared), mientras se retiene cualquiera de las tareas específicas de las tareas en 2D. Es más importante que se diseñen los elementos sin un tamaño específico y que existan versiones en escalas más pequeñas de cada uno de ellos. Los tableros perspectivos están sombreados para no perder la percepción de las 3 dimensiones. Esta visualización intuitiva provee un espacio de utilización eficiente para despliegues de 2D con espacios anchos de despliegue. La dimensión vertical de la pared puede ser utilizada para visualizar las capas en un espacio de información. La pared perspectiva sostiene tarjetas que representan archivos en un sistema de computadora que esta estructurado por fecha de modificación y tipo de archivo. La vista perspectiva tiene la gran ventaja de hacer que la cercanía de la vista detallada más grande está más distante que las partes del contexto. Una ventaja mayor de la pared perspectiva es su metáfora intuitiva en 3D para distorsionar los despliegues en 2D que permiten las transiciones entre vistas [Mackinlay et al. 1991].

 

Cuando el usuario selecciona un elemento, la pared mueve ese elemento a la zona central de la pantalla con una pequeña animación. Esta animación ayuda al usuario a percibir la constancia de los objetos, lo cual conduce al sistema de trabajo perceptual que se requiere para que el sistema cognitivo reasimile la vista después de que esta ha cambiado. La relación entre los elementos en el detalle y contexto es obvia. La pared perspectiva ha sido utilizada para visualizar varios tipos de información. La técnica ha sido utilizada para memorándums de empresas y reportes. La técnica es particularmente efectiva cuando se combina con una técnica de retroalimentación que permite al usuario seleccionar un elemento y encontrar uno similar en los demás elementos relacionados. La pared perspectiva hace fácil visualizar los resultados de esa retroalimentación porque muestra todos los elementos similares de forma simultánea y en contexto.

 

Características Aplicables al Proyecto

 

- utilización del acercamiento de una zona de elementos de todo el contexto

 

- colocación de un elemento al centro de la pantalla al momento en que este es seleccionado

- búsqueda de elementos parecidos a un elemento seleccionado

 

2.2.8 Cheops: Un Explorador de Jerarquías Complejas (A Compact Explorer For Complex Hierarchies)

 

Cheops es un proyecto novedoso para la representación, navegación y exploración de información jerárquica compleja y muy grande como el Sistema Decimal Dewey que puede contener entre un millón y un billón de nodos. Cheops mantiene el contexto de la información en una jerarquía muy grande mientras de manera simultánea permite accesar de forma detallada la información muy fácilmente [Beaudoin 1998].

 

Técnicas de visualización utilizadas

 

Este proyecto está orientado al control de navegación y la representación gráfica del camino que ha seguido el usuario. Para la realización de estas metas la navegación y las tareas de exploración en estructuras jerárquicas complejas se utilizaron las siguientes técnicas:

 

 

Representaciones clásicas

 

Las representaciones clásicas de árboles de jerarquías no requieren que el usuario separe la información para ver fragmentos de ella. El entendimiento del contexto global está restringido por la memoria del usuario porque el contexto global y los detalles no se presentan simultáneamente. Se provee una vista condensada de toda la jerarquía para proporcionar un soporte al esfuerzo cognitivo.

 

 

Técnicas de enfoque y contexto

 

Un área de la investigación activa es la técnica de "fish-eye" o del enfoque y contexto. Estas técnicas fragmentan la información de manera que proveen una zona en detalle mientras el contexto global se mantiene a través de varios procedimientos visuales de compresión. La técnica de "fish-eye" determina el tamaño y la posición de la información utilizando la función del grado de interés DOI (Degree of Interest). Por lo general la función DOI utiliza la distancia del enfoque a priori de la importancia de la información. El método de enfoque y contexto es muy útil para cierto tipo de visualización de información. Existen algunos problemas con el método, especialmente cuando se aplica a jerarquías complejas. Un incremento en la pendiente de la función DOI ocasiona que la información contextual se distorsione más. Otro problema es que la gran cantidad de información provoque que los elementos del árbol se hagan tan pequeños que no puedan percibirse. Un problema adicional con el método de enfoque y contexto es su velocidad. Cuando se cambia el enfoque el tamaño y la localización de la información deben cambiar. Esto requerirá que la vista se recalcule. Para que la animación cambie suavemente algunos métodos redibujan la vista varias veces por segundo. Esto se hace difícil cuando la jerarquía se hace más complicada ocasionando que la velocidad se disminuya y cuando el número de nodos es muy grande.

 

El método de Cheops

 

El método de Cheops está basado en la visualización comprimida de un conjunto de datos jerárquicos. El componente visual de éste método es un triángulo. En la Figura 14 se presenta un árbol jerárquico binario en forma lógica y en la Figura 15 se muestra el mismo árbol en la forma Cheops.

 

Si pensamos que la segunda figura es una versión comprimida de la primera figura, entonces el triángulo 5 puede representar el nodo E o el nodo F de la primera figura. En Cheops, si el triángulo 2 es seleccionado y el triángulo 5 será el nodo E. Si el triángulo 3 es seleccionado entonces el triángulo 5 será el nodo F. La representación visual de cada rama lógica de la jerarquía es por lo tanto el resultado de un despliegue específico de los niveles previos. Si una jerarquía muy grande se representa por el tipo de despliegue de la segunda figura, los componentes visuales expresaran muchos nodos lógicos. Los triángulos se insertan y se sobreponen entre dos puntos finales de una capa de la estructura fundamental, se pueden distribuir los nodos lógicos. La resolución de Cheops que se ha logrado se muestra en la Figura 16, en la que se muestra la expansión agregando 5 hijos por cada padre.

 

 

Figura 14. Árbol jerárquico binario (adaptado de [Beaudoin 1998])

 

 

Figura 15. Forma de despliegue Cheops (adaptado de [Beaudoin 1998])

 

 

La máquina de Cheops está basada en objetos. Esto permite la acoplación de jerarquías visuales y lógicas. Es fácil extraer la información estructural y representar la información en otras metáforas, como opciones correspondientemente con Cheops. Puesto que la representación de Cheops toma menos espacio de la pantalla, es posible desplegar la información estructural en conjunción con la descripción del contenido real de un objeto visual.

 

Figura 16. Expansión del árbol

 

 

Terminología y características visuales

 

Existen varios características visuales que fueron desarrolladas para hacer una interpretación correcta de la jerarquía presentada por Cheops, algunas de estas características son:

 

- un nodo seleccionado

- un nodo hijo

- un nodo tío

- un nodo singular

- un nodo sobrecargado

- un nodo no utilizado

 

Un nodo seleccionado es un nodo escogido por el usuario, cuando está navegando por la jerarquía. Cuando se selecciona un nodo, el usuario estará investigando la parte de la jerarquía que esta asociada a él. Todos los nodos de un mismo nivel son nodos tíos y cambian de color. Todos los hijos del nodo escogido también cambian de color. Un nodo singular indica que solo un nodo lógico está asociado con un objeto singular. Un nodo sobrecargado indica que existe más de un nodo lógico asociado a ese objeto. Un nodo no utilizado es un nodo que no forma parte de la jerarquía seleccionada. No existen nodos que no han sido utilizados cuando se tiene escogida la raíz. Los nodos se convierten en nodos no utilizados cuando el usuario comienza a descender por la jerarquía. Cuando la jerarquía se despliega inicialmente la jerarquía es mostrada por completo. Cuando un componente visual, que no es la raíz, es seleccionado, la jerarquía asociada con ese nodo se despliega. Cualquier componente visual que no este asociado con el nodo seleccionado será considerado como nodo no utilizado.

 

Contexto dinámico y de navegación

 

Una de las metas principales de Cheops es la de proveer una manera eficiente de navegar jerarquías. Esto se logra seleccionando un componente visual. Cuando se selecciona una rama de la jerarquía asociada con el componente esta rama es expandida para que pueda ser visualizada. Esto forma un nodo de referencia del cual n subconjunto de referencias jerárquicas es representado. Seleccionando nodos diferentes, el usuario interactúa dinámicamente con la representación de la jerarquía. Con ese modelo de navegación dinámica, los usuarios pueden mantener o restringir la vista que tienen sobre el contexto de la rama desplegada y sus subramas, así como la información que corresponde a esa jerarquía.

 

Existen dos técnicas de acceso que se han desarrollado para el despliegue y exploración de la representación dinámica contextual: la selección y preselección

 

Selección

 

La técnica de selección permite que el usuario establezca un estado de referencia para la jerarquía, o la selección de un nodo, y la estructura de la sub-jerarquía esta dada por la sustracción de las ramas fuera de la selección.

 

Preselección

 

La preselección permite al usuario para explorar alrededor y bajo el nodo seleccionado correspondiente sin seleccionar un nodo nuevo. Cuando el cursor entra a un componente visual, toda la rama asociada con el nodo lógico se ilumina automáticamente, pero no se selecciona. Si se introduce un nodo sobrecargado, la rama del primer nodo lógico se presenta en orden de profundidad. Cuando se presiona cualquier elemento del ratón, el método se ciclará a través de la lista de todos los nodos asociados con el componente visual. Esto permite que el usuario accese cualquier rama entre la jerarquía. La preselección permite al usuario un acceso rápido para cualquier nodo en la jerarquía, sin seleccionar y de-seleccionar ramas.

 

Métodos adicionales de acceso

 

La exploración en la representación en Cheops puede ser asistida por la selección de diferentes atributos y herramientas de acceso rápido, extendiendo los detalles de la selección del contexto. Estos atributos de selección y la compresión de las facilidades de la estructura de facilita la navegación a través de la jerarquía esto para cumplir con la exploración y la localización de información. Cheops tiene dos métodos de acceso: las cajas de opciones y los botones de navegación

 

Cajas de opciones

 

Están situadas a la derecha de la pirámide, con una opción por nivel. Cuando un nodo es seleccionado, la caja de opciones es actualizada con los nombres de los nodos lógicos hijos. Cuando el usuario utiliza las opciones, la rama seleccionada de la jerarquía es iluminada. El usuario nunca pierde el contexto conforme va descendiendo del área de interés.

 

Botones de Navegación

 

Dependiendo del área de la pantalla y el número de nodos, la distancia entre los triángulos puede hacerse pequeña. Los botones de navegación permiten que el usuario se mueva a través de la pirámide sin utilizar los triángulos.

 

Características Aplicables al Proyecto

 

Cheops tiene varias características útiles al proyecto como son:

- mantener el contexto, el usuario puede realizar su búsqueda a través de la jerarquía sin perder el contexto global

- enfoque detallado que permite la visualización de un objeto específico

- uso de colores para distinguir cada uno de los hijos representados en el árbol

- ocupa poco espacio para desplegar toda la información

- selección y preselección

 

 

2.2.9 Fractales para la visualización de grandes jerarquías

 

Este proyecto se enfoca también a los problemas relacionados con la visualización de grandes jerarquías. La idea principal consiste en aplicar un fractal al despliegue del árbol haciendo posible que se interactúe con un árbol muy grande de la misma forma que a cualquier nivel del árbol. Esto se debe a las características geométricas de los fractales, por la similitud consigo mismos. Es importante que el número de nodos que puedan reconocerse sea casi constante en el marco de trabajo. Los usuarios casi siempre pueden ver el mismo número de nodos. Se utiliza la dimensión del fractal, la cual es la medida de complejidad. Los fractales generados a partir de otro tienen la misma complejidad que el padre aunque tengan diferentes formas y por ello se permite que el número de nodos desplegados sea constante. La presentación de este árbol está basada en el árbol de conos que ha sido mencionado anteriormente en la sección 2.2.5.

 

2.2.10 Tabla comparativa de proyectos

 

En la Tabla 1 se muestra una tabla comparativa de las características principales de los proyectos mencionados anteriormente. El nombre del proyecto o sus siglas se encuentra en la parte superior de la tabla y las características de cada uno de los proyectos son las que están enlistadas en la parte izquierda de la tabla.

 

Por medio de la tabla se pueden obtener fácilmente las características de cada uno de los proyectos y es posible identificar que varios de ellos coinciden en algunas características.

 

Como puede observarse Selective Dinamic Manipulation (SDM) es el que cumple con el mayor número de características de la tabla, las cuales un buen número de ellas pueden adaptarse a 3Dtree como se ha mencionado anteriormente en este capitulo. Dentro de estas características se encuentran el enfoque detallado, el escalamiento, el agrupamiento, el almacenamiento de preferencias, los colores, la manipulación de parámetros, la elevación, la traslación y la nueva información a agregar. Otros de los proyectos contenidos en las tablas que contienen características importantes de aplicación son ConeTrees y Fractals, estos proyectos (como puede observarse en la tabla) coinciden con algunas características de SDM y poseen otras de gran utilidad como son: la manipulación de los nodos, el manejo de posición, el despliegue completo de información, la preservación del contexto y la preservación de la orientación. A diferencia de ConeTrees, Fractals permite la compresión de la información. También podemos observar que existen proyectos con características propias, es decir que no son utilizadas por otros proyectos como es el caso de la Pared Perspectiva en la utilización de las sombras (sección 2.2.7) y WebTOC en la utilización de iconos (sección 2.2.6). Las características que comparten la mayoría de los proyectos son el enfoque detallado, el uso de colores y el despliegue completo lo que nos conduce a pensar que son altamente aplicables a los proyectos de visualización.

 

Todo el estudio realizado a estos proyectos y la obtención de las características que corresponden a cada uno de ellos nos ha permitido observar que son aplicables al proyecto, en el siguiente capitulo se describe la forma en que serán aplicadas y utilizadas en 3DTree.

 

Tabla 1. Comparación de las características principales de los proyectos