Bloque 4 - Estructuras de Datos
Arrays, registros, cadenas de caracteres y otros tipos de datos estructurados. Algoritmos de búsqueda y ordenación.
Tipos Estructurados
Las estructuras de datos pueden ser:
- Estáticas: estructuras de datos cuyo tamaño se conoce en tiempo de compilación.
- Arreglos.
- Registros.
- Dinámicas: estructuras de datos cuyo tamaño cambia en
tiempo de ejecución.
- Ficheros.
- Listas.
- Pilas.
- Colas.
- Árboles.
- Grafos.
Arreglos
Sobre los arreglos
Un arreglo o “array” es un tipo de datos estructurado que está formado por un número finito de elementos todos del mismo tipo que están situados en posiciones consecutivas en memoria y que se asocian con un único identificador.
- Todos los elementos comparten un tipo común: el tipo base del array.
- La posición que cada elemento ocupa en el grupo de datos se indica mediante el tipo índice.
Declaración de arreglos
Para declarar un array se deben especificar:
- El tipo de los elementos del array.
- Puede ser cualquier tipo.
- El número de elementos.
- Puede ser cualquier expresión constante entera.
Es habitual usar una macro para definir la longitud de una array.
Como cualquier otra variable, pueden recibir un valor inicial en el momento en que se declara.
La forma más común es una lista de expresiones constantes entre llaves y separadas por comas:
Si la inicialización es más corta que el tamaño del array, a los elementos restantes les asigna el valor 0:
Usando esta característica, se puede inicializar fácilmente con todas las posiciones a cero:
En una inicialización en declaración, la longitud de la matriz se puede omitir:
A menudo solo unos pocos elementos de una matriz deben inicializarse explícitamente, los otros elementos pueden tener valores por defecto.
En el compilador C99
se pueden usar la definición siguiente:
Los restantes se inicializan a cero.
El orden de inicialización no se tiene en cuenta:
Si no se expecifica el tamño, se deducirá a partir del último elemento especificado:
Arreglos constantes
Una arreglo se puede hacer constante al comenzar su declaración con la palabra const
:
Un arreglo que se haya declarado constante no debe ser modificada por el programa.
Indexación de arreglos
Para acceder a un elemento del array, se escribe el nombre del array seguido de un valor entero entre corchetes.
- Esto se conoce como subíndice o indexación del array.
- Puede ser cualquier expresión entera.
- Los elementos de un array de longitud
n
se indexan de0
an-1
.
Los arrays son una estructura de acceso aleatorio, se caracterizan porque se puede acceder de forma directa, y con el mismo esfuerzo, a cada uno de sus elementos utilizando el nombre de la variable de tipo array seguida de un índice.
El compilador de C no realiza la comprobación de los límites de los subíndices: si un subíndice se sale del rango, el comportamiento del programa no está definido.
Obtención del tamaño de un arreglo
La función sizeof()
permite determinar el tamaño de un array
en bytes.
Al dividir el tamaño de la matriz por el tamaño del elemento, se obtiene la longitud de la matriz:
Arreglos de varias dimensiones
Un arreglo puede tener cualquier número de dimensiones.
C almacena las matrices como valores consecutivos en orden de fila mayor, esto es, con la fila 0 primero, luego la fila 1, y así sucesivamente.
Arreglos en funciones
Cuando un parámetro de función es un array unidimensional, la longitud de la matriz se puede dejar sin especificar:
C no proporciona ninguna forma fácil para que una función determine la longitud de un array que se le pase.
- En su lugar, hay que proporcionar la longitud como un argumento.
Al llamar a la funcion se indica solo el nombre del array (sin corchetes):
Si un parámetro es una matriz multidimensional, solo se puede omitir la longitud de la primera dimensión:
Cadenas de caracteres
Sobre las cadenas de caracteres
En C, una cadena de caracteres o “string” se representa como un array de caracteres.
El valor de una cadena se escribe entre dobles comillas ""
.
Todas las cadenas en C terminan con el carácter nulo \0
.
Declaración e inicialización de cadenas de caracteres
Una cadena de caracteres se puede definir como:
Indexación de cadenas de caracteres
Se puede acceder a cualquier elemento de una cadena como un array.
Escritura y lectura de cadenas de caracteres
La escritura y lectura de cadenas se puede realizar con printf()
y scanf()
, usando el especificador de
conversión: %s
.
C permite utilizar funciones específicas de lectura y escritura de strings:
gets()
lee una línea completa, incluyendo espacios en blanco, hasta que encuentra un salto de línea.- Devuelve
NULL
si ha habido errores.
- Devuelve
puts()
escribe la cadena de caracteres junto con el carácter retorno de línea:
C también tiene definidas funciones específicas de lectura y escritura de caracteres:
getchar()
lee caracteres hasta que encuentra el final de ficheroEOF
(End of File).EOF
es un macro<stdio.h>
.
putchar()
escribe el carácter del argumento.
Registros
Sobre los registros
Un registro, estructura o “struct” es un tipo de datos estructurado que está formado por un número finito de elementos que pueden ser de distinto tipo y que se asocian con un único identificador.
Los distintos componentes de un struct denominan habitualmente “campos”.
Una estructura es una opción lógica para almacenar una colección de elementos de datos relacionados.
Declaración e inicialización de registros
En la declaración de un struct
se deben especificar el nombre y el tipo de cada campo.
Las propiedades de una registro son diferentes de las de un array.
- Los miembros de un registro pueden tener distinto tipo.
- Los miembros de un registro tienen nombre.
Para inicializar una estructura se siguen reglas similares a las de los arrays.
- No se tienen que inicializar todos los campos.
- Cualquier miembro sobrante recibe 0 como su valor inicial.
Acceso a los miembros de un registro
Para seleccionar un miembro en particular, se especifica su nombre, no su posición.
Se escribe el nombre de la estructura, luego un punto y luego el nombre del campo: registro.miembro
.
- El punto
.
utilizado para acceder a un miembro de la estructura es en realidad un operador de C. - Tiene prioridad sobre casi todos los demás operadores.
Copia de registros
La asignación de un registro a otro (registro1 = registro2
) copia los valores miembro a miembro.
- El operador
=
solo se puede utilizar con estructuras de tipos compatibles.
Aparte de la asignación, C no proporciona operaciones en estructuras completas.
- En particular, los operadores
==
y!=
no pueden utilizarse con estructuras.
Nombramiento de registros
Existen dos formas de nombrar una estructura:
- Declarar una etiqueta de estructura (
struct
). - Utilizar
typedef
para definir un nombre de tipo (un tipo nuevo).
La etiqueta se puede utilizar para declarar el tipo de variables:
Registros en funciones
Las funciones pueden tener estructuras como parámetros y valores de retorno.
Registros anidados
Se puede incluir una estructura como miembro de otra estructura.
Para acceder a los miembros de la estructura interior se requieren dos aplicaciones del
operador .
: registro1.registro2.miembro
.
Algoritmos de Búsqueda y Ordenación
Algoritmos de Búsqueda
Búsqueda Secuencial
La búsqueda secuencial consiste en comparar secuencialmente el elemento buscado con los valores contenidos en las
posiciones min..max
del array hasta que:
- Bien se le encuentre en la posición índice
i
. - O bien se legue al final del array sin encontrarlo.
- Concluyendo por tanto que no está en él.
Búsqueda Secuencial con Centinela
Al algoritmo de búsqueda secuencial se le añade en la posición n+1 el valor buscado (el centinela).
De esta forma en la condición de terminación del bucle se ahorra una comparación.
Búsqueda Binaria
La búsqueda binaria se basa en la comparación del elemento buscado con el elemento central del array.
Si el elemento central del array es el elemento buscado, la búsqueda ha finalizado.
En caso contrario, según sea buscado menor o mayor que ese elemento central se buscará en la primera o segunda mitad del array, respectivamente.
De nuevo se comparará el elemento buscado con el elemento central del subarray seleccionado y así sucesivamente hasta que o bien se encuentre el valor buscado o bien se pueda concluir que el elemento buscado no está en el array (porque el subarray de búsqueda ha quedado vacío).
Algoritmos de Ordenación
Ordenación Burbuja
El método de ordenación de la burbuja (Bubble sort) se basa en la comparación e intercambio de posiciones consecutivas.
Ordenación Rápida
El algoritmo de ordenación rápida (Quicksort), se describe como:
- Elegir un elemento de matriz
e
(el elemento de partición) y luego reorganizar la matriz de modo que:- Los elementos
1, ..., i-1
sean menores o iguales quee
. - El elemento
i
contienee
. - Los elementos
i+1, ..., n
son mayores o iguales ae
.
- Los elementos
- Ordenar los elementos
1, ..., i-1
utilizando Quicksort de forma recursiva. - Ordenar los elementos
i+1, ..., n
utilizando Quicksort de forma recursiva.