Visualización de información en mensajes de documentos de texto. Agrupación y visualización de información textual. Descripción de la lección gratuita

VISUALIZACIÓN DE INFORMACIÓN EN DOCUMENTOS DE TEXTO

Visualización - presentación de información en forma visual. La información del texto se presenta en forma de listas, tablas, diagramas y se suministra con ilustraciones (fotografías, diagramas, dibujos).

Liza

Todo tipo de listas en documentos se elaboran utilizando liza... Los elementos de la lista se consideran párrafos, elaborados de acuerdo con una única muestra. Según el método de diseño, las listas se pueden numerar y marcar con viñetas.

Los elementos lista numerada denotado por números o letras (latín o ruso).

Los elementos lista con viñetas indicado por iconos- marcadores.

Por estructura, las listas se distinguen: de un solo nivel y de varios niveles. Todos los ejemplos discutidos anteriormente son hermanos

Una lista cuyo elemento es en sí mismo una lista se llama multi nivel.

Mesas

Para describir varios objetos con el mismo conjunto de propiedades, los más utilizados son mesas que consta de columnas (gráfico) y filas.

La información presentada en la tabla es clara, compacta y fácil de entender.

Una tabla con el formato adecuado tiene la siguiente estructura:

Las celdas de las tablas pueden contener textos, números, imágenes.

Tabla de ejemplo:

Puede crear una tabla usando el elemento de menú apropiado o el botón en la barra de herramientas, especificando el número requerido de columnas y filas; algunos procesadores de texto pueden dibujar una mesa. La tabla creada se puede editar cambiando el ancho de la columna y la altura de la fila, fusionando y dividiendo celdas. Puede ingresar información en las celdas de la tabla de la siguiente manera: usando el teclado, copie y pegue los fragmentos previamente preparados. Los procesadores de texto tienen la capacidad de convertir automáticamente el texto existente en una tabla.

Apariencia Puede diseñar tablas usted mismo eligiendo el tipo, ancho y color de los bordes de las celdas, el color de fondo de las celdas y formateando el contenido de las celdas. Además, puede formatear la tabla automáticamente.

Imágenes gráficas

Los procesadores de texto modernos permiten incluir varias imágenes gráficas en los documentos.

Los procesadores de texto le permiten crear diferentes tipos de esquemas gráficos que brindan visualización de información de texto.

Tipos de esquemas gráficos en un procesador de textos Microsoft Word.

En el sector de Internet de habla rusa, hay muy pocos ejemplos prácticos educativos (y con un código de ejemplo incluso menos) análisis mensajes de texto en ruso. Por lo tanto, decidí reunir los datos y considerar un ejemplo de agrupación en clústeres, ya que no se requiere la preparación de datos para el entrenamiento.

La mayoría de las bibliotecas utilizadas ya están en la distribución de Anaconda 3, por lo que le aconsejo que las use. Los módulos / bibliotecas que faltan se pueden instalar de forma estándar a través de pip install "nombre del paquete".
Conectamos las siguientes bibliotecas:

Importar numpy como np importar pandas como pd importar nltk importar re importar os importar códecs de sklearn importar feature_extraction importar mpld3 importar matplotlib.pyplot como plt importar matplotlib como mpl
Cualquier dato puede tomarse para su análisis. Entonces se me ocurrió esta tarea: Estadísticas de consultas de búsqueda del proyecto de Gastos del Estado. Necesitaban dividir los datos en tres grupos: privados, gubernamentales y comerciales. No quería proponer nada extraordinario, así que decidí comprobar cómo se comportaría la agrupación en este caso (mirando hacia el futuro, no mucho). Pero puedes descargar datos de VK de algunos públicos:

Importar vk # pasar el id de sesión session = vk.Session (access_token = "") # URL para obtener access_token, en lugar de tvoi_id, insertar el id de la aplicación Vk creada: # https://oauth.vk.com/authorize? client_id = tvoi_id & scope = amigos, páginas, grupos, offline & redirect_uri = https: //oauth.vk.com/blank.html&display=page&v=5.21&response_type=token api = vk.API (sesión) poss = id_pab = -59229916 #id los públicos comienzan con menos, ID de muro de usuario sin menos info = api.wall.get (owner_id = id_pab, offset = 0, count = 1) kolvo = (info // 100) +1 shag = 100 sdvig = 0 h = 0 import tiempo mientras h 70): print (h) # opcional, solo para controlar el final aproximado del proceso pubpost = api.wall.get (owner_id = id_pab, offset = sdvig, count = 100) i = 1 while i< len(pubpost): b=pubpost[i]["text"] poss.append(b) i=i+1 h=h+1 sdvig=sdvig+shag time.sleep(1) len(poss) import io with io.open("public.txt", "w", encoding="utf-8", errors="ignore") as file: for line in poss: file.write("%s\n" % line) file.close() titles = open("public.txt", encoding="utf-8", errors="ignore").read().split("\n") print(str(len(titles)) + " постов считано") import re posti= #удалим все знаки препинания и цифры for line in titles: chis = re.sub(r"(\<(/?[^>] +)>) "," ", línea) #chis = re.sub () chis = re.sub (" [^ a-zA-Z] "," ", chis) posti.append (chis)
Usaré datos de consultas de búsqueda para mostrar qué tan mal agrupados son los datos de texto corto. Borré el texto de caracteres especiales y signos de puntuación por adelantado, además de reemplazar las abreviaturas (por ejemplo, un empresario individual es un empresario individual). El resultado fue un texto con una consulta de búsqueda por línea.

Leemos los datos en una matriz y procedemos a la normalización, reduciendo la palabra a su forma inicial. Esto se puede hacer de varias formas usando el lematizador de Porter, el lematizador de MyStem y PyMorphy2. Quiero advertirle: MyStem funciona a través de un contenedor, por lo que la velocidad de las operaciones es muy lenta. Detengámonos en el lematizador de Porter, aunque nadie se molesta en usar otros y combinarlos entre sí (por ejemplo, recorra PyMorphy2 y luego el lematizador de Porter).

Títulos = abrir ("material4.csv", "r", codificación = "utf-8", errores = "ignorar"). Leer (). Dividir ("\ n") imprimir (str (len (títulos)) + "solicita lectura") de nltk.stem.snowball import SnowballStemmer stemmer = SnowballStemmer ("ruso") def token_and_stem (texto): tokens = filter_tokens = para token en tokens: if re.search ("[a-za-z]" , token): filter_tokens.append (token) stems = return stems def token_only (texto): tokens = filter_tokens = para token en tokens: if re.search ("[a-za-z]", token): filter_tokens.append (token) return filter_tokens # Crear diccionarios (matrices) a partir de los conceptos básicos resultantes totalvocab_stem = totalvocab_token = for i en títulos: allwords_stemmed = token_and_stem (i) #print (allwords_stemmed) totalvocab_stem.extend (allwords_stemmed) allwords_tokenized = towords_tokenized)

Pymorphy2

import pymorphy2 morph = pymorphy2.MorphAnalyzer () G = para i en títulos: h = i.split ("") #print (h) s = "" para k en h: #print (k) p = morph.parse ( k) .normal_form #print (p) s + = "" s + = p #print (s) # G.append (p) #print (s) G.append (s) pymof = open ("pymof_pod.txt" , "w", encoding = "utf-8", errors = "ignore") pymofcsv = open ("pymofcsv_pod.csv", "w", encoding = "utf-8", errors = "ignore") para el elemento en G: pymof.write ("% s \ n"% elemento) pymofcsv.write ("% s \ n"% elemento) pymof.close () pymofcsv.close ()


pymystem3

Analizador de archivos ejecutables para el sistema operativo se descargará e instalará automáticamente la primera vez que utilice la biblioteca.

De pymystem3 import Mystem m = Mystem () A = para i en títulos: #print (i) lemas = m.lemmatize (i) A.append (lemas) # Esta matriz se puede guardar en un archivo o importar "copia de seguridad" pepinillo con abierto ("mystem.pkl", "wb") como asa: pepinillo.dump (A, asa)


Creemos una matriz de ponderaciones TF-IDF. Cuentemos cada consulta de búsqueda como un documento (esto se hace al analizar publicaciones en Twitter, donde cada tweet es un documento). Tomaremos el tfidf_vectorizer del paquete sklearn, y tomaremos las palabras vacías del corpus ntlk (inicialmente tendremos que descargarlo a través de nltk.download ()). Los parámetros se pueden ajustar como mejor le parezca, desde los límites superior e inferior hasta el número de n-gramas (en este caso, tomemos 3).

Palabras vacías = nltk.corpus.stopwords.words ("ruso") # puede expandir la lista de palabras vacías palabras vacías.extend (["qué", "esto", "entonces", "aquí", "ser", " cómo "," en "," a "," on "]) de sklearn.feature_extraction.text import TfidfVectorizer, CountVectorizer n_featur = 200000 tfidf_vectorizer = TfidfVectorizer (max_df = 0.8, max_features = 10000, min_df = 0.01, stop_words = palabras vacías, tokenizer = token_and_stem, ngram_range = (1,3)) get_ipython (). magic ("tiempo tfidf_matrix = tfidf_vectorizer.fit_transform (títulos)") print (tfidf_matrix.shape)
En la matriz resultante, comenzamos a aplicar varios métodos de agrupamiento:

Num_clusters = 5 # Método K-Means - KMeans de sklearn.cluster import KMeans km = KMeans (n_clusters = num_clusters) get_ipython (). Magic ("time km.fit (tfidf_matrix)") idx = km.fit (tfidf_matrix) clusters = km.labels_.tolist () print (clusters) print (km.labels_) # MiniBatchKMeans de sklearn.cluster import MiniBatchKMeans mbk = MiniBatchKMeans (init = "random", n_clusters = num_clusters) # (init = "k-means ++" , 'aleatorio' o un ndarray) mbk.fit_transform (tfidf_matrix)% tiempo mbk.fit (tfidf_matrix) miniclusters = mbk.labels_.tolist () print (mbk.labels_) # DBSCAN de sklearn.cluster import DBSCAN get_ipterython () .cluster import DBSCAN get_ipython (). time db = DBSCAN (eps = 0.3, min_samples = 10) .fit (tfidf_matrix) ") labels = db.labels_ labels.shape print (etiquetas) # Agglomerative Clustering de sklearn.cluster import AgglomerativeClustering agglo1 = AgglomerativeClustering (n_clusters = n_clusters = n_clusters = "euclidiana") #affinity puedes elegir cualquiera o probar todo a su vez: cosine, l1, l2, manhattan get_ipython (). magic ("time answe r = agglo1.fit_predict (tfidf_matrix.toarray ()) ") answer.shape
Los datos recibidos se pueden agrupar en un marco de datos y contar el número de solicitudes que llegan a cada grupo.

# k-means clusterkm = km.labels_.tolist () #minikmeans clustermbk = mbk.labels_.tolist () #dbscan clusters3 = etiquetas #agglo # clusters4 = answer.tolist () frame = pd.DataFrame (títulos, índice =) # k-means out = ("title": títulos, "cluster": clusterkm) frame1 = pd.DataFrame (out, index =, columnas = ["title", "cluster"]) #mini out = ("título" : títulos, "cluster": clustermbk) frame_minik = pd.DataFrame (out, index =, columnas = ["título", "cluster"]) frame1 ["cluster"]. value_counts () frame_minik ["cluster"]. value_counts ()
porque un número grande Las consultas no son muy convenientes para mirar tablas y me gustaría más interactividad para comprender. Por lo tanto, haremos gráficos de la posición relativa de las solicitudes entre sí.

Primero necesitas calcular la distancia entre los vectores. Para ello, se aplicará la distancia del coseno. Los artículos sugieren usar la resta de uno para que no haya valores negativos y esté en el rango de 0 a 1, por lo que haremos lo mismo:

De sklearn.metrics.pairwise importar cosine_similarity dist = 1 - cosine_similarity (tfidf_matrix) dist.shape
Dado que los gráficos serán bidimensionales, tridimensionales y la matriz de distancia original es n-dimensional, deberá aplicar algoritmos de reducción de dimensiones. Hay muchos algoritmos para elegir (MDS, PCA, t-SNE), pero optemos por Incremental PCA. Esta elección se realizó debido a una aplicación práctica: probé MDS y PCA, pero memoria de acceso aleatorio No tenía suficiente (8 gigabytes) y cuando comencé a usar el archivo de paginación, pude llevar la computadora a reiniciar inmediatamente.

El algoritmo Incremental PCA se utiliza como reemplazo del análisis de componentes principales (PCA) cuando el conjunto de datos que se va a descomponer es demasiado grande para caber en la memoria. IPCA crea una aproximación de bajo nivel para los datos de entrada utilizando una cantidad de memoria que es independiente del número de muestras de datos de entrada.

# Método de componente principal - PCA de sklearn.decomposition import IncrementalPCA icpa = IncrementalPCA (n_components = 2, batch_size = 16) get_ipython (). Magic ("time icpa.fit (dist) #demo =") get_ipython (). Magic (" tiempo demo2 = icpa.transform (dist) ") xs, ys = demo2 [:, 0], demo2 [:, 1] # PCA 3D de sklearn.decomposition import IncrementalPCA icpa = IncrementalPCA (n_components = 3, batch_size = 16) get_ipython () .magic ("tiempo icpa.fit (dist) #demo =") get_ipython (). magic ("tiempo ddd = icpa.transform (dist)") xs, ys, zs = ddd [:, 0], ddd [:, 1], ddd [:, 2] # Inmediatamente puede ver aproximadamente cuál será el resultado #from mpl_toolkits.mplot3d import Axes3D #fig = plt.figure () #ax = fig.add_subplot (111, projection = " 3d ") # ax.scatter (xs, ys, zs) # ax.set_xlabel (" X ") # ax.set_ylabel (" Y ") # ax.set_zlabel (" Z ") # plt.show ()
Vayamos directamente a la visualización en sí:

Desde matplotlib import rc # habilite los símbolos rusos en el gráfico font = ("family": "Verdana") #, "weigth": "normal") rc ("font", ** font) # puede generar colores para los grupos import random def generate_colors (n): color_list = for c in range (0, n): r = lambda: random.randint (0,255) color_list.append ("#% 02X% 02X% 02X"% (r (), r (), r ())) return color_list # establecer colores cluster_colors = (0: "# ff0000", 1: "# ff0066", 2: "# ff0099", 3: "# ff00cc", 4: "# ff00ff" ,) # le damos nombres a los clústeres, pero debido a la aleatoriedad, déjelos ser solo 01234 cluster_names = (0: "0", 1: "1", 2: "2", 3: "3", 4: " 4 ",) #matplotlib inline # crea un marco de datos que contiene coordenadas (de PCA) + números de clúster y las consultas mismas df = pd.DataFrame (dict (x = xs, y = ys, label = clusterkm, title = títulos) ) # group by clusters groups = df .groupby ("label") fig, ax = plt.subplots (figsize = (72, 36)) #figsize coincide con su gusto por el nombre, agrupe en grupos: ax.plot (group.x , group.y, marker = "o", linestyle = "", ms = 12, label = cluster_name s, color = cluster_colors, mec = "none") ax.set_aspect ("auto") ax.tick_params (axis = "x", which = "both", bottom = "off", top = "off", labelbottom = "off") ax.tick_params (axis = "y", which = "both", left = "off", top = "off", labelleft = "off") ax.legend (numpoints = 1) # mostrar solo la leyenda 1 puntos # agregue etiquetas / nombres a posición x, y con la consulta de búsqueda #for i en el rango (len (df)): # ax.text (df.ix [i] ["x"], df.ix [i] ["y"], df.ix [i ] ["título"], tamaño = 6) # mostrar gráfico plt.show () plt.close ()
Si quita el comentario de la línea con la adición de nombres, se verá así:

Ejemplo con 10 clústeres


No es exactamente lo que uno esperaría. Usemos mpld3 para traducir la figura en un gráfico interactivo.

# Plot fig, ax = plt.subplots (figsize = (25,27)) ax.margins (0.03) for name, group in groups_mbk: points = ax.plot (group.x, group.y, marker = "o" , linestyle = "", ms = 12, # ms = 18 label = cluster_names, mec = "none", color = cluster_colors) ax.set_aspect ("auto") labels = tooltip = mpld3.plugins.PointHTMLTooltip (puntos, etiquetas, voffset = 10, hoffset = 10, # css = css) mpld3.plugins.connect (fig, tooltip) #, TopToolbar () ax.axes.get_xaxis (). set_ticks () ax.axes.get_yaxis (). set_ticks () # ax.axes.get_xaxis (). set_visible (False) # ax.axes.get_yaxis (). set_visible (False) ax.set_title ("Mini K-Means", tamaño = 20) #groups_mbk ax.legend (numpoints = 1 ) mpld3.disable_notebook () # mpld3.display () mpld3.save_html (fig, "mbk.html") mpld3.show () # mpld3.save_json (fig, "vivod.json") # mpld3.fig_to_html (fig) fig , ax = plt.subplots (figsize = (51,25)) scatter = ax.scatter (np.random.normal (size = N), np.random.normal (size = N), c = np.random.random (tamaño = N), s = 1000 * np.random.random (tamaño = N), alpha = 0.3, cmap = plt.cm.jet) ax.grid (color = "white", linestyle = "solid") ax.set_title ("Clusters", size = 20) fig, ax = plt.subplots (figsize = (51,25)) labels = ["point (0)". format ( i + 1) para i en el rango (N)] información sobre herramientas = mpld3.plugins.PointLabel Información sobre herramientas (dispersión, etiquetas = etiquetas) mpld3.plugins.connect (fig, tooltip) mpld3.show () fig, ax = plt.subplots (figsize = (72,36)) para el nombre, agrupar en grupos: puntos = ax.plot (group.x, group.y, marker = "o", linestyle = "", ms = 18, label = cluster_names, mec = " none ", color = cluster_colors) ax.set_aspect (" auto ") labels = tooltip = mpld3.plugins.PointLabelTooltip (puntos, etiquetas = etiquetas) mpld3.plugins.connect (fig, tooltip) ax.set_title (" K-significa " , tamaño = 20) mpld3.display ()
Ahora, cuando pasa el cursor sobre cualquier punto del gráfico, aparece un texto con la consulta de búsqueda correspondiente. Un ejemplo de un acabado archivo html se puede ver aquí: Mini K-Means

Si lo desea en 3D y con una escala variable, entonces está el servicio Plotly, que tiene un complemento para Python.

Plotly 3D

# por ejemplo, solo un gráfico 3D de los valores obtenidos import plotly plotly .__ version__ import plotly.plotly as py import plotly.graph_objs as go trace1 = go.Scatter3d (x = xs, y = ys, z = zs, mode = "marcadores", marcador = dict (tamaño = 12, línea = dict (color = "rgba (217, 217, 217, 0.14)", ancho = 0.5), opacidad = 0.8)) datos = diseño = ir. (margin = dict (l = 0, r = 0, b = 0, t = 0)) fig = go.Figure (data = data, layout = layout) py.iplot (fig, filename = "cluster-3d-plot ")


Los resultados se pueden ver aquí: Ejemplo

Y el punto final es realizar agrupaciones jerárquicas (aglomerativas) de acuerdo con el método de Ward para crear un dendograma.

En: de scipy.cluster.hierarchy import ward, dendrogram linkage_matrix = ward (dist) fig, ax = plt.subplots (figsize = (15, 20)) ax = dendrogram (linkage_matrix, orientación = "derecha", etiquetas = títulos) ; plt.tick_params (\ axis = "x", which = "both", bottom = "off", top = "off", labelbottom = "off") plt.tight_layout () # guardar la imagen plt.savefig ("ward_clusters2 . png ", dpi = 200)
conclusiones

Desafortunadamente, hay muchos problemas sin resolver en el campo de la investigación del lenguaje natural y no todos los datos se pueden agrupar fácilmente en grupos específicos. Pero espero que esta guía aumente el interés en este tema y proporcione una base para una mayor experimentación.

Resumen de una lección abierta sobre el tema

" Visualización de información en documentos de texto... Mesas"

El propósito de la lección:

Educativo : contribuir a la formación de conceptos: tabla, celda, fila, columna de una tabla, editar y formatear tablas, enseñar cómo insertar una tabla en un documento, editarlo y formatearlo.

Desarrollando : desarrollar el pensamiento lógico y racional de los estudiantes, desarrollar la independencia en el dominio de las capacidades de la PC en el curso del trabajo práctico.

Educativo : educar una actitud respetuosa con el equipamiento de una clase de computación, promover la activación de las habilidades creativas de los estudiantes, educar una adecuada autoevaluación de los resultados de la actividad.

Tipo de lección : una lección de aprendizaje de material nuevo

Estructura de la lección:

Organizar el tiempo;

Actualización y motivación;

Aprender nuevo material;

Anclaje primario;

Resumiendo los resultados de la lección;

Tarea.

Formas de organizar la actividad cognitiva:

colectivo;

frontal;

individual.

Métodos de enseñanza :

explicativo e ilustrativo;

búsqueda parcial;

reproductivo.

Durante las clases


Leyendas de diapositivas:

HORARIO Lunes: álgebra, química, ruso, educación física; Martes: informática, literatura, geometría, historia; Miércoles: física, biología, ruso, álgebra; Jueves: literatura, seguridad de la vida, informática, álgebra, educación física; Viernes: química, geometría, historia.

Fila de columna de tabla

Celdas de tabla Las celdas de tabla pueden contener diferentes tipos datos (texto, números, imágenes, etc.)

Puede insertar una tabla vacía en el documento, para esto, en Microsoft Word, use el menú Insertar - Tabla:

Indicamos el número requerido de filas y columnas

Moverse por la mesa: Pulsar la tecla Tab Pulsar las teclas del cursor Utilizar el ratón Seleccionar elementos de la tabla:

En el futuro, los parámetros de la tabla se pueden cambiar usando Menú de contexto(RMB): inserta o elimina filas, columnas y celdas; Cambiar el ancho de la columna y la altura de la fila; Dividir celdas o fusionar con celdas vecinas.

Puede cambiar la apariencia de la tabla: Trabajar con tablas - Diseño

Trabajo práctico: Tarea 1: Crear una tabla de acuerdo con la muestra, llenarla con datos usando copia: Lunes Martes Miércoles Jueves 1 lección de biología álgebra historia física 2 lección álgebra biología álgebra lección de historia 3 historia física biología álgebra Clase 8

Tarea 2: Cree una tabla con una muestra. Boleta de calificaciones del estudiante de octavo grado Semestre I II Trimestre I II III IV Álgebra 5 4 4 5 Geometría 3 4 3 4 Física 4 5 4 5 Historia 5 4 5 4 Biología 4 5 3 5 Química 5 4 4 4 Ciencias de la computación 4 5 5 5 Literatura 4 4 3 4

Tarea adicional: Elaborar una tabla según el ejemplo: Boleta de calificaciones de un alumno de 8 ° grado

Criterios de evaluación: Tarea 1 - "2-3" puntos Tarea 2 - "2-3" puntos Tarea adicional - "1" punto "5" - 6-7 puntos "4" - 5 puntos "3" - 3-4 puntos

¡Gracias por la atención!

Avance:

Trabajo practicosobre el tema "Insertar tablas en un documento"

Tarea 1: trabajar con una mesa

  1. Cree una tabla de acuerdo con la muestra, llénela con datos usando la copia:

Horario de clases de la clase 8

lunes

martes

miércoles

jueves

1 lección

biología

álgebra

historia

física

2 lecciones

álgebra

biología

álgebra

historia

3 lecciones

historia

física

biología

álgebra

  1. Inserte la columna de la derecha en la tabla (viernes), rellénela.

Tarea 2: Crea una tabla por muestra:

Boleta de calificaciones del estudiante de octavo grado

Medio año

Cuatro

Álgebra

Geometría

Física

Historia

Biología

Química

Palabras clave:

  • listas numeradas
  • listas con viñetas
  • listas escalonadas
  • mesa
  • imágenes gráficas

Se sabe que una persona percibe mejor la información textual si se visualiza, organizada en forma de listas, tablas, diagramas, provista de ilustraciones (fotografías, dibujos, diagramas). Los procesadores de texto modernos brindan a los usuarios amplias oportunidades para visualizar información en los documentos que crean.

4.4.1. Liza

Todo tipo de listas en documentos se elaboran mediante listas. En este caso, todos los elementos de la lista se consideran párrafos, elaborados según una única muestra.

Según el método de diseño, se distinguen las listas numeradas y con viñetas.

Los elementos (elementos) de una lista numerada se designan mediante números secuenciales, que pueden escribirse en números arábigos y romanos. Los elementos de la lista pueden estar numerados y con letras: ruso o latín (Fig. 4.14).

Higo. 4.14.
Ejemplos de listas numeradas

Es costumbre utilizar una lista numerada cuando el orden de los elementos es importante. Estas listas se utilizan especialmente para describir una secuencia de acciones. Con regularidad, crea listas numeradas al completar el horario de lecciones de cada día escolar en su diario.

Cuando crea, elimina o mueve elementos de lista numerados existentes en el procesador de texto, la lista completa se vuelve a numerar automáticamente.

Las viñetas se identifican mediante símbolos de viñetas. El usuario puede seleccionar cualquier carácter del alfabeto de la computadora como marcador, e incluso una pequeña imagen gráfica (Fig. 4.15). Usando una lista decorada con viñetas palabras clave al comienzo de cada párrafo de su libro de texto.

Higo. 4.15.
Ejemplos de listas con viñetas

Se utiliza una lista con viñetas cuando el orden de los elementos que contiene no es importante. Por ejemplo, en forma de lista con viñetas, puede organizar una lista de las materias que estudia en el octavo grado.

Por estructura, se distinguen las listas de un solo nivel y de varios niveles.

Las listas de los ejemplos discutidos anteriormente tienen una estructura de un solo nivel.

Una lista cuyo elemento es en sí mismo una lista se llama multinivel. Entonces, la tabla de contenido de su libro de texto de ciencias de la computación es una lista de varios niveles (tres niveles).

Las listas se crean en un procesador de texto usando el comando de la barra de menú o los botones en el panel de formato (Fig. 4.16).

Higo. 4.16.
Herramientas de creación de listas

4.4.2. Mesas

Para describir varios objetos con los mismos conjuntos de propiedades, se utilizan con mayor frecuencia tablas que constan de columnas (gráfico) y filas. Usted es consciente de la presentación tabular del horario de las lecciones, los horarios de los autobuses, aviones, trenes y mucho más se presentan en forma tabular.

La información presentada en la tabla es clara, compacta y fácil de ver.

Una tabla con el formato adecuado tiene la estructura que se muestra en la Fig. 4.17.

Higo. 4.17.
Estructura de la mesa

Deben observarse las siguientes reglas para el diseño de la mesa:

  1. El encabezado de la tabla debe dar una idea de la información que contiene.
  2. Los encabezados de las columnas y filas deben ser cortos y estar libres de palabras innecesarias y, si es posible, de abreviaturas.
  3. Las unidades de medida deben indicarse en la tabla. Si son comunes para toda la tabla, entonces se indican en el encabezado de la tabla (ya sea entre corchetes o separados por una coma después del nombre). Si las unidades de medida difieren, se indican en el encabezado de la fila o columna correspondiente.
  4. Es deseable que se llenen todas las celdas de la tabla. Si es necesario, se ingresan los siguientes símbolos:

      Se desconocen los datos;

      x - los datos no son posibles;

      ↓ - los datos deben tomarse de la celda de arriba.

Las celdas de las tablas pueden contener textos, números, imágenes. Un ejemplo de una tabla se muestra en la Fig. 4.18.

Higo. 4.18.
Tabla de ejemplo

Puede crear una tabla usando el elemento de menú apropiado o el botón en la barra de herramientas, especificando el número requerido de columnas y filas; en algunos procesadores de texto, la tabla se puede "dibujar". La tabla creada se puede editar cambiando el ancho de la columna y la altura de la fila, agregando y eliminando columnas y filas, fusionando y dividiendo celdas. Puede ingresar información en las celdas de la siguiente manera: usando el teclado; copiar y pegar fragmentos previamente preparados. Los procesadores de texto tienen la capacidad de convertir automáticamente el texto existente en una tabla.

Puede personalizar la apariencia de la tabla usted mismo eligiendo el tipo, ancho y color de los bordes de las celdas, el color de fondo de las celdas y formateando el contenido de las celdas. Además, puede formatear la tabla automáticamente.

4.4.3. Imágenes gráficas

Los procesadores de texto modernos le permiten incluir en documentos varias imágenes gráficas creadas por el usuario en otros programas o encontradas por él en Internet. Los gráficos listos para usar se pueden editar cambiando sus tamaños, colores primarios, brillo y contraste, rotando, superponiendo, etc.

Muchos procesadores de texto tienen la capacidad de crear imágenes gráficas directamente a partir de conjuntos de autoformas (primitivas gráficas). También es posible crear inscripciones coloridas utilizando efectos de texto integrados.

Puede visualizar la información numérica contenida en una tabla mediante gráficos, cuyas herramientas de creación también están incluidas en los procesadores de texto.

Los procesadores de texto más potentes le permiten crear diferentes tipos de esquemas gráficos (Fig. 4.19), que proporcionan visualización de información de texto.

Higo. 4.19. Tipos de esquemas gráficos en el procesador de textos Microsoft Word

La cosa más importante

Se sabe que una persona percibe mejor la información textual si se visualiza, organizada en forma de listas, tablas, diagramas, provista de ilustraciones (fotografías, dibujos, diagramas).

Todo tipo de listas en documentos se elaboran mediante listas. Según el método de diseño, se distinguen las listas numeradas y con viñetas. Es costumbre utilizar una lista numerada cuando el orden de los elementos es importante; marcado: cuando el orden de los elementos no es importante. Por estructura, se distinguen las listas de un solo nivel y de varios niveles.

Para describir varios objetos con el mismo conjunto de propiedades, se utilizan con mayor frecuencia tablas que constan de columnas y filas. La información presentada en la tabla es clara, compacta y fácil de ver.

Los procesadores de texto modernos brindan la capacidad de incluir, procesar y crear objetos gráficos.

Preguntas y tareas

  1. ¿Con qué propósito los desarrolladores incluyen listas, tablas, gráficos en documentos de texto?
  2. ¿Para qué se utilizan las listas? Dar ejemplos.
  3. Compare listas numeradas y con viñetas. ¿Qué tienen en común? ¿Cuál es la diferencia?
  4. ¿Qué es una lista por niveles? ¿Dar un ejemplo de tal lista?
  5. ¿Qué información se puede organizar en forma de tabla? ¿Cuáles son los beneficios de la presentación tabular de información?
  6. ¿Qué reglas se deben seguir al diseñar tablas?
  7. ¿Qué gráficos se pueden incluir en un documento de texto?
  8. Enumere las características principales de los procesadores de texto para trabajar con objetos gráficos.

Visualización de información en documentos de texto

1. Listas

Teoría:

Las listas permiten que una persona perciba mejor la información.

Las listas son una opción conveniente para formatear párrafos de acuerdo con una sola plantilla y se utilizan para colocar varias listas en un documento.

¡Presta atención!

Por la forma en que están formateados, las listas se distinguen:

  • numerado;
  • marcado.

Los elementos (elementos) de una lista numerada se designan mediante números secuenciales, que pueden escribirse en números arábigos y romanos.

Los elementos de la lista se pueden numerar con letras: ruso o latino.

Es costumbre utilizar una lista numerada cuando el orden de los elementos es importante. Estas listas se utilizan especialmente para describir una secuencia de acciones.


En el diario del estudiante, los horarios de las lecciones para cada día escolar son listas numeradas.

Cuando crea, elimina o mueve elementos de lista numerados existentes en el procesador de texto, la lista completa se vuelve a numerar automáticamente.

Las viñetas se identifican mediante símbolos de viñetas. El usuario puede elegir cualquier símbolo informático e incluso una pequeña imagen gráfica como marcador.

Se utiliza una lista con viñetas cuando el orden de los elementos que contiene no es importante. Por ejemplo, puede organizar una lista de materias que estudia en la escuela en forma de lista con viñetas.

Por estructura, se distinguen las listas de un solo nivel y de varios niveles.

Una lista cuyo elemento es en sí mismo una lista se llama multinivel.

Las listas se crean en un procesador de texto usando el comando de la barra de menú o los botones de la barra de formato.

2. Tablas

Teoría:

Para la conveniencia de percibir información, las tablas se utilizan a menudo en documentos de texto. La información presentada en la tabla es clara, compacta y fácil de ver.

Una tabla se utiliza para describir varios objetos que tienen el mismo conjunto de propiedades. Las tablas más utilizadas son las columnas (gráfico) y las filas. Por ejemplo, horarios de lecciones, horarios de autobuses, aviones, trenes y mucho más.

¡Presta atención!

Reglas de formato de tabla:
1. El título de la tabla debe dar una idea de la información que contiene.
2. Los títulos de las columnas y filas deben ser breves y estar libres de palabras innecesarias y, si es posible, de abreviaturas.
3. Debe indicarse la tabla. Si son comunes para toda la tabla, entonces se indican en el encabezado de la tabla (ya sea entre corchetes o separados por una coma después del nombre). Si las unidades de medida difieren, se indican en el encabezado de la fila o columna correspondiente.
4. Es deseable que se llenen todas las celdas de la tabla. Si es necesario, se ingresan los siguientes símbolos:
? - datos desconocidos; x - los datos no son posibles;
i - los datos deben tomarse de la celda superpuesta.

Las celdas de las tablas pueden contener textos, números, imágenes.

Puede crear una tabla usando el elemento de menú apropiado o el botón en la barra de herramientas, especificando el número requerido de columnas y filas; en algunos procesadores de texto, la tabla se puede "dibujar".

La tabla creada se puede editar cambiando el ancho de la columna y la altura de la fila, agregando y eliminando columnas y filas, fusionando y dividiendo celdas.

Puede ingresar información en las celdas:

  • usando el teclado;
  • copiar y pegar fragmentos previamente preparados.

Los procesadores de texto tienen la capacidad de convertir automáticamente el texto existente en una tabla y viceversa. Puede personalizar la apariencia de la tabla usted mismo eligiendo el tipo, ancho y color de los bordes de las celdas, el color de fondo de las celdas y formateando el contenido de las celdas. Además, puede formatear la tabla automáticamente.

Para cambiar la apariencia de los bordes de las celdas y rellenar el área interior, así como realizar otras acciones, use el panel Tablas y bordes.

Puede establecer una vista, grosor y color diferentes de los bordes, así como hacer invisibles algunos de los bordes de las celdas o más allá de toda la tabla.

¡Presta atención!

Tenga cuidado al aplicar el relleno en el área interior. En primer lugar, no debe utilizar un color que no sea la escala de grises a menos que desee imprimir en color. En segundo lugar, el texto en el fondo del relleno debe ser fácil de leer.

En columnas estrechas, el texto es difícil de colocar horizontalmente, por lo que el programa brinda la capacidad de cambiar la dirección del texto en la celda.

En muchas tablas, la primera fila contiene los encabezados de las columnas. Para repetir encabezados en tablas grandes en cada hoja, debe habilitar la función de repetición de encabezados para la primera fila.

Cuando se trabaja en una tabla, la regla horizontal muestra el ancho de la celda actual y los marcadores de sangría de texto. Por lo tanto, trabajar con texto en una celda es igual que en una página normal, solo que el ancho de la línea es mucho menor. Todos los valores de parámetros posibles se pueden configurar para símbolos y párrafos. Para vincular imágenes a una celda, deben colocarse "en el texto".

3. Imágenes gráficas en un documento de texto

Teoría:

Los procesadores de texto modernos le permiten incluir en documentos varias imágenes gráficas creadas por el usuario en otros programas o encontradas por él en Internet. Los gráficos listos para usar se pueden editar cambiando sus tamaños, colores primarios, brillo y contraste, rotando, superponiendo, etc.

Muchos procesadores de texto tienen la capacidad de crear imágenes gráficas directamente a partir de conjuntos de autoformas (primitivas gráficas). También es posible crear inscripciones coloridas utilizando efectos de texto integrados. Algunos procesadores de texto incluyen una colección de imágenes: gráficos estilizados. La mayoría de las imágenes son gráficos vectoriales.

Puede visualizar la información numérica contenida en una tabla mediante gráficos, cuyas herramientas de creación también están incluidas en los procesadores de texto.

Los procesadores de texto más potentes le permiten crear diferentes tipos de esquemas gráficos que proporcionan información de texto.

Hay dos formas de colocar una imagen gráfica en un documento de texto: "en el texto" y "fuera del texto". Si la imagen tiene una posición "en el texto", entonces tiene lugar entre dos caracteres. Esto puede aumentar la altura de la línea. Por lo tanto, las líneas generalmente contienen figuras pequeñas, si la figura es grande, entonces se coloca en una línea separada.

Cuando la imagen se encuentra "fuera del texto", puede ocupar cualquier lugar en la hoja. La imagen se puede agrupar con otros objetos gráficos, puede hacer inscripciones en la figura.

Para imágenes "fuera del texto", establezca diferentes tipos de ajuste de texto:

  • alrededor del marco;
  • a lo largo del contorno;
  • mediante;
  • detrás del texto;
  • antes del texto;
  • arriba y abajo.

Al diseñar una página con ilustraciones, debe cumplir con las siguientes reglas:

1. Para una disposición más compacta de las imágenes, utilice la posición "alrededor del marco".

2. No coloque una imagen en medio del texto. Esto dificulta la lectura, ya que las líneas comienzan en un lado de la imagen y terminan en el otro. Es mejor mover el dibujo al borde derecho o izquierdo de la hoja.

3. Es necesario asegurarse de que los bordes exteriores de la imagen coincidan con los bordes interiores de los márgenes de la hoja.

4. Si la imagen ocupa más de 3/4 del ancho del texto, entonces es mejor elegir la ubicación del texto en la parte superior e inferior. En este caso, puede establecer la posición de la imagen "en el texto" y colocarla en una línea separada (en un párrafo vacío).

5. Los dibujos deben ser proporcionales al número de elementos representados en ellos. Cuantos más elementos de información haya en la imagen, más grande debería ser.

Cuando crea una imagen a partir de las autoformas ubicadas en el panel Dibujo, el objeto "lienzo" aparece automáticamente: un marco rectangular en todo el ancho de la página. Todas las autoformas incluidas en el dibujo deben ubicarse dentro de un lienzo.

Un lienzo es un objeto gráfico que tiene bordes y un área interior.

Puede aplicar formato al lienzo, como a cualquier objeto gráfico. Las dimensiones del lienzo se pueden cambiar para adaptarse a la imagen, de modo que no quede mucho espacio vacio... El lienzo con una imagen puede tomar una posición "en el texto" y "fuera del texto".

El lienzo muestra la transición del usuario del modo de texto al modo de gráficos. Para completar el dibujo, haga clic fuera del lienzo; para continuar, haga clic dentro del lienzo. Si el lienzo no está activo, aparecerá un nuevo lienzo para dibujar una nueva autoforma. Una vez finalizada la obra, el lienzo, junto con los objetos que se encuentran en él, forma una única imagen. Es posible apagar el lienzo.

¡Presta atención!

Sin embargo, el lienzo ayuda a "no perder" los elementos individuales de la imagen. Cuando crea un dibujo, debe asegurarse de que todos los objetos estén dentro del mismo lienzo, es decir, que esté activado hasta que haya terminado de crear la imagen.

Cuando la imagen está terminada, los objetos de la imagen suelen estar agrupados. Puede desagruparlos y modificar la imagen según sea necesario.

¿Te gustó el artículo? ¡Compartir con tus amigos!