Geeksoup
Geeksoup blog

La redundancia del lenguaje.

_L      P_T_ _       D_      M_       C_S_       _S        P_RT_C_L_R

Seguro que todos sabemos reconstruir esta frase a la que le faltan las vocales, pero ¿sabemos por qué? .  Bueno pues esto se debe a que los lenguajes humanos son redundantes, explico. Si leemos una frase como esta a la que le faltan algunas letras la podemos reconstruir  extrayendo información de las letras adyacentes que conocemos, grosso modo, utilizamos mas letras de las que necesitamos para transmitir una información. Sigue leyendo si te interesa el tema mas a fondo.

Shannon el padre de la teoria de la información.

Shannon el padre de la teoria de la información.

Un poquito mas técnicamente definiremos dos magnitudes:

Índice de un lenguaje : definiremos el índice de un lenguaje L para mensajes de longitud ‘k’ como  rsubk = Hsubk(M) / k (pongo subk porque no puedo poner subíndices aqui xDD).  Siendo Hsubk(M) la entropía de todos los mensajes de longitud k que tienen sentido en L. En definitiva el número de bits de información que transponrta cada caracter en mensajes de una longitud determinada.  Este índice en el español suele ser de unos 1,4 bits por letra para unos valores pequeños de k. (no os perdais amigos no es tan difícil ^^)

Ìndice absoluto de un lenguaje: máximo número de bits de información que pueden ser codificados en cada carácter, asumiendo que todas las combinaciones de caracteres son equiprobables. Esto se calcula R = logaritmo en base 2 de m, siendo m el número de simbolos distintos del alfabeto del lenguaje a tratar. En español son m=27 (cada una de las letras distintas del abecedario) , obtenemos que podríamos codificar unos 4,7 bits de información en cada letra.

Y ahora podemos entender lo que es la redundancia de una abecedario, si en el español tenemos un índice de 1,4 bits arpox. y un índice absoluto de 4,7 a simple vista podemos observar que en un mensaje de longitud ‘k’ podriamos introducir mucha mas informacion de la que introducimos normalmente, podriamos dar mas información con muchos menos caracteres. De aqui la redundancia D, que es igual al índice absoluto menos el índice del lenguaje, en el caso del español, 4,7 – 1,4 = 3,3 bits.  Si consiguieramos un lenguaje con redundancia cero, esto es que la diferencia entre los dos indices anteriores fuera nula, tendriamos un lenguaje en el que cada caracter aportaria una información máxima, y cada mensaje con la mínima longitud aportaria información máxima.

(o Dios mio Carlos que royazo…)

Bueno y direis oh que bonito, oh que tostón, etc… bueno pues solo deciros que cuando utilizais el preciado WinRar, 7Zip,… y demás programas de compresión y descompresión estais aplicando este principio, estos programas se basan en la redundancia del lenguaje, esta vez del lenguaje binario, no creais que lo comprimian por arte de magia aunque saliera una varita mágica en el WinZip. Considera cada byte como un mensaje elemental, y lo codifica con más o menos bits según su frecuencia de aparición en el archivo.

Si te interesa el tema ver  Teoría de la información.

Bueno esto han sido unas divagaciones de un desiquilibrado mental que estaba estudiando criptografía y le parecio interesante compartir esta informacion con los lectores de GeekSoup, espero que se haya entendido bien, si no es asi no dudeis en preguntar, estare encantado de responder 😉

Saludos!

Anuncios

3 comentarios to “La redundancia del lenguaje.”

  1. No nos engañemos, me ha costao pillarlo (ando espesillo xD) pero es más facil de lo que parece.

    Interesante el tema, aver si te marcas algún que otro post sobre esto, que pinta bien.

    Porcierto, te he editado el post para poner tags, ya que son útiles para la gente que busca información y tal.

    Nos vemos! ^^

  2. Puff y amigos mios, la cosa no se queda ahi, el reconocimiento del lenguaje, extrapolacion, tareas de relleno, filtrado, se deben a varias partes de nuestro asqueroso cerebro (entre ellas los coniculos, superiores, el talamo parietal etc), y millones de teoria atencionales como TRC y TIC,(se nota que estoy de examenes >.<U) quizas escriba algo de esto o ahora que he visto el video de orgasmatrix el de como comer un coño xDD, no se, ya veremos.

  3. ya veras… esto es lo que estudie ayer!!! jajaaj a repasar la leccion XDDD


Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: