[Predictomica] Fwd:

CROSSA HIRIART, José Luis Francisco (CIMMYT) J.CROSSA at CGIAR.ORG
Tue Mar 1 14:53:08 UYT 2016


Tengo datos categóricos

è ordinals (multinomiales) y de

è conteo (Binomial Negative y/o Poisson)
por si sirven
From: Ignacio Ramirez [mailto:nacho at fing.edu.uy]
Sent: Tuesday, March 01, 2016 11:34 AM
To: DANIEL GIANOLA; CROSSA HIRIART, José Luis Francisco (CIMMYT)
Cc: predictomica at fing.edu.uy
Subject: Re: [Predictomica] Fwd:

Si claro. Digamos, el tema de si son ralas o no es un detalle. Todos los métodos de selección de modelos son en principio aplicables a datos ralos. Yo en particular he trabajado mucho, justamente, con MDL para modelos ralos o esparsos, pero eso es una particularidad de mi propio trabajo.

Sin dudas aplicar algo así a datos de ese tipo sería un trabajo interesante. Podemos ponerlo en la lista de temas a trabajar en el grupo; talvez si algún estudiante tiene interés en esto, y tiene un background adecuado, podemos ponerlo a trabajar en eso. Yo no tengo a nadie en la vuelta, pero talvez Uds. tengan algún matemático o afín con ganas de hacer cosas de estas?

Mientras tanto, focalizando en lo de la charla, podríamos usar datos de ese tipo como ejemplo. De hecho lo más común para introducir MDL es trabajar con datos tipo Bernoulli. Pero sería sólo a los efectos de guiar la charla (y talvez proponer un trabajo concreto en el tema), más que realmente aplicarlo. Eso como decía es una tesis entera :)
On 01/03/16 14:12, DANIEL GIANOLA wrote:

El concepto se puede aplicar a estimacion de matrices de covariancias "big" pero ralas? Por ejemplo, en genomica construimos matrices de covariancia entre miles de variables pero con muestras chicas. Ejemplo: datos de expresion con 50 mil variables pero n=20-100.



Creo que algo asi seria novedoso.



Daniel

________________________________
From: Ignacio Ramirez Paulino <ignacio.ramirez at gmail.com><mailto:ignacio.ramirez at gmail.com>
Sent: Tuesday, March 1, 2016 10:30 AM
To: CROSSA HIRIART, José Luis Francisco (CIMMYT); Ignacio Ramirez Paulino; DANIEL GIANOLA
Cc: predictomica at fing.edu.uy<mailto:predictomica at fing.edu.uy>
Subject: Re: [Predictomica] Fwd:

Bueno, no sé, como decía Daniel, todo depende de la pregunta que quieras hacerte.
En realidad aplicar MDL a cada problema es un arte, por lo que lo que tendría que tener yo sería un conjunto de datos como para usar de ejemplo en la charla. Ojalá me de el tiempo para aplicarlo de manera más o menos razonable a ese conjunto de datos; eso sería de por sí un paper probablemente, muy similar al que mandó Daniel.

Pero si vamos a hacer algo en marzo, más bien podríamos empezar con un conjunto de datos y un objetivo concreto, y por lo menos trabajar de manera más o menos abstracta con esos datos para llevar el hilo de la charla, no sé si me explico.
On 01/03/16 11:52, CROSSA HIRIART, José Luis Francisco (CIMMYT) wrote:

Hola Daniel y Nacho

Por datos en plant breeding no hay problema. Como? que estructura?, que variables? Cuantos markers?

Abrazo

Jose



From: predictomica-bounces at fing.edu.uy<mailto:predictomica-bounces at fing.edu.uy> [mailto:predictomica-bounces at fing.edu.uy] On Behalf Of Ignacio Ramirez Paulino
Sent: Tuesday, March 01, 2016 6:50 AM
To: DANIEL GIANOLA
Cc: predictomica at fing.edu.uy<mailto:predictomica at fing.edu.uy>
Subject: Re: [Predictomica] Fwd:



Excelente! Hagámoslo entonces. Estaría buenísimo conseguir algún ejemplo relevante, algún dataset que les parezca particularmente interesante, y aplicarle una metodología tipo MDL para ilustrar sus conceptos. Qué les parece?

De su lado preciso un dataset y una propuesta de fecha dentro del grupo.

Saludos,

Nacho.



El 1 de marzo de 2016, 09:44, DANIEL GIANOLA<gianola at ansci.wisc.edu<mailto:gianola at ansci.wisc.edu>> escribió:

Ignacio,



Gracias por los comentarios.



Personalmente, tengo curiosidad sobre el tema, y una charla me resultaria interesante, especialmente si fuera ilustrada sobre alguna aplicacion concreta.



Creo que es a traves de este tipo de dialogos que se pueden "estirar" los campos de la ciencia, asi como crear  nuevos ambitos de aplicacion.



Daniel



________________________________

From: Ignacio Ramirez Paulino <nacho at fing.edu.uy<mailto:nacho at fing.edu.uy>>
Sent: Tuesday, March 1, 2016 6:28 AM
To: DANIEL GIANOLA
Cc: Maine Fariello; predictomica at fing.edu.uy<mailto:predictomica at fing.edu.uy>
Subject: Re: [Predictomica] Fwd:



Hola Daniel,

Bueno, no exactamente. Suficiencia estadística es algo muy puntual. MDL bastante más general que eso.
Es todo un marco matemático (a mi entender el más profundo y moderno  de todos los que hay en la vuelta) para entender el problema de modelado estadístico de datos.

La descripcion de Wikipedia está incluso bastante mal. Hay quienes insisten en que no es más que un sinónimo para BIC (en Wikipedia dice básicamente eso, sin decirlo, al final), pero eso es incorrecto. Eso sólo tiene sentido en un regimen asintótico estricto.

Si les interesa les puedo dar una charla sobre MDL. Yo realmente creo que no se le da la importancia que debería tener, en parte porque BIC y AIC son muy fáciles de usar, y MDL es bastante díficil desde un punto de vista de implementación, pero vale la pena.



El 29 de febrero de 2016, 23:40, DANIEL GIANOLA<gianola at ansci.wisc.edu<mailto:gianola at ansci.wisc.edu>> escribió:

Mire MDL en Wikipedia. Me dio la impresion que hay un cierto paralelo con el concepto de suficiencia en estadistica. Me equivoco?



Daniel



________________________________

From: predictomica-bounces at fing.edu.uy<mailto:predictomica-bounces at fing.edu.uy> <predictomica-bounces at fing.edu.uy<mailto:predictomica-bounces at fing.edu.uy>> on behalf of Ignacio Ramirez Paulino <nacho at fing.edu.uy<mailto:nacho at fing.edu.uy>>
Sent: Monday, February 29, 2016 5:38 PM
To: Maine Fariello
Cc: predictomica at fing.edu.uy<mailto:predictomica at fing.edu.uy>
Subject: Re: [Predictomica] Fwd:



Es interesante. Una pena que el autor no mencione  MDL (Minimum Description Length), que justamente abordan el tema de modelado de datos desde un punto de vista que en cierto sentido concilia, y de manera muy sólida, la dicotomía que se plantea en el paper...



El 29 de febrero de 2016, 15:25, Maine Fariello<fariello at fing.edu.uy<mailto:fariello at fing.edu.uy>> escribió:

A pedido de Daniel, les re-envío paper que puede ser de interés, sobre si explicar o predecir.



Saludos,



Maine.

_______________________________________________
Predictomica mailing list
Predictomica at fing.edu.uy<mailto:Predictomica at fing.edu.uy>
https://www.fing.edu.uy/mailman/listinfo/predictomica



--

--------------------------------------------------------------
  Ignacio Francisco Ramírez Paulino
--------------------------------------------------------------



--

--------------------------------------------------------------
  Ignacio Francisco Ramírez Paulino
--------------------------------------------------------------



--

--------------------------------------------------------------
  Ignacio Francisco Ramírez Paulino
--------------------------------------------------------------



--

----------------------------------------

 Ignacio Francisco Ramírez Paulino, PhD

----------------------------------------

Departamento de Procesamiento de Señales

   Instituto de Ingeniería Eléctrica

        Facultad de Ingeniería

     Universidad de la República

     Julio Herrera y Reissig 565

         Montevideo, Uruguay

            T:2711 0974

----------------------------------------

-------------- next part --------------
An HTML attachment was scrubbed...
URL: <https://www.fing.edu.uy/pipermail/predictomica/attachments/20160301/088ac81d/attachment-0001.html>


More information about the Predictomica mailing list