[Predictomica] Fwd:
Ignacio Ramirez
nacho at fing.edu.uy
Tue Mar 1 14:33:31 UYT 2016
Si claro. Digamos, el tema de si son ralas o no es un detalle. Todos los
métodos de selección de modelos son en principio aplicables a datos
ralos. Yo en particular he trabajado mucho, justamente, con MDL para
modelos ralos o esparsos, pero eso es una particularidad de mi propio
trabajo.
Sin dudas aplicar algo así a datos de ese tipo sería un trabajo
interesante. Podemos ponerlo en la lista de temas a trabajar en el
grupo; talvez si algún estudiante tiene interés en esto, y tiene un
background adecuado, podemos ponerlo a trabajar en eso. Yo no tengo a
nadie en la vuelta, pero talvez Uds. tengan algún matemático o afín con
ganas de hacer cosas de estas?
Mientras tanto, focalizando en lo de la charla, podríamos usar datos de
ese tipo como ejemplo. De hecho lo más común para introducir MDL es
trabajar con datos tipo Bernoulli. Pero sería sólo a los efectos de
guiar la charla (y talvez proponer un trabajo concreto en el tema), más
que realmente aplicarlo. Eso como decía es una tesis entera :)
On 01/03/16 14:12, DANIEL GIANOLA wrote:
>
> El concepto se puede aplicar a estimacion de matrices de covariancias
> "big" pero ralas? Por ejemplo, en genomica construimos matrices de
> covariancia entre miles de variables pero con muestras chicas.
> Ejemplo: datos de expresion con 50 mil variables pero n=20-100.
>
>
> Creo que algo asi seria novedoso.
>
>
> Daniel
>
>
>
> ------------------------------------------------------------------------
> *From:* Ignacio Ramirez Paulino <ignacio.ramirez at gmail.com>
> *Sent:* Tuesday, March 1, 2016 10:30 AM
> *To:* CROSSA HIRIART, José Luis Francisco (CIMMYT); Ignacio Ramirez
> Paulino; DANIEL GIANOLA
> *Cc:* predictomica at fing.edu.uy
> *Subject:* Re: [Predictomica] Fwd:
>
> Bueno, no sé, como decía Daniel, todo depende de la pregunta que
> quieras hacerte.
> En realidad aplicar MDL a cada problema es un arte, por lo que lo que
> tendría que tener yo sería un conjunto de datos como para usar de
> ejemplo en la charla. Ojalá me de el tiempo para aplicarlo de manera
> más o menos razonable a ese conjunto de datos; eso sería de por sí un
> paper probablemente, muy similar al que mandó Daniel.
>
> Pero si vamos a hacer algo en marzo, más bien podríamos empezar con un
> conjunto de datos y un objetivo concreto, y por lo menos trabajar de
> manera más o menos abstracta con esos datos para llevar el hilo de la
> charla, no sé si me explico.
>
> On 01/03/16 11:52, CROSSA HIRIART, José Luis Francisco (CIMMYT) wrote:
>>
>> Hola Daniel y Nacho
>>
>> Por datos en plant breeding no hay problema. Como? que estructura?,
>> que variables? Cuantos markers?
>>
>> Abrazo
>>
>> Jose
>>
>>
>>
>> *From:*predictomica-bounces at fing.edu.uy
>> <mailto:predictomica-bounces at fing.edu.uy>
>> [mailto:predictomica-bounces at fing.edu.uy] *On Behalf Of *Ignacio
>> Ramirez Paulino
>> *Sent:* Tuesday, March 01, 2016 6:50 AM
>> *To:* DANIEL GIANOLA
>> *Cc:* predictomica at fing.edu.uy <mailto:predictomica at fing.edu.uy>
>> *Subject:* Re: [Predictomica] Fwd:
>>
>>
>>
>> Excelente! Hagámoslo entonces. Estaría buenísimo conseguir algún
>> ejemplo relevante, algún dataset que les parezca particularmente
>> interesante, y aplicarle una metodología tipo MDL para ilustrar sus
>> conceptos. Qué les parece?
>>
>> De su lado preciso un dataset y una propuesta de fecha dentro del grupo.
>>
>> Saludos,
>>
>> Nacho.
>>
>>
>>
>> El 1 de marzo de 2016, 09:44, DANIEL GIANOLA<gianola at ansci.wisc.edu
>> <mailto:gianola at ansci.wisc.edu>> escribió:
>>
>> Ignacio,
>>
>>
>>
>> Gracias por los comentarios.
>>
>>
>>
>> Personalmente, tengo curiosidad sobre el tema, y una charla me
>> resultaria interesante, especialmente si fuera ilustrada sobre alguna
>> aplicacion concreta.
>>
>>
>>
>> Creo que es a traves de este tipo de dialogos que se pueden "estirar"
>> los campos de la ciencia, asi como crear nuevos ambitos de aplicacion.
>>
>>
>>
>> Daniel
>>
>>
>>
>> ------------------------------------------------------------------------
>>
>> *From:*Ignacio Ramirez Paulino <nacho at fing.edu.uy
>> <mailto:nacho at fing.edu.uy>>
>> *Sent:* Tuesday, March 1, 2016 6:28 AM
>> *To:* DANIEL GIANOLA
>> *Cc:* Maine Fariello;
>> <mailto:predictomica at fing.edu.uy>predictomica at fing.edu.uy
>> <mailto:predictomica at fing.edu.uy>
>> *Subject:* Re: [Predictomica] Fwd:
>>
>>
>>
>> Hola Daniel,
>>
>> Bueno, no exactamente. Suficiencia estadística es algo muy puntual.
>> MDL bastante más general que eso.
>> Es todo un marco matemático (a mi entender el más profundo y moderno
>> de todos los que hay en la vuelta) para entender el problema de
>> modelado estadístico de datos.
>>
>>
>> La descripcion de Wikipedia está incluso bastante mal. Hay quienes
>> insisten en que no es más que un sinónimo para BIC (en Wikipedia dice
>> básicamente eso, sin decirlo, al final), pero eso es incorrecto. Eso
>> sólo tiene sentido en un regimen asintótico estricto.
>>
>>
>> Si les interesa les puedo dar una charla sobre MDL. Yo realmente creo
>> que no se le da la importancia que debería tener, en parte porque BIC
>> y AIC son muy fáciles de usar, y MDL es bastante díficil desde un
>> punto de vista de implementación, pero vale la pena.
>>
>>
>>
>> El 29 de febrero de 2016, 23:40, DANIEL
>> GIANOLA<gianola at ansci.wisc.edu <mailto:gianola at ansci.wisc.edu>> escribió:
>>
>> Mire MDL en Wikipedia. Me dio la impresion que hay un cierto paralelo
>> con el concepto de suficiencia en estadistica. Me equivoco?
>>
>>
>>
>> Daniel
>>
>>
>>
>> ------------------------------------------------------------------------
>>
>> *From:*predictomica-bounces at fing.edu.uy
>> <mailto:predictomica-bounces at fing.edu.uy>
>> <predictomica-bounces at fing.edu.uy
>> <mailto:predictomica-bounces at fing.edu.uy>> on behalf of Ignacio
>> Ramirez Paulino <nacho at fing.edu.uy <mailto:nacho at fing.edu.uy>>
>> *Sent:* Monday, February 29, 2016 5:38 PM
>> *To:* Maine Fariello
>> *Cc:* <mailto:predictomica at fing.edu.uy>predictomica at fing.edu.uy
>> <mailto:predictomica at fing.edu.uy>
>> *Subject:* Re: [Predictomica] Fwd:
>>
>>
>>
>> Es interesante. Una pena que el autor no mencione MDL (Minimum
>> Description Length), que justamente abordan el tema de modelado de
>> datos desde un punto de vista que en cierto sentido concilia, y de
>> manera muy sólida, la dicotomía que se plantea en el paper...
>>
>>
>>
>> El 29 de febrero de 2016, 15:25, Maine Fariello<fariello at fing.edu.uy
>> <mailto:fariello at fing.edu.uy>> escribió:
>>
>> A pedido de Daniel, les re-envío paper que puede ser de interés,
>> sobre si explicar o predecir.
>>
>>
>>
>> Saludos,
>>
>>
>>
>> Maine.
>>
>>
>> _______________________________________________
>> Predictomica mailing list
>> Predictomica at fing.edu.uy <mailto:Predictomica at fing.edu.uy>
>> https://www.fing.edu.uy/mailman/listinfo/predictomica
>>
>>
>>
>>
>> --
>>
>> --------------------------------------------------------------
>> Ignacio Francisco Ramírez Paulino
>> --------------------------------------------------------------
>>
>>
>>
>>
>> --
>>
>> --------------------------------------------------------------
>> Ignacio Francisco Ramírez Paulino
>> --------------------------------------------------------------
>>
>>
>>
>>
>> --
>>
>> --------------------------------------------------------------
>> Ignacio Francisco Ramírez Paulino
>> --------------------------------------------------------------
>>
>
> --
> ----------------------------------------
> Ignacio Francisco Ramírez Paulino, PhD
> ----------------------------------------
> Departamento de Procesamiento de Señales
> Instituto de Ingeniería Eléctrica
> Facultad de Ingeniería
> Universidad de la República
> Julio Herrera y Reissig 565
> Montevideo, Uruguay
> T:2711 0974
> ----------------------------------------
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <https://www.fing.edu.uy/pipermail/predictomica/attachments/20160301/134fa98d/attachment-0001.html>
More information about the Predictomica
mailing list