[Predictomica] Fwd:

Ignacio Ramirez Paulino nacho at fing.edu.uy
Tue Mar 1 12:33:27 UYT 2016


Les adjunto algunos papers centrales sobre MDL.
El más entrable es Hansen & Yu 2001, que además lo pone en contexto de los
problemas de inferencia que estamos hablando acá.
MDL es un método de selección de modelos. En ese sentido, la única pregunta
que le cabe es "cuál es el modelo más parsimonioso para explicar tales
datos".

En el caso de predicción (ver Hansen & Yu Sección V.B), se busca la
descripción más parsimoniosa de la variable de respuesta dados las
variables regresoras.

El  caso de "supervised learning" en principio puede reducirse al de
regresión.

El 1 de marzo de 2016, 09:58, DANIEL GIANOLA<gianola at ansci.wisc.edu>
escribió:

> Hay dos data sets en el software BGLR.
>
>
> Una es de trigo con 599 lineas genotipadas con 1279 marcadores cada una.
> La variable "respuesta" es rendimiento de grano en cada uno de cuatro
> ambientes.
>
>
> Los otros datos son BMI (body mass index) de mas de mil ratones
> genotipados con mas de 10 mil marcadores cada uno.
>
>
> En el contexto de "supervised learning" o "predictivo" cuales serian las
> preguntas a hacerle a MDL, condicionalmente a esos datos?
>
>
> Gracias!
>
>
> Daniel
>
>
> ------------------------------
> *From:* Ignacio Ramirez Paulino <nacho at fing.edu.uy>
> *Sent:* Tuesday, March 1, 2016 6:50 AM
> *To:* DANIEL GIANOLA
> *Cc:* Maine Fariello; predictomica at fing.edu.uy
> *Subject:* Re: [Predictomica] Fwd:
>
> Excelente! Hagámoslo entonces. Estaría buenísimo conseguir algún ejemplo
> relevante, algún dataset que les parezca particularmente interesante, y
> aplicarle una metodología tipo MDL para ilustrar sus conceptos. Qué les
> parece?
>
> De su lado preciso un dataset y una propuesta de fecha dentro del grupo.
>
> Saludos,
> Nacho.
>
> El 1 de marzo de 2016, 09:44, DANIEL GIANOLA<gianola at ansci.wisc.edu>
> escribió:
>
>> Ignacio,
>>
>>
>> Gracias por los comentarios.
>>
>>
>> Personalmente, tengo curiosidad sobre el tema, y una charla me resultaria
>> interesante, especialmente si fuera ilustrada sobre alguna aplicacion
>> concreta.
>>
>>
>> Creo que es a traves de este tipo de dialogos que se pueden "estirar" los
>> campos de la ciencia, asi como crear  nuevos ambitos de aplicacion.
>>
>>
>> Daniel
>>
>>
>> ------------------------------
>> *From:* Ignacio Ramirez Paulino <nacho at fing.edu.uy>
>> *Sent:* Tuesday, March 1, 2016 6:28 AM
>> *To:* DANIEL GIANOLA
>> *Cc:* Maine Fariello; predictomica at fing.edu.uy
>> *Subject:* Re: [Predictomica] Fwd:
>>
>> Hola Daniel,
>> Bueno, no exactamente. Suficiencia estadística es algo muy puntual. MDL
>> bastante más general que eso.
>> Es todo un marco matemático (a mi entender el más profundo y moderno  de
>> todos los que hay en la vuelta) para entender el problema de modelado
>> estadístico de datos.
>>
>> La descripcion de Wikipedia está incluso bastante mal. Hay quienes
>> insisten en que no es más que un sinónimo para BIC (en Wikipedia dice
>> básicamente eso, sin decirlo, al final), pero eso es incorrecto. Eso sólo
>> tiene sentido en un regimen asintótico estricto.
>>
>> Si les interesa les puedo dar una charla sobre MDL. Yo realmente creo que
>> no se le da la importancia que debería tener, en parte porque BIC y AIC son
>> muy fáciles de usar, y MDL es bastante díficil desde un punto de vista de
>> implementación, pero vale la pena.
>>
>> El 29 de febrero de 2016, 23:40, DANIEL GIANOLA<gianola at ansci.wisc.edu>
>> escribió:
>>
>>> Mire MDL en Wikipedia. Me dio la impresion que hay un cierto paralelo
>>> con el concepto de suficiencia en estadistica. Me equivoco?
>>>
>>>
>>> Daniel
>>>
>>>
>>> ------------------------------
>>> *From:* predictomica-bounces at fing.edu.uy <
>>> predictomica-bounces at fing.edu.uy> on behalf of Ignacio Ramirez Paulino <
>>> nacho at fing.edu.uy>
>>> *Sent:* Monday, February 29, 2016 5:38 PM
>>> *To:* Maine Fariello
>>> *Cc:* predictomica at fing.edu.uy
>>> *Subject:* Re: [Predictomica] Fwd:
>>>
>>> Es interesante. Una pena que el autor no mencione  MDL (Minimum
>>> Description Length), que justamente abordan el tema de modelado de datos
>>> desde un punto de vista que en cierto sentido concilia, y de manera muy
>>> sólida, la dicotomía que se plantea en el paper...
>>>
>>> El 29 de febrero de 2016, 15:25, Maine Fariello<fariello at fing.edu.uy>
>>> escribió:
>>>
>>>> A pedido de Daniel, les re-envío paper que puede ser de interés, sobre
>>>> si explicar o predecir.
>>>>
>>>> Saludos,
>>>>
>>>> Maine.
>>>>
>>>> _______________________________________________
>>>> Predictomica mailing list
>>>> Predictomica at fing.edu.uy
>>>> https://www.fing.edu.uy/mailman/listinfo/predictomica
>>>>
>>>>
>>>
>>>
>>> --
>>> --------------------------------------------------------------
>>>   Ignacio Francisco Ramírez Paulino
>>> --------------------------------------------------------------
>>>
>>
>>
>>
>> --
>> --------------------------------------------------------------
>>   Ignacio Francisco Ramírez Paulino
>> --------------------------------------------------------------
>>
>
>
>
> --
> --------------------------------------------------------------
>   Ignacio Francisco Ramírez Paulino
> --------------------------------------------------------------
>



-- 
--------------------------------------------------------------
  Ignacio Francisco Ramírez Paulino
--------------------------------------------------------------
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <https://www.fing.edu.uy/pipermail/predictomica/attachments/20160301/efec5292/attachment-0001.html>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: barron_rissanen_yu98-mdl.pdf
Type: application/pdf
Size: 710561 bytes
Desc: not available
URL: <https://www.fing.edu.uy/pipermail/predictomica/attachments/20160301/efec5292/attachment-0003.pdf>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: hansen_yu01-mdl.pdf
Type: application/pdf
Size: 533348 bytes
Desc: not available
URL: <https://www.fing.edu.uy/pipermail/predictomica/attachments/20160301/efec5292/attachment-0004.pdf>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: rissanen84.pdf
Type: application/pdf
Size: 1465924 bytes
Desc: not available
URL: <https://www.fing.edu.uy/pipermail/predictomica/attachments/20160301/efec5292/attachment-0005.pdf>


More information about the Predictomica mailing list