[Predictomica] Fwd:
Ricardo Fraiman
fraimanricardo at gmail.com
Tue Mar 1 13:14:23 UYT 2016
Les adjunto un artículo reciente donde usamos selección de modelos para los
árboles asociados a cadenas de alcance variable. (VLMC), por si les
interesa.
Abrazo,
Ricardo
2016-03-01 13:33 GMT-02:00 Ignacio Ramirez Paulino <nacho at fing.edu.uy>:
> Les adjunto algunos papers centrales sobre MDL.
> El más entrable es Hansen & Yu 2001, que además lo pone en contexto de los
> problemas de inferencia que estamos hablando acá.
> MDL es un método de selección de modelos. En ese sentido, la única
> pregunta que le cabe es "cuál es el modelo más parsimonioso para explicar
> tales datos".
>
> En el caso de predicción (ver Hansen & Yu Sección V.B), se busca la
> descripción más parsimoniosa de la variable de respuesta dados las
> variables regresoras.
>
> El caso de "supervised learning" en principio puede reducirse al de
> regresión.
>
> El 1 de marzo de 2016, 09:58, DANIEL GIANOLA<gianola at ansci.wisc.edu>
> escribió:
>
>> Hay dos data sets en el software BGLR.
>>
>>
>> Una es de trigo con 599 lineas genotipadas con 1279 marcadores cada una.
>> La variable "respuesta" es rendimiento de grano en cada uno de cuatro
>> ambientes.
>>
>>
>> Los otros datos son BMI (body mass index) de mas de mil ratones
>> genotipados con mas de 10 mil marcadores cada uno.
>>
>>
>> En el contexto de "supervised learning" o "predictivo" cuales serian las
>> preguntas a hacerle a MDL, condicionalmente a esos datos?
>>
>>
>> Gracias!
>>
>>
>> Daniel
>>
>>
>> ------------------------------
>> *From:* Ignacio Ramirez Paulino <nacho at fing.edu.uy>
>> *Sent:* Tuesday, March 1, 2016 6:50 AM
>> *To:* DANIEL GIANOLA
>> *Cc:* Maine Fariello; predictomica at fing.edu.uy
>> *Subject:* Re: [Predictomica] Fwd:
>>
>> Excelente! Hagámoslo entonces. Estaría buenísimo conseguir algún ejemplo
>> relevante, algún dataset que les parezca particularmente interesante, y
>> aplicarle una metodología tipo MDL para ilustrar sus conceptos. Qué les
>> parece?
>>
>> De su lado preciso un dataset y una propuesta de fecha dentro del grupo.
>>
>> Saludos,
>> Nacho.
>>
>> El 1 de marzo de 2016, 09:44, DANIEL GIANOLA<gianola at ansci.wisc.edu>
>> escribió:
>>
>>> Ignacio,
>>>
>>>
>>> Gracias por los comentarios.
>>>
>>>
>>> Personalmente, tengo curiosidad sobre el tema, y una charla me
>>> resultaria interesante, especialmente si fuera ilustrada sobre alguna
>>> aplicacion concreta.
>>>
>>>
>>> Creo que es a traves de este tipo de dialogos que se pueden "estirar"
>>> los campos de la ciencia, asi como crear nuevos ambitos de aplicacion.
>>>
>>>
>>> Daniel
>>>
>>>
>>> ------------------------------
>>> *From:* Ignacio Ramirez Paulino <nacho at fing.edu.uy>
>>> *Sent:* Tuesday, March 1, 2016 6:28 AM
>>> *To:* DANIEL GIANOLA
>>> *Cc:* Maine Fariello; predictomica at fing.edu.uy
>>> *Subject:* Re: [Predictomica] Fwd:
>>>
>>> Hola Daniel,
>>> Bueno, no exactamente. Suficiencia estadística es algo muy puntual. MDL
>>> bastante más general que eso.
>>> Es todo un marco matemático (a mi entender el más profundo y moderno de
>>> todos los que hay en la vuelta) para entender el problema de modelado
>>> estadístico de datos.
>>>
>>> La descripcion de Wikipedia está incluso bastante mal. Hay quienes
>>> insisten en que no es más que un sinónimo para BIC (en Wikipedia dice
>>> básicamente eso, sin decirlo, al final), pero eso es incorrecto. Eso sólo
>>> tiene sentido en un regimen asintótico estricto.
>>>
>>> Si les interesa les puedo dar una charla sobre MDL. Yo realmente creo
>>> que no se le da la importancia que debería tener, en parte porque BIC y AIC
>>> son muy fáciles de usar, y MDL es bastante díficil desde un punto de vista
>>> de implementación, pero vale la pena.
>>>
>>> El 29 de febrero de 2016, 23:40, DANIEL GIANOLA<gianola at ansci.wisc.edu>
>>> escribió:
>>>
>>>> Mire MDL en Wikipedia. Me dio la impresion que hay un cierto paralelo
>>>> con el concepto de suficiencia en estadistica. Me equivoco?
>>>>
>>>>
>>>> Daniel
>>>>
>>>>
>>>> ------------------------------
>>>> *From:* predictomica-bounces at fing.edu.uy <
>>>> predictomica-bounces at fing.edu.uy> on behalf of Ignacio Ramirez Paulino
>>>> <nacho at fing.edu.uy>
>>>> *Sent:* Monday, February 29, 2016 5:38 PM
>>>> *To:* Maine Fariello
>>>> *Cc:* predictomica at fing.edu.uy
>>>> *Subject:* Re: [Predictomica] Fwd:
>>>>
>>>> Es interesante. Una pena que el autor no mencione MDL (Minimum
>>>> Description Length), que justamente abordan el tema de modelado de datos
>>>> desde un punto de vista que en cierto sentido concilia, y de manera muy
>>>> sólida, la dicotomía que se plantea en el paper...
>>>>
>>>> El 29 de febrero de 2016, 15:25, Maine Fariello<fariello at fing.edu.uy>
>>>> escribió:
>>>>
>>>>> A pedido de Daniel, les re-envío paper que puede ser de interés, sobre
>>>>> si explicar o predecir.
>>>>>
>>>>> Saludos,
>>>>>
>>>>> Maine.
>>>>>
>>>>> _______________________________________________
>>>>> Predictomica mailing list
>>>>> Predictomica at fing.edu.uy
>>>>> https://www.fing.edu.uy/mailman/listinfo/predictomica
>>>>>
>>>>>
>>>>
>>>>
>>>> --
>>>> --------------------------------------------------------------
>>>> Ignacio Francisco Ramírez Paulino
>>>> --------------------------------------------------------------
>>>>
>>>
>>>
>>>
>>> --
>>> --------------------------------------------------------------
>>> Ignacio Francisco Ramírez Paulino
>>> --------------------------------------------------------------
>>>
>>
>>
>>
>> --
>> --------------------------------------------------------------
>> Ignacio Francisco Ramírez Paulino
>> --------------------------------------------------------------
>>
>
>
>
> --
> --------------------------------------------------------------
> Ignacio Francisco Ramírez Paulino
> --------------------------------------------------------------
>
> _______________________________________________
> Predictomica mailing list
> Predictomica at fing.edu.uy
> https://www.fing.edu.uy/mailman/listinfo/predictomica
>
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <https://www.fing.edu.uy/pipermail/predictomica/attachments/20160301/e812c398/attachment-0001.html>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: Retrieving a context tree from EEG data.pdf
Type: application/pdf
Size: 700772 bytes
Desc: not available
URL: <https://www.fing.edu.uy/pipermail/predictomica/attachments/20160301/e812c398/attachment-0001.pdf>
More information about the Predictomica
mailing list