<div dir="ltr"><div>OK, les propongo entonces lo iguiente.<br></div>Me pasan una descripción de los datos (si quieren me pasan los datos también) y cuando arme la charla podemos ver de atacar caso a caso posibles formas de modelarlos y de seleccionar modelos dentro de la familia de modelos que obtengamos.<br></div><div class="gmail_extra"><br><div class="gmail_quote">El 1 de marzo de 2016, 14:53, CROSSA HIRIART, José Luis Francisco (CIMMYT)<span dir="ltr">&lt;<a href="mailto:J.CROSSA@cgiar.org" target="_blank">J.CROSSA@cgiar.org</a>&gt;</span> escribió:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">





<div bgcolor="white" link="blue" vlink="purple" lang="EN-US">
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d" lang="ES-MX">Tengo datos categóricos<u></u><u></u></span></p>
<p><u></u><span style="font-size:11.0pt;font-family:Wingdings;color:#1f497d" lang="ES-MX"><span>è<span style="font:7.0pt &quot;Times New Roman&quot;">
</span></span></span><u></u><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d" lang="ES-MX">ordinals (multinomiales) y de
<u></u><u></u></span></p>
<p><u></u><span style="font-size:11.0pt;font-family:Wingdings;color:#1f497d" lang="ES-MX"><span>è<span style="font:7.0pt &quot;Times New Roman&quot;">
</span></span></span><u></u><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d" lang="ES-MX">conteo (Binomial Negative y/o Poisson)
<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d" lang="ES-MX">por si sirven<u></u><u></u></span></p>
<div>
<div style="border:none;border-top:solid #b5c4df 1.0pt;padding:3.0pt 0in 0in 0in">
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:&quot;Tahoma&quot;,&quot;sans-serif&quot;;color:windowtext">From:</span></b><span style="font-size:10.0pt;font-family:&quot;Tahoma&quot;,&quot;sans-serif&quot;;color:windowtext"> Ignacio Ramirez [mailto:<a href="mailto:nacho@fing.edu.uy" target="_blank">nacho@fing.edu.uy</a>]
<br>
<b>Sent:</b> Tuesday, March 01, 2016 11:34 AM<br>
<b>To:</b> DANIEL GIANOLA; CROSSA HIRIART, José Luis Francisco (CIMMYT)<br>
<b>Cc:</b> <a href="mailto:predictomica@fing.edu.uy" target="_blank">predictomica@fing.edu.uy</a><br>
<b>Subject:</b> Re: [Predictomica] Fwd:<u></u><u></u></span></p>
</div>
</div>
<p class="MsoNormal"><u></u> <u></u></p>
<p class="MsoNormal" style="margin-bottom:12.0pt">Si claro. Digamos, el tema de si son ralas o no es un detalle. Todos los métodos de selección de modelos son en principio aplicables a datos ralos. Yo en particular he trabajado mucho, justamente, con MDL para
 modelos ralos o esparsos, pero eso es una particularidad de mi propio trabajo.<br>
<br>
Sin dudas aplicar algo así a datos de ese tipo sería un trabajo interesante. Podemos ponerlo en la lista de temas a trabajar en el grupo; talvez si algún estudiante tiene interés en esto, y tiene un background adecuado, podemos ponerlo a trabajar en eso. Yo
 no tengo a nadie en la vuelta, pero talvez Uds. tengan algún matemático o afín con ganas de hacer cosas de estas?<br>
<br>
Mientras tanto, focalizando en lo de la charla, podríamos usar datos de ese tipo como ejemplo. De hecho lo más común para introducir MDL es trabajar con datos tipo Bernoulli. Pero sería sólo a los efectos de guiar la charla (y talvez proponer un trabajo concreto
 en el tema), más que realmente aplicarlo. Eso como decía es una tesis entera :)<u></u><u></u></p>
<div>
<p class="MsoNormal">On 01/03/16 14:12, DANIEL GIANOLA wrote:<u></u><u></u></p>
</div>
<blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
<div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">El concepto se puede aplicar a estimacion de matrices de covariancias &quot;big&quot; pero ralas? Por ejemplo, en genomica construimos matrices de covariancia entre miles de variables pero con
 muestras chicas. Ejemplo: datos de expresion con 50 mil variables pero n=20-100.<u></u><u></u></span></p>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"><u></u> <u></u></span></p>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">Creo que algo asi seria novedoso.<u></u><u></u></span></p>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"><u></u> <u></u></span></p>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">Daniel<u></u><u></u></span></p>
<p class="MsoNormal" style="margin-bottom:12.0pt;background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"><u></u> <u></u></span></p>
<div>
<div class="MsoNormal" style="text-align:center;background:white" align="center">
<span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">
<hr align="center" size="2" width="98%">
</span></div>
<div>
<p class="MsoNormal" style="background:white"><b><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">From:</span></b><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"> Ignacio Ramirez Paulino
<a href="mailto:ignacio.ramirez@gmail.com" target="_blank">&lt;ignacio.ramirez@gmail.com&gt;</a><br>
<b>Sent:</b> Tuesday, March 1, 2016 10:30 AM<br>
<b>To:</b> CROSSA HIRIART, José Luis Francisco (CIMMYT); Ignacio Ramirez Paulino; DANIEL GIANOLA<br>
<b>Cc:</b> <a href="mailto:predictomica@fing.edu.uy" target="_blank">predictomica@fing.edu.uy</a><br>
<b>Subject:</b> Re: [Predictomica] Fwd:</span><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">
<u></u><u></u></span></p>
<div>
<p class="MsoNormal" style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"> <u></u><u></u></span></p>
</div>
</div>
<div>
<p class="MsoNormal" style="margin-bottom:12.0pt;background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">Bueno, no sé, como decía Daniel, todo depende de la pregunta que quieras hacerte.<br>
En realidad aplicar MDL a cada problema es un arte, por lo que lo que tendría que tener yo sería un conjunto de datos como para usar de ejemplo en la charla. Ojalá me de el tiempo para aplicarlo de manera más o menos razonable a ese conjunto de datos; eso sería
 de por sí un paper probablemente, muy similar al que mandó Daniel.<br>
<br>
Pero si vamos a hacer algo en marzo, más bien podríamos empezar con un conjunto de datos y un objetivo concreto, y por lo menos trabajar de manera más o menos abstracta con esos datos para llevar el hilo de la charla, no sé si me explico.<u></u><u></u></span></p>
<div>
<p class="MsoNormal" style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">On 01/03/16 11:52, CROSSA HIRIART, José Luis Francisco (CIMMYT) wrote:<u></u><u></u></span></p>
</div>
<blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
<div>
<p style="background:white"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d" lang="ES-MX">Hola Daniel y Nacho</span><u></u><u></u></p>
<p style="background:white"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d" lang="ES-MX">Por datos en plant breeding no hay problema. Como? que estructura?, que variables? Cuantos markers?</span><u></u><u></u></p>
<p style="background:white"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d" lang="ES-MX">Abrazo</span><u></u><u></u></p>
<p style="background:white"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d" lang="ES-MX">Jose</span><u></u><u></u></p>
<p style="background:white"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d" lang="ES-MX"> </span><u></u><u></u></p>
<p style="background:white"><b><span style="font-size:10.0pt;font-family:&quot;Tahoma&quot;,&quot;sans-serif&quot;" lang="ES-MX">From:</span></b><span style="font-size:10.0pt;font-family:&quot;Tahoma&quot;,&quot;sans-serif&quot;" lang="ES-MX">
<a href="mailto:predictomica-bounces@fing.edu.uy" target="_blank">predictomica-bounces@fing.edu.uy</a> [<a href="mailto:predictomica-bounces@fin" target="_blank">mailto:predictomica-bounces@fin</a></span><span style="font-size:10.0pt;font-family:&quot;Tahoma&quot;,&quot;sans-serif&quot;"><a href="http://g.edu.uy" target="_blank">g.edu.uy</a>]
<b>On Behalf Of </b>Ignacio Ramirez Paulino<br>
<b>Sent:</b> Tuesday, March 01, 2016 6:50 AM<br>
<b>To:</b> DANIEL GIANOLA<br>
<b>Cc:</b> <a href="mailto:predictomica@fing.edu.uy" target="_blank">predictomica@fing.edu.uy</a><br>
<b>Subject:</b> Re: [Predictomica] Fwd:</span><u></u><u></u></p>
<p style="background:white"> <u></u><u></u></p>
<div>
<div>
<div>
<p style="background:white">Excelente! Hagámoslo entonces. Estaría buenísimo conseguir algún ejemplo relevante, algún dataset que les parezca particularmente interesante, y aplicarle una metodología tipo MDL para ilustrar sus conceptos. Qué les parece?
<br>
<br>
De su lado preciso un dataset y una propuesta de fecha dentro del grupo.<u></u><u></u></p>
</div>
<p style="background:white">Saludos,<u></u><u></u></p>
</div>
<p style="background:white">Nacho.<u></u><u></u></p>
</div>
<div>
<p style="background:white"> <u></u><u></u></p>
<div>
<p style="background:white">El 1 de marzo de 2016, 09:44, DANIEL GIANOLA&lt;<a href="mailto:gianola@ansci.wisc.edu" target="_blank">gianola@ansci.wisc.edu</a>&gt; escribió:<u></u><u></u></p>
<div>
<div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">Ignacio,<u></u><u></u></span></p>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"> <u></u><u></u></span></p>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">Gracias por los comentarios.<u></u><u></u></span></p>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"> <u></u><u></u></span></p>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">Personalmente, tengo curiosidad sobre el tema, y una charla me resultaria interesante, especialmente si fuera ilustrada sobre alguna aplicacion concreta. <u></u><u></u></span></p>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"> <u></u><u></u></span></p>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">Creo que es a traves de este tipo de dialogos que se pueden &quot;estirar&quot; los campos de la ciencia, asi como crear  nuevos ambitos de aplicacion.<u></u><u></u></span></p>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"> <u></u><u></u></span></p>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">Daniel<u></u><u></u></span></p>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"> </span><u></u><u></u></p>
<div>
<div class="MsoNormal" style="text-align:center;background:white" align="center">
<span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">
<hr align="center" size="2" width="98%">
</span></div>
<div>
<p style="background:white"><b><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">From:</span></b><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"> Ignacio Ramirez Paulino &lt;<a href="mailto:nacho@fing.edu.uy" target="_blank">nacho@fing.edu.uy</a>&gt;<br>
<b>Sent:</b> Tuesday, March 1, 2016 6:28 AM<br>
<b>To:</b> DANIEL GIANOLA<br>
<b>Cc:</b> Maine Fariello; <a href="mailto:predictomica@fing.edu.uy" target="_blank">predictomica@fing.edu.uy</a><br>
<b>Subject:</b> Re: [Predictomica] Fwd:</span><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">
</span><u></u><u></u></p>
<div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"> </span><u></u><u></u></p>
</div>
</div>
<div>
<div>
<div>
<div>
<div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">Hola Daniel,</span><u></u><u></u></p>
</div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">Bueno, no exactamente. Suficiencia estadística es algo muy puntual. MDL bastante más general que eso. 
<br>
Es todo un marco matemático (a mi entender el más profundo y moderno  de todos los que hay en la vuelta) para entender el problema de modelado estadístico de datos.</span><u></u><u></u></p>
</div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"><br>
La descripcion de Wikipedia está incluso bastante mal. Hay quienes insisten en que no es más que un sinónimo para BIC (en Wikipedia dice básicamente eso, sin decirlo, al final), pero eso es incorrecto. Eso sólo tiene sentido en un regimen asintótico estricto.</span><u></u><u></u></p>
</div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"><br>
Si les interesa les puedo dar una charla sobre MDL. Yo realmente creo que no se le da la importancia que debería tener, en parte porque BIC y AIC son muy fáciles de usar, y MDL es bastante díficil desde un punto de vista de implementación, pero vale la pena.</span><u></u><u></u></p>
</div>
<div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"> </span><u></u><u></u></p>
<div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">El 29 de febrero de 2016, 23:40, DANIEL GIANOLA&lt;<a href="mailto:gianola@ansci.wisc.edu" target="_blank">gianola@ansci.wisc.edu</a>&gt; escribió:</span><u></u><u></u></p>
<div>
<div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">Mire MDL en Wikipedia. Me dio la impresion que hay un cierto paralelo con el concepto de suficiencia en estadistica. Me equivoco?<u></u><u></u></span></p>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"> <u></u><u></u></span></p>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">Daniel<u></u><u></u></span></p>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"> </span><u></u><u></u></p>
<div>
<div class="MsoNormal" style="text-align:center;background:white" align="center">
<span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">
<hr align="center" size="2" width="98%">
</span></div>
<div>
<p style="background:white"><b><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">From:</span></b><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">
<a href="mailto:predictomica-bounces@fing.edu.uy" target="_blank">predictomica-bounces@fing.edu.uy</a> &lt;<a href="mailto:predictomica-bounces@fing.edu.uy" target="_blank">predictomica-bounces@fing.edu.uy</a>&gt; on behalf of Ignacio Ramirez Paulino &lt;<a href="mailto:nacho@fing.edu.uy" target="_blank">nacho@fing.edu.uy</a>&gt;<br>
<b>Sent:</b> Monday, February 29, 2016 5:38 PM<br>
<b>To:</b> Maine Fariello<br>
<b>Cc:</b> <a href="mailto:predictomica@fing.edu.uy" target="_blank">predictomica@fing.edu.uy</a><br>
<b>Subject:</b> Re: [Predictomica] Fwd:</span><u></u><u></u></p>
<div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"> </span><u></u><u></u></p>
</div>
</div>
<div>
<div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">Es interesante. Una pena que el autor no mencione  MDL (Minimum Description Length), que justamente abordan el tema de modelado de datos desde un punto de vista que en cierto sentido
 concilia, y de manera muy sólida, la dicotomía que se plantea en el paper... </span>
<u></u><u></u></p>
</div>
<div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"> </span><u></u><u></u></p>
<div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">El 29 de febrero de 2016, 15:25, Maine Fariello&lt;<a href="mailto:fariello@fing.edu.uy" target="_blank">fariello@fing.edu.uy</a>&gt; escribió:</span><u></u><u></u></p>
<div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">A pedido de Daniel, les re-envío paper que puede ser de interés, sobre si explicar o predecir.
</span><u></u><u></u></p>
<div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"> </span><u></u><u></u></p>
</div>
<div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">Saludos,</span><u></u><u></u></p>
</div>
<div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"> </span><u></u><u></u></p>
</div>
<div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;">Maine.</span><u></u><u></u></p>
</div>
</div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"><br>
_______________________________________________<br>
Predictomica mailing list<br>
<a href="mailto:Predictomica@fing.edu.uy" target="_blank">Predictomica@fing.edu.uy</a><br>
<a href="https://www.fing.edu.uy/mailman/listinfo/predictomica" target="_blank">https://www.fing.edu.uy/mailman/listinfo/predictomica</a></span><u></u><u></u></p>
</div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#888888"><br>
<br clear="all">
<br>
-- </span><u></u><u></u></p>
<div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#888888">--------------------------------------------------------------<br>
  Ignacio Francisco Ramírez Paulino<br>
--------------------------------------------------------------</span><u></u><u></u></p>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#888888"><br>
<br clear="all">
<br>
-- </span><u></u><u></u></p>
<div>
<p style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#888888">--------------------------------------------------------------<br>
  Ignacio Francisco Ramírez Paulino<br>
--------------------------------------------------------------</span><u></u><u></u></p>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
<p style="background:white"><br>
<br clear="all">
<br>
-- <u></u><u></u></p>
<div>
<p style="background:white">--------------------------------------------------------------<br>
  Ignacio Francisco Ramírez Paulino<br>
--------------------------------------------------------------<u></u><u></u></p>
</div>
</div>
</div>
</blockquote>
<p class="MsoNormal" style="background:white"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;"><br>
<br>
<u></u><u></u></span></p>
<pre style="background:white">-- <u></u><u></u></pre>
<pre style="background:white">----------------------------------------<u></u><u></u></pre>
<pre style="background:white"> Ignacio Francisco Ramírez Paulino, PhD<u></u><u></u></pre>
<pre style="background:white">----------------------------------------<u></u><u></u></pre>
<pre style="background:white">Departamento de Procesamiento de Señales<u></u><u></u></pre>
<pre style="background:white">   Instituto de Ingeniería Eléctrica<u></u><u></u></pre>
<pre style="background:white">        Facultad de Ingeniería<u></u><u></u></pre>
<pre style="background:white">     Universidad de la República<u></u><u></u></pre>
<pre style="background:white">     Julio Herrera y Reissig 565<u></u><u></u></pre>
<pre style="background:white">         Montevideo, Uruguay<u></u><u></u></pre>
<pre style="background:white">            T:2711 0974<u></u><u></u></pre>
<pre style="background:white">----------------------------------------<u></u><u></u></pre>
</div>
</div>
</div>
</blockquote>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
</div>

</blockquote></div><br><br clear="all"><br>-- <br><div class="gmail_signature">--------------------------------------------------------------<br>  Ignacio Francisco Ramírez Paulino<br>--------------------------------------------------------------<br></div>
</div>