|
|
|
MODELOS DE LOCALIZACIÓN Y ESCALA. ALGUNAS CONSIDERACIONES TEÓRICAS Y APLICACIONES A PEQUEÑAS MUESTRAS.Autor: DAMILANO SCARPINELLO GABRIELA LILIANA. Año: 2004. Universidad: AUTÓNOMA DE BARCELONA. Centro de lectura: FACULTAD DE CIENCIAS. Centro de realización: ESCUELA DE POSTGRADO. Resumen: La tesis se centra en el estudio de las características y procedimientos de inferencia de los Modelos de Localización y Escala. Por una parte, se caracteriza a todos los modelos de localización simétricos para los cuales una combinación lineal de la media y mediana muestrales es un estimador asintóticamente eficiente del parámetro de localización. El modelo resultante, a tres parámetros, puede entenderse como una distribución Normal Truncada Simetrizada. Se presentan además dos métodos alternativos para estimar los parámetros que, por sus propiedades asintóticas, resultan vuelos competidores de los estimadores de máxima verosimilitud (EMV); uno basado en la "Curtosis Empírica" que se destaca por su sencillez de cálculo y un "Algoritmo" interactivo que puede implementarse fácilmente usando software estándar que trabaje con la distribución Normal Truncada simple. También se realizan estudios basados en simulaciones a fin de comparar el comportamiento de los distintos estimadores cuando el tamaño muestral es pequeño. Extendiendo este resultado al caso particular del estimador de Hodges-Lehmann, se caracteriza a las distribución Logística como el único modelo de localización simétrico para el cual este estimador es asintóticamente eficiente. Por otra parte, se investigan los procedimientos de inferencia en modelos de localización y escala en presencia de censura de Tipo I (time censored) y se demuestra una condición suficiente para la unicidad del EMV. Además, se aplica el estadístico Z*, basado en la aproximación asintótica de orden superior Saddlepoint, para la estimación por intervalos de la media poblacional de la distribución Normal y el parámetro de escala de la distribución Valor Extremo (Log-Weibull); asimismo, y a través de simulaciones, se estudia su comportamiento para pequeñas muestras. En la extensión al caso de dos muestras se considera la comparación de medias para muestras emparejadas e independientes (problemas de Behrens-Fisher) y la comparación de los parámetros de escala de dos distribuciones Valor Extremo. Si bien el ámbito de la investigación se desarrolla dentro de la Estadística Matemática, todos los tópicos tratados se ilustran con ejemplos de aplicación a situaciones prácticas. TESTS NO PARAMÉTRICOS BASADOS EN UNA DISTANCIA ENTRE FUNCIONES DE DENSIDADAutor: MARTÍNEZ CAMBLOR PABLO. Año: 2004. Universidad: OVIEDO. Centro de lectura: FACULTAD DE CIENCIAS. Centro de realización: FACULTAD DE CIENCIAS - UNIVERSIDAD DE OVIEDO.
Resumen: En esta tesis se define una medida de similitud (distancia) entre funciones de densidad que evalúa el área que tienen en común dos distribuciones de probabilidades absolutamente continuas. A partir de esta medida se construye un nuevo estadístico que permite cuantificar cuanto se parece una función de densidad y su estimación o la similitud entre varias estimaciones independientes de una misma función de densidad. Posteriormente se realiza une estudio teórico acerca de las propiedades más importantes de este estadístico, calculándose su medida y vairanza y la distribución asintótica, así como comprobándose su convergencia casi segura, mediante técnicas de procesos estocásticos. Estos resultados teóricos se emplean en la construcción de una familia de test de hipótesis para estudiar el ajuste de una distribución a un modelo teórico (bondad de ajuste) y la identidad entre varias poblaciones. En cada uno de estos contraste se analiza su potencia empleando métodos de simulación y se estudian las condiciones para que tengan un buen comportamiento. Finalmente, mediante técnicas similares a las anteriores, se demuestra la consistencia del método bootstrap suavizado y se evalúa su eficiencia práctica a través de simulaciones. Este trabajo se desarrolla para variables unidimensionales, si bien, en su parte final se dan algunas ideas para la generalización al caso multivariante. El método propuesto tiene la ventaja de poder comparar simultáneamente más de dos funciones de densidad, pudiendo considerarse una generalización de la medida L1 y resultando ser, en ocasiones, más potentes que los métodos usualmente utilizados en este tipo de contrastes. MÉTODOS ESTADÍSTICOSAutor: ARTIME CARLOS ENRIQUE. Año: 2004. Universidad: OVIEDO. Centro de lectura: FACULTAD DE CIENCIAS. Centro de realización: FAC. CIENCIAS MATEMÁTICAS. Resumen: La memoria estudia las propiedades matemáticas de la técnica "genotipado por lotes" o "pools de ADN" y propone nuevos métodos estadísticos para el mejor aprovechamiento de la información. Destaca el carácter multidisciplinar con aspectos de Biología, Estadística e Informática. Se analizan los métodos presentes en la literatura y se proponen diversos generalizaciones referentes el minero de lotes, distribución de los fenotipos, etc. En el capítulo "Métodos basados en el Remuestreo" propone un nuevo punto de vista en que se explotan los nexos entre el análisis de genotipados por lotes y los métodos tradicionales, --- en muestras individuales de AND. Se recurre a algoritmos de muestreo, como el algoritmo EM y sus derivados (MCEM, SEEM), asi como otras técnicas originales en este contexto (Extensión del método de Bremer debida a Sampford). Se realizan finalmente comparaciones detalladas de la ganancia de precisión de las técnicas propuestas, empleando métodos de riculación. EN ESTE TRABAJO SE PRESENTA UN ESTUDIO, DESDE EL PUNTO DE VISTA BAYESIANO, DE LOS MODELOS DE REGRESIÓN DICOTÓMICOS Y SU GENERALIZACIÓN AL CASO POLITÓMICO.Autor: GARCÍA GALISTEO JULIA. Año: 2004. Universidad: MÁLAGA. Centro de lectura: FACULTAD DE CIENCIAS. Centro de realización: FACULTAD DE CIENCIAS. Resumen: En este trabajo se presenta un estudio, desde el punto de vista bayesiano, de los modelos de regresión dicotómicos y su generalización a] caso politómico.y de los modelos de regresión de Poisson. En primer lugar, se generaliza el modelo usual de regresión dicotómico considerando funciones de nexo arbitrarias que verifiquen ciertas condiciones mínimas, al que denominamos modelo determinista. Se realiza, además, el estudio de posibles observaciones anómalas y se considera como criterio a la hora de elegir entre varias funciones de nexo el de preferir aquella que sea más inmune a estas observaciones, lo cual conduce a la consideración de funciones de nexo que denominamos robustas. Se propone para ello dos familias de distribuciones como posibles funciones de nexo, la familia de distribuciones t-Student y la familia de distribuciones de Box- Tiao. De ellas se elegiran aquellas que sean más robustas que las funciones de nexo clásicas Logística y Probit. Con estos nexos se consigue en primer Jugar, que cuando haya observaciones anómalas muchas de las estimaciones y predicciones que se realicen con e] modelo considerado sean mucho más estables, es decir, serán más insensibles a la presencia de éstas. Y en segundo lugm", es posible establecer criterios que permitan la detección de estas observaciones por lo que no será necesario eliminarlas -una vez detectadas- del conjunto de datos originales. Para el modelo de regresión de Poisson y el de regresión Politómica, también se generalizan los modelos usuales, es decir, el modelo Loglineal y el Logístico Multivariante, respectivamente, introduciendo como funciones de nexo generales las pertenecientes a una cierta clase que se introduce en el estudio del modelo dicotómico. Un problema importante que habitualmente se presenta cuando se analizan datos heterogéneos con estos modelos es el de la sobredispersión. Este problema se enfoca desde una perspectiva bayesiana considerando modelos bayesianos jerárquicos. Las estimaciones de los parámetros de los modelos estudiados generalmente se obtienen mediante muestras de las distibuciones a posteriori vía procedimientos MCMC, en particular mediante el de Metropolis-Hastings. Para muestras grandes se dan resultados asintóticos de estas distribuciones. La memoria concluye con dos apéndices, el Apéndice C donde se ilustra parte de la teoría desarrollada mediante ejemplos con datos reales y se incluye una aplicación de la regresión dicotómica robusta al análisis discriminante robusto. Y por último, en el Apéndice D se da el programa que se ha elaborado, con Mathematica, para el cálculo de los estimadores de máxima verosimilitud en el modelo de regresión dicotómica con función de nexo arbitraria, así como la implementación del algoritmo de Metropolis-Hastings para el modelo determinista. TESTS IN NONPARAMETRIC REGRESSIÓN BASED ON THE ERROR DISTRIBUTIONAutor: PARDO FERNÁNDEZ JUAN CARLOS. Año: 2005. Universidad: SANTIAGO DE COMPOSTELA. Centro de lectura: FACULTAD DE MATEMÁTICAS. Centro de realización: FACULTADE DE MATEMÁTICAS.
Resumen: La regresión constituye un problema fundamental en la estadística. Un modelo de regresión describe la relación entre una variable explicativa o covariable y una variable respuesta. Si la variable respuesta representa un tiempo, con frecuencia ocurre que los datos están incompletos debido a diversas razones. Una fuente importante de incompletitud es la censura. El objetivo principal de esta tesis consiste en desarrollar contrastes de hipótesis sobre la función de regresión en diversos ámbitos, tanto para datos completos como para datos censurados. Los contrastes propuestos están basados en la estimación de la función de distribución de los errores del modelo de regresión. En el Capitulo 1 realizamos una breve introducción sobre los nuevos métodos desarrollados en este trabajo. En el Capitulo 2 proponemos un nuevo método de comparación de curvas de regresión desde un punto de vista totalmente no parametrito. Esto permite comprobar si el efecto de las covariables sobre las variables respuesta es el mismo en los distintos grupos de individuos. La idea del procediemento de contraste estudiado en esta tesis consiste en comparar en cada poboblación la distribución empírica de los residuos con la distribución empírica de los residuos estimados suponiendo que la hipótesis nula es cierta, a través de estadísticos de contraste de tipo Kolmogorov-Smirnov y Cramér-von Mises definidos sobre un proceso empírico multidimensional. También en este capítulo se estudia un método para comparar las distribuciones de los errores de los modelos de regresión en distintos grupos. En el Capitulo 3 extendemos el método de comparación de curvas de regresión propuesto en el capítulo anterior a la situación en que las variables respuesta están censuradas. Finalmente, en el Capitulo 4 de esta tesis estudiamos un contraste de bondad de ajuste para modelos paramétricos de regresión en los que la variable respuesta está sujeta a censura por la derecha. Los modelos de regresión paramétricos son muy atractivos en muchas situaciones prácticas porque describen la relación entre la covariable e la variable respuesta de una forma sencilla y habitualmente los valores de los parámetros son interpretables. Sin embargo, si el modelo paramétrico falla entonces las conclusiones pueden ser erróneas. Esto motiva el desarrollo de contrastes de bondad de ajuste especificos para verificar la validez de un determinado modelo paramétrico. El contraste consiste en comparar dos estimadores de la distribución de los errores del modelo de regresión. En todos los casos probamos resultados teóricos y describimos mecanismos bootstrap para aproximar los valores críticos de los correspondientes contrastes. Además incluimos estudios de simulación y aplicaciones a datos reales. ANÁLISIS BAYESIANO DE MIXTURAS DE DISTRIBUCIONES DE LA FAMILIA EXPONENCIALAutor: RUFO BAZAGA MARÍA JESÚS. Año: 2005. Universidad: EXTREMADURA. Centro de lectura: ESCUELA POLITÉCNICA (CÁCERES). Centro de realización: ESCUELA POLITÉCNICA. UNIVERSIDAD DE EXTREMADURA. CÁCERES. Resumen: En esta tesis se presenta un marco general para el análisis bayesiano de modelos de mixturas finitas de distribuciones de familias exponenciales naturales con varianza cuadrática. Estas familias incluyen las distribuciones utilizadas con mayor frecuencia en las aplicaciones estadísticas. En primer lugar se considera el número de componentes conocido. En este contexto, las principales dificultades que se plantean son la elección de las distribuciones a priori y la resolución del problema de la no identificabilidad de los parámetros. El primer problema se resuelve mediante un método basado en el concepto de distancia de Kullback-Leibler, mientras que para el segundo se propone una aproximación basada en permutaciones de las coordenadas de los puntos generados. Para generar de la distribución a posteriori se utiliza el muestrador Gibbs. En el caso en que el número de componentes sea desconocido, se proponen métodos que permiten seleccionar entre los distintos posibles modelos mediante la estimación del factor Bayes. Se presentan distintas aproximaciones basadas en métodos Montecarlo. Las técnicas propuestas son válidas para todos los modelos en los que las distribuciones a priori son conjugadas. La generalización de las propuestas a distribuciones multidimensionales es, desde un punto de vista teórico, sencilla. Se presenta la aplicación a mixturas de distribuciones multinomiales. Un aspecto importante en este tipo de modelos es el análisis de sensibilidad. Se propone un método para aproximar una medida de sensibilidad como es el gradiente. Esta técnica especialmente útil en modelos bayesianos resueltos mediante métodos Montecarlo basado en cadenas de Markow. La principal ventaja es que no se requiere muestreo adicional. Cada método propuesto se ilustra con, el menos, un ejemplo. Finalmente, se presenta un capítulo de conclusiones y líneas de investigación futuras. SIMULACIÓN DE VALORES DELCOEFICIENTE DE EXCESO MULTIVARIANTE EN POBLACIONES NORMALES.Autor: MARCOS RODRIGUES ANTONIO NUNO. Año: 2005. Universidad: SALAMANCA. Centro de lectura: FACULTAD DE CIENCIAS. Centro de realización: FACULTAD DE CIENCIAS. Resumen: En la Memoria se estudian y analizan los conceptos de exceso o curtosis multivariante, tanto para datos empíricos como para distribuciones teóricas, y tanto en aquellos casos en los que la matriz de dispersión (varianzas y covarianzas) tiene inversa como aquéllos para los que esa matriz es singular. El concepto es importante porque permite contrastar la normalidad multivariante de una tabla de datos, para lo cual construimos tablas de cuantiles de la curtosis multivariante y, alternativamente, damos aproximaciones numéricas de las mismas que pueden ser utilizadas para muestras de tamaño n > 20. La Memoria está estructurada en 5 Capítulos, y unos Apéndices con los Programas utilizados, escritos en Mathematica, y una tabla de cuantiles y momentos de la curtosis multivariante en muestras normales, para tamaños de muestra n = 4 (1) 30 (10) 100, 150, 200 (100) 500, 1000 y número de variables p = 2 (1) 12, con p ? n - 2, terminando con unas Conclusiones y las Referencias Bibliográficas. En el Primer Capítulo se estudia el concepto de inversa generalizada de una matriz y sus propiedades. En el capítulo 2 se estudian los conceptos de asimetría y curtosis multivariante, tanto para distribuciones teóricas como para tablas de datos, se sigue la definición dada por Mardia, y se extienden esa definiciones a los casos en que la matriz de dispersión es singular, probando que la definición general es independiente de la inversa generalizada utilizada. En el Capítulo 3 se estudian las propiedades de la curtosis multivariante, tanto para distribuciones teóricas como para datos empíricos; se ve su invariancia bajo transformaciones lineales que conserven el rango de la matriz de dispersión, su efecto en pruebas de comparación de medias, de matrices de dispersión, y su uso como prueba de normalidad multivariante según el test de Mardia. En el Capítulo 4 estudiamos, por simulación, los cuantiles y 4 primeros momentos de la curtosis multivariante en poblaciones normales, la distribución teórica se aproxima por una distribución empírica calculada con 50.000 observaciones simuladas, con un control en la media y varianza de la distribución (que teóricamente es conocida), y, a partir de ella, calculamos los cuantiles 0.005, 0.025, 0.05, 0.95, 0.975 y 0.995, que permiten establecer los límites inferiores y superiores del 90%, 95% y 99% de la curtosis en poblaciones normales. Utilizando los momentos simulados de orden superior, ajustamos expresiones analíticas para los coeficientes de asimetría y exceso de la curtosis muestral multivariante que permiten obtener aproximaciones de los tipos de Cornish-Fisher y de Edgeworth para los cuantiles y probabilidades de la distribución de la curtosis multivariante, lo cula mejora mucho las aproximaciones dadas por Mardia. En el capítulo 5 vemos algunas aplicaciones con datos concretos, terminando con unos Apéndices de Programas, Tablas, Conclusiones y Referencias Bibliográficas. LÍMITES DE TOLERANCIA UNILATERALES EN MODELOS DE EFECTOS ALEATORIOSAutor: PAGURA JOSÉ ALBERTO. Año: 2006. Universidad: POLITÉCNICA DE VALENCIA. Centro de lectura: Universidad Politécnica de Valencia. Centro de realización: Universidad Politécnica de Valencia.
Resumen: El objetivo general de esta investigación es la propuesta de nuevas alternativas y el estudio comparativo de los diferentes procedimientos existentes para la obtención de límites de tolerancia unilaterales, en situaciones de muestreo bietápico equilibrado o desequilibrado que obedecen al denominado modelo de análisis de la varianza de efectos aleatorios. Se analizan, en primer lugar, las soluciones propuestas por diversos autores para la obtención de límites de tolerancia unilaterales en modelos equilibrados y se propone una modificación del método de Mee-Owen para mejorar sus propiedades estadísticas. Se evalúa el comportamiento de los diferentes métodos mediante dos estudios de simulación. La aportación más importante de la tesis se centra en el caso de modelos desequilibrados, de gran importancia práctica en la industria del acero. En la tesis se propone un procedimiento original, que sólo precisa cálculos relativamente sencillos y el uso de la tabla de la t no-central. En la tesis se compara este nuevo procedimiento con los existentes hasta la fecha en la literatura estadística. Como conclusión general de estos estudios, puede afirmarse que el nuevo procedimiento desarrollado en esta tesis constituye, por su sencillez y buenas propiedades estadísticas, el mejor método existente en la actualidad para resolver el importante problema práctico de la obtención de límites de tolerancia unilaterales a partir de muestras bietápicas desequilibradas. NONPARAMETRIC STATISTICAL INFERENCE FOR RELATIVE CURVES IN TWO-SAMPLE PROBLEMSAutor: Molanes López Elisa Maria. Año: 2006. Universidad: A CORUÑA. Centro de lectura: Facultad de Informática. Centro de realización: USC.
|
|
|