1. Título: Datos de la especie Iris Actualizado 4 de febrero 2006 - Eliminadas 40 observaciones en cada clase para mejor comprensión práctica Actualizado 19 de abril 2007 - Corregido nombres de variables en cabecera para coincidir con data(iris) en R 2. Fuente: (a) Autor: R.A. Fisher (b) Concesión: Michael Marshall (MARSHALL%PLU@io.arc.nasa.gov) (c) Fecha: Julio, 1988 3. Utilización (obras, proyectos, ..): - Publicaciones: Un gran número de obras referencian o utilizan estos datos. 1. Fisher,R.A. "The use of multiple measurements in taxonomic problems" Annual Eugenics, 7, Part II, 179-188 (1936); también en "Contributions to Mathematical Statistics" (John Wiley, NY, 1950). 2. Duda,R.O., & Hart,P.E. (1973) Pattern Classification and Scene Analysis. (Q327.D83) John Wiley & Sons. ISBN 0-471-22361-1. Ver página 218. 3. Dasarathy, B.V. (1980) "Nosing Around the Neighborhood: A New System Structure and Classification Rule for Recognition in Partially Exposed Environments". IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. PAMI-2, No. 1, 67-71. -- Resultados destacados en este trabajo: -- Bajas proporciones de clasificación errónea (0% para la clase setosa) 4. Gates, G.W. (1972) "The Reduced Nearest Neighbor Rule". IEEE Transactions on Information Theory, May 1972, 431-433. -- Resultados: -- De nuevo, bajas proporciones de clasificación errónea 5. Ver también: 1988 MLC Proceedings, 54-64. Cheeseman et al's AUTOCLASS II conceptual clustering system encuentra tres clases en los datos. 4. Información destacada: --- Este es, quizás, la mejor base de datos conocida en la literatura de reconocimiento de patrones. El artículo de fisher es un clásico en este área de estudio y ha sido frecuentemente referenciado hata el día de hoy (ver Duda & Hart, por ejemplo) --- El conjunto de datos contiene 3 clases de 50 observaciones cada una, donde cada clase está referida a un tipo de planta iris. --- Característica o atributo de predicción: clase de la planta iris. 5. Número de observaciones: 150 (50 en cada clase) Actualizado 4 de febrero 2006 - 30 (10 en cada clase) 6. Número de variables o atributos: 4 variables cuantitativas sin valores nulos, 1 variable predictora cualitativa para la clase (factor de tres niveles). 7. Información de atributos: 1. s_length: longitud de los sépalos en cm 2. s_width : anchura de los sépalos en cm 3. p_length: longitud de los pépalos en cm 4. s_width : anchura de los pépalos en cm 5. species: clase de la planta -- Iris Setosa -- Iris Versicolour -- Iris Virginica 8. Valores missing: No presentes Summary Statistics: Min Max Mean SD Correlation con la clase sepal length: 4.3 7.9 5.84 0.83 0.7826 sepal width: 2.0 4.4 3.05 0.43 -0.4194 petal length: 1.0 6.9 3.76 1.76 0.9490 (valor alto!) petal width: 0.1 2.5 1.20 0.76 0.9565 (valor alto!) 9. Distribución en la clase: 33.3% para cada una de las 3 clases.