214 votos

¿Cuál es la diferencia entre la minería de datos, estadística, aprendizaje automático y la inteligencia artificial?

¿Cuál es la diferencia entre la minería de datos, estadística, aprendizaje automático y la inteligencia artificial?

Sería más preciso decir que son 4 campos de intentar resolver problemas similares, pero con diferentes enfoques? ¿Qué es exactamente lo que tienen en común y donde se diferencian? Si hay algún tipo de jerarquía entre ellos, ¿cuál sería?

Preguntas similares se han preguntado anteriormente, pero yo todavía no lo entiendo:

113voto

Sean Hanley Puntos 2428

Hay una considerable superposición entre estos, pero algunos pueden hacerse distinciones. De necesidad, voy a tener a la sobre-simplificar algunas cosas o corto-atención a los demás, pero voy a hacer mi mejor esfuerzo para dar algún sentido de estas áreas.

En primer lugar, la Inteligencia Artificial es bastante distinto del resto. La IA es el estudio de cómo crear agentes inteligentes. En la práctica, es la forma de cómo programar un ordenador para comportarse y realizar una tarea como un agente inteligente (es decir, una persona) lo haría. Esto no tiene que implicar el aprendizaje o la inducción a todos, sólo puede ser un camino para construir una mejor trampa para ratones'. Por ejemplo, aplicaciones de la AI han incluido en programas de seguimiento y control de los procesos en curso (por ejemplo, aumentar el aspecto de Un si parece demasiado bajo). Aviso de que la IA puede incluir maldito-cerca de cualquier cosa que una máquina hace, siempre y cuando no lo hace 'estúpida'.

En la práctica, sin embargo, la mayoría de las tareas que requieren inteligencia requieren una capacidad para inducir nuevos conocimientos a partir de experiencias. Por lo tanto, una gran área dentro de la IA es la máquina de aprendizaje. Esto implica el estudio de los algoritmos que se puede extraer información de forma automática (es decir, sin en-línea humana de orientación). Es ciertamente el caso de que algunos de estos procedimientos se incluyen ideas se derivan directamente de la, o de inspiración, estadística clásica, pero no tiene que ser. De manera similar a la IA de la máquina, el aprendizaje es muy amplio y puede incluir casi todo, siempre hay algún componente inductivo. Un ejemplo de una máquina algoritmo de aprendizaje puede ser un filtro de Kalman.

La minería de datos es un área que ha tomado mucho de su inspiración y técnicas de aprendizaje de máquina (y algunos, también, a partir de las estadísticas), pero se puso a diferentes extremos. La minería de datos es llevada a cabo por una persona, en una situación específica, en un determinado conjunto de datos, con un objetivo en mente. Normalmente, esta persona quiere aprovechar el poder de las diversas técnicas de reconocimiento de patrón que se han desarrollado en el aprendizaje de máquina. Muy a menudo, el conjunto de datos es enorme, complicada, y/o pueden tener problemas especiales (tales como que hay más variables que observaciones). Generalmente, el objetivo es descubrir y generar algunas de las conclusiones preliminares en un área donde realmente hubo un poco de conocimiento de antemano, o ser capaz de predecir las futuras observaciones con precisión. Por otra parte, la minería de datos procedimientos de la 'supervisión' (no sabemos la respuesta-descubrimiento) o "supervisión" (sabemos la respuesta-predicción). Tenga en cuenta que el objetivo general es no desarrollar una comprensión más sofisticada de los datos subyacentes proceso de generación. Común de técnicas de minería de datos podría incluir los análisis de agrupamiento, árboles de clasificación y regresión, y las redes neuronales.

Supongo que no necesito decir mucho para explicar lo de las estadísticas es en este sitio, pero tal vez me puede decir un par de cosas. Estadística clásica (aquí me refiero a frecuentista y Bayesiana) es un sub-tema dentro de las matemáticas. Pienso en ella como en gran parte de la intersección de lo que sabemos acerca de la probabilidad y de lo que sabemos acerca de la optimización. Aunque la estadística matemática puede ser estudiado como un Platónico objeto de investigación, que en su mayoría es entendido como más práctico y aplicado en el carácter de otros, enrareciendo las áreas de las matemáticas. Como tal (y, en particular, en contraste a la minería de datos), es en su mayoría empleados hacia una mejor comprensión de algunos de los datos de proceso de generación. Por lo tanto, por lo general comienza con una formalmente especificado el modelo, y a partir de este se derivan los procedimientos para extraer con precisión que el modelo de ruidoso casos (es decir, la estimación--mediante la optimización de algunos de la pérdida de la función) y ser capaces de distinguir de otras posibilidades (es decir, inferencias basadas en el conocimiento de las propiedades de la distribución de muestras). El prototipo de estadística es la técnica de regresión.

43voto

Muchas de las otras respuestas se han cubierto los principales puntos pero usted pidió una jerarquía si existe y la forma en que lo veo, a pesar de que son cada una de las disciplinas en su propio derecho, no hay jerarquía parece que nadie ha mencionado todavía ya que cada uno se construye sobre el anterior.

La estadística es sólo acerca de los números, y la cuantificación de los datos. Hay muchas herramientas para encontrar las propiedades relevantes de los datos, pero es bastante cercana a la matemática pura.

La Minería de datos es sobre el uso de las Estadísticas , así como otros métodos de programación para encontrar patrones ocultos en los datos, por lo que se puede explicar algún fenómeno. La Minería de datos se basa intuición acerca de lo que realmente está sucediendo en algunos datos y todavía poco más hacia la matemática de la programación, pero se usa tanto.

Aprendizaje de máquina utiliza la Minería de Datos y técnicas de otros algoritmos de aprendizaje para construir modelos de lo que está sucediendo detrás de algunos de los datos de modo que puede predecir resultados futuros. La matemática es la base para muchos de los algoritmos, pero esto es más hacia la programación.

La Inteligencia Artificial de los usos de los modelos construidos por la Máquina de Aprendizaje y otras formas de la razón sobre el mundo y dar lugar a la inteligente comportamiento si esto es un juego de conducción o un robot/coche. La Inteligencia Artificial tiene algún objetivo a alcanzar mediante la predicción de cómo las acciones afectarán el modelo del mundo y elige las acciones que la mejor forma de lograr ese objetivo. Muy programación de base.

En breve

  • Estadísticas cuantifica los números
  • La Minería de datos se explica los patrones de
  • La máquina de Aprendizaje predice con modelos
  • La Inteligencia Artificial se comporta y razones

Ahora dicho esto, habrá algunos AI problemas que caer sólo en AI y lo mismo para las otras disciplinas, pero en la mayoría de los problemas interesantes de hoy (auto-conducción de coches, por ejemplo) podría fácilmente y correctamente ser llamado a todos estos. Espero que esto aclare la relación entre ellos se le preguntó acerca de.

21voto

Assaf Lavie Puntos 207

Podemos decir que todos ellos están relacionados, pero son todas cosas diferentes. Aunque usted puede tener cosas en común entre ellos, tales como que en las estadísticas y de minería de datos utiliza métodos de agrupamiento.
Permítanme tratar de definir brevemente cada uno de ellos:

  • La estadística es una muy antigua disciplina basada principalmente en la clásica de métodos matemáticos, que pueden ser utilizados para el mismo propósito que la minería de datos a veces es que es la clasificación y agrupación de las cosas.

  • La minería de datos consiste en la construcción de modelos con el fin de detectar los patrones que nos permiten clasificar o predecir situaciones dan una cantidad de hechos o factores.

  • La inteligencia Artificial (marque Marvin Minsky*) es la disciplina que intenta emular el funcionamiento del cerebro con métodos de programación, por ejemplo la construcción de un programa que juega al ajedrez.

  • La máquina de aprendizaje es la tarea de la construcción del conocimiento y su almacenamiento en cierta forma en el equipo; la forma puede ser de modelos matemáticos, algoritmos, etc... Cualquier cosa que pueda ayudar a detectar patrones.

16voto

John Richardson Puntos 1197

Estoy más familiarizado con el aprendizaje de la máquina - minería de datos eje - así que voy a concentrarme en que:

La máquina de aprendizaje tiende a estar interesado en la inferencia en situaciones que no son comunes, por ejemplo, no yo.yo.d. de datos, aprendizaje activo, aprendizaje semi-supervisado, aprendizaje con datos estructurados (por ejemplo, cadenas de caracteres o gráficos). ML también tiende a estar interesado en la teórica de los límites sobre lo que se puede aprender, que a menudo constituye la base para los algoritmos utilizados (por ejemplo, la máquina de soporte vectorial). ML tiende a ser de un Bayesiano de la naturaleza.

La minería de datos está interesado en la búsqueda de patrones en los datos que no sabes acerca de. No estoy seguro de que es significativamente diferente de análisis exploratorio de datos en las estadísticas, mientras que en el aprendizaje de máquina en general, hay una más bien se define el problema a resolver.

ML tiende a ser el más interesado en pequeños conjuntos de datos donde más ajustada es el problema de minería de datos y tiende a estar interesados en los grandes conjuntos de datos, donde el problema es lidiar con las cantidades de datos.

Estadísticas y de aprendizaje de la máquina proporciona muchas de las herramientas básicas utilizadas por los mineros de datos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X