El aprendizaje automático revoluciona el almacenamiento de datos

Investigadores estadounidenses han desarrollado un innovador sistema de almacenamiento de datos “a la carta”, que se adapta a las necesidades de cada usuario o aplicación. Aprovecha las ventajas del aprendizaje automático, una de las ramas más importantes de la inteligencia artificial.

Un equipo de especialistas del Massachusetts Institute of Technology (MIT) ha creado una herramienta de almacenamiento de datos que emplea técnicas de aprendizaje automático para adaptarse a las necesidades específicas de cada usuario o aplicación. Según una nota de prensa, se vuelve así una opción más eficiente y rápida que los sistemas actuales, realizando un aporte de gran trascendencia en un escenario de sobreabundancia de información y datos.

Se estima que sobre 2025 la totalidad de la información almacenada a nivel mundial llegará a los 175 billones de gigabytes. La impresionante cifra deja en claro que el almacenamiento de datos ha dejado de ser un problema secundario y personal que nos obliga a cambiar periódicamente de dispositivos para pasar a ser un inconveniente social: ¿hasta qué punto es sostenible el incremento en el volumen de la información generada a nivel planetario?

Considerando esta problemática, uno de los mayores desafíos de la informática hacia un futuro cercano es poder manejar la sobreabundancia de información y, al mismo tiempo, ofrecer sistemas de almacenamiento y procesamiento que sean eficientes y viables, tanto desde el punto de vista económico como tecnológico.

El aprendizaje automático como salida del laberinto

Los científicos del MIT han decidido encargarse de esta cuestión, utilizando para ello las posibilidades que brinda el aprendizaje automático. Esta herramienta de inteligencia artificial ofrece la alternativa de utilizar algoritmos y programas informáticos que tienen la capacidad de “aprender” y modificarse a medida que van sumando nuevos datos. En consecuencia, pueden adaptarse de manera inteligente a necesidades que van cambiando.

Mientras los sistemas actuales de almacenamiento de datos trabajan en base a soluciones estandarizadas, la nueva tecnología desarrollada por los científicos estadounidenses funciona como un sistema “a la carta”. Esto quiere decir que optimiza sus recursos y prestaciones de acuerdo a lo requerido por cada usuario en un momento determinado, o en función de la aplicación que se utilice.

Eficiencia y versatilidad en el almacenamiento

La diferencia en cuanto a efectividad y prestaciones es notoria. Los sistemas conocidos hasta hoy alcanzan un funcionamiento correcto, pero tienen serias limitaciones porque no ofrecen variadas posibilidades de almacenamiento ni condiciones que se adapten a necesidades concretas.

Por el contrario, el nuevo sistema bautizado Tsunami logra cambiar dinámicamente la estructura del almacenamiento de datos en función del tipo de consultas y requerimientos que recibe, creando nuevas formas de almacenar datos que no son factibles utilizando los enfoques tradicionales de la informática.

Los testeos realizados evidencian que la nueva tecnología puede trabajar hasta 10 veces más rápido que los sistemas de última generación. Al mismo tiempo, sus conjuntos de datos se pueden organizar gracias al aprendizaje automático en paquetes inteligentes que ocupan un espacio hasta 100 veces menor que el necesario en los sistemas tradicionales.

Además de permitir una gestión más eficiente en el almacenamiento de datos, Tsunami podría ser de gran utilidad en contextos en los cuales los equipos informáticos ofrecen prestaciones modestas en cuanto a memoria RAM, almacenamiento en disco duro o capacidad de procesamiento. En resumen, la nueva tecnología permitiría desarrollar tareas más complejas con un equipamiento básico y económico.

Referencia

Tsunami: A Learned Multi-dimensional Index for Correlated Data and Skewed Workloads.Jialin Ding, Vikram Nathan, Mohammad Alizadeh and Tim Kraska. CoRR abs/2006.13282 (2020).DOI:no informado.

Fuente: https://tendencias21.levante-emv.com/el-aprendizaje-automatico-revoluciona-el-almacenamiento-de-datos.html

Comparte este contenido:

Facebook presenta Ax y Botorch, nuevas herramientas de aprendizaje automático

Redacción: Hats New

El equipo de Inteligencia Artificial de Facebook no para, y ha presentado ahora algunas novedades en herramientas de aprendizaje automático, incluida Ax, una plataforma para la gestión de la experimentación de aprendizaje automático que funciona sobre PyTorch.

Ax interactúa con las herramientas de prueba y simulación A/B, por ejemplo, con el objetivo de optimizar automáticamente el sistema. A medida que se ejecutan los experimentos, Ax puede elegir automáticamente la mejor estrategia de optimización. Ax ha sido creado para poder realizar experimentos para ajustar cosas como la tasa de aprendizaje y los abandonos. Ax aprende, ayuda a aprender, en realidad, ya que administra los experimentos y aprende el modelo sobre la marcha.

BoTorch, por otro lado, se basa en PyTorch, es una biblioteca para la optimización bayesiana.

PyTorch 1.1 también se lanzó hoy con soporte nativo de TensorBoard para la visualización del aprendizaje automático y la velocidad de rendimiento mejorada para su compilador JIT.

Tanto la nueva versión de PyTorch, como Ax y Botorch, se han anunciado en la conferencia anual de desarrolladores F8 de Facebook en San José, California, junto a las novedades que ya os hemos comentado en Messenger, Instagram y el propio Facebook.

La Inteligencia Artificial sigue creciendo de forma exponencial, y cada vez son más las plataformas y herramientas creadas para poder trabajar con nuevos modelos. Ya no se trata de aprender Python y trabajar con Tensorflow, hay que conocer los términos más usados en este sector, y pytorch.org,

Fuente: https://wwwhatsnew.com/2019/05/02/facebook-presenta-ax-y-botorch-nuevas-herramientas-de-aprendizaje-automatico/

Comparte este contenido:

9 mitos sobre el aprendizaje automático

Por: Mary Branscombe

El aprendizaje automático está resultando tan útil, que es tentador suponer que puede resolver todos los problemas y que se aplica a todas las situaciones. Como cualquier otra herramienta, el aprendizaje automático es útil en áreas particulares, especialmente para problemas que siempre ha tenido, pero sabía que nunca podría contratar a suficientes personas para solucionarlos; o para problemas con un objetivo claro, pero no hay un método obvio para resolverlo.

Aun así, es probable que todas las organizaciones aprovechen el aprendizaje automático de una manera u otra, ya que el 42% de los ejecutivos le dijeron recientemente a Accenture que esperan que la inteligencia artificial (IA) esté detrás de todas sus nuevas innovaciones para el 2021. Pero obtendrá mejores resultados si observa más allá de la exageración y evita estos mitos comunes, al comprender lo que el aprendizaje automático puede y no puede ofrecer.

Mito: El aprendizaje automático es IA
El aprendizaje automático y la inteligencia artificial se usan frecuentemente como sinónimos, pero si bien el aprendizaje automático es la técnica más exitosamente lograda en los laboratorios de investigación en el mundo real, la IA es un campo amplio que abarca áreas como visión artificial, robótica y procesamiento del lenguaje natural, así como enfoques tales como la satisfacción de restricciones que no involucran el aprendizaje automático. Piense en ello como algo que hace que las máquinas parezcan inteligentes. Ninguno de estos es el tipo de “inteligencia artificial” general que algunas personas temen que pueda competir o incluso atacar a la humanidad.

Tenga cuidado con las palabras de moda y sea preciso. El aprendizaje automático se trata de aprender patrones y predecir resultados de grandes conjuntos de datos; los resultados pueden parecer “inteligentes”, pero en el fondo se trata de aplicar estadísticas a una velocidad y escala sin precedentes.

Mito: Todos los datos son útiles
Necesita datos para el aprendizaje automático, pero no todos los datos son útiles para el aprendizaje automático. Para entrenar su sistema, necesita datos representativos que cubran los patrones y resultados que su sistema de aprendizaje automático deberá manejar. Necesita datos que no tengan patrones irrelevantes incluidos (como fotos que muestran a todos los hombres de pie y todas las mujeres sentadas, o todos los autos en el garaje y todas las bicicletas en un campo fangoso) porque el modelo de aprendizaje de máquina que genere reflejará esos patrones excesivamente específicos y los buscará en los datos con los que lo utilice. Todos los datos que utiliza para el entrenamiento deben estar bien etiquetados, y etiquetados con las características que coinciden con las preguntas que le hará al sistema de aprendizaje automático, lo cual requiere mucho trabajo.

No suponga que los datos que ya tiene son limpios, claros, representativos o fáciles de etiquetar.

Mito: Siempre se necesita mucha información
Los principales avances realizados recientemente en reconocimiento de imágenes, comprensión de lectura de máquina, traducción de idiomas y otras áreas, han sucedido gracias a la mejora en las herramientas, el hardware -como las GPU que pueden procesar grandes cantidades de datos en paralelo y grandes conjuntos de datos etiquetados, incluyendo ImageNet y el Stanford Question Answering Dataset. Pero gracias a un truco llamado aprendizaje por transferencia, no siempre se necesita un gran conjunto de datos para obtener buenos resultados en un área específica; en su lugar, puede enseñarle a un sistema de aprendizaje automático cómo aprender utilizando un gran conjunto de datos, y luego hacer que transfiera esa capacidad para aprender a su propio conjunto de datos de entrenamiento mucho más pequeño. Así es como funcionan las API de visión personalizada de Salesforce y Microsoft Azure: Solo necesita 30-50 imágenes que muestren lo que desea clasificar para obtener buenos resultados.

El aprendizaje de transferencia le permite personalizar un sistema entrenado previamente para su propio problema con una cantidad relativamente pequeña de datos.

Mito: Cualquiera puede construir un sistema de aprendizaje automático
Existen muchas herramientas y marcos de código abierto para el aprendizaje automático, e innumerables cursos que le muestran cómo usarlos. Pero el aprendizaje automático sigue siendo una técnica especializada; necesita saber cómo preparar datos y dividirlos para entrenamiento y pruebas, necesita saber cómo elegir el mejor algoritmo y qué heurística usar con él, y cómo convertirlo en un sistema confiable en producción. También necesita monitorear el sistema para asegurarse de que los resultados sigan siendo relevantes a lo largo del tiempo; ya sea que su mercado cambie o su sistema de aprendizaje automático sea lo suficientemente bueno como para terminar con un grupo diferente de clientes, debe seguir comprobando que el modelo todavía se ajusta a su problema.

Obtener el aprendizaje automático correcto requiere experiencia; si recién está comenzando, busque APIs para modelos previamente entrenados a los que puede llamar desde adentro de su código, mientras adquiere o contrata conocimientos en ciencia de datos y aprendizaje automático para construir sistemas personalizados.

Mito: Todos los patrones en los datos son útiles
Los que sufren de asma, las personas con dolor de pecho o enfermedad cardíaca, y cualquier persona que tenga 100 años de edad, tienen una tasa de supervivencia mucho más alta para la neumonía de lo que hubiese podido esperar. Tan alta, de hecho, que un sistema de aprendizaje automático simple diseñado para automatizar la admisión hospitalaria, podría enviarlos a casa (un sistema basado en reglas entrenado en los mismos datos que una red neuronal hizo exactamente eso). Desafortunadamente, la razón por la que tienen tasas de supervivencia tan altas es que siempre son admitidos inmediatamente porque la neumonía es muy peligrosa para ellos.

El sistema está viendo un patrón válido en los datos; simplemente no es un patrón útil para elegir a quién admitir (aunque ayudaría a una compañía de seguros a predecir los costos del tratamiento). Aún más peligrosamente, no sabrá que esos antipatrones inútiles están en su conjunto de datos a menos que ya los conozca.

En otros casos, un sistema puede aprender un patrón válido (como un controvertido sistema de reconocimiento facial que predijo con precisión la orientación sexual a partir de selfies) que no es útil porque no tiene una explicación clara y obvia (en este caso las fotografías parecen mostrar señales sociales como pose en vez de algo innato).

Los modelos de “caja negra” son eficientes, pero no dejan en claro qué patrón han aprendido. Los algoritmos más transparentes e inteligibles, como los Modelos Aditivos Generalizados, aclaran lo que el modelo ha aprendido para que pueda decidir si es útil implementarlos.

Mito: El aprendizaje de refuerzo está listo para usar
Prácticamente todos los sistemas de aprendizaje automático en uso en la actualidad, usan aprendizaje supervisado; en la mayoría de los casos, están entrenados en conjuntos de datos claramente etiquetados en los que los humanos han estado involucrados en la preparación. La conservación de estos conjuntos de datos requiere tiempo y esfuerzo, por lo que hay mucho interés en las formas de aprendizaje no supervisadas, especialmente el aprendizaje reforzado (RL, por sus siglas en inglés), donde un agente aprende por ensayo y error interactuando con su entorno y recibiendo recompensas por el comportamiento correcto. El sistema AlphaGo de DeepMind usó RL junto con aprendizaje supervisado para vencer a los jugadores Go de alto rango; y Libratus, un sistema construido por un equipo de Carnegie Mellon, usó RL junto con otras dos técnicas de IA para derrotar a algunos de los mejores jugadores de póker del mundo en el Texas Hold ‘Em sin límites (que tiene una estrategia de apuestas larga y compleja). Los investigadores están experimentando con RL en todo, desde la robótica hasta el software de seguridad de prueba.

Sin embargo, el RL es menos común fuera de la investigación. Google usa DeepMind para ahorrar energía en sus centros de datos, al aprender a enfriarlos de manera más eficiente; Microsoft usa una versión específica y limitada del RL llamada bandidos contextuales para personalizar los titulares de noticias de los visitantes de MSN.com. El problema es que pocos entornos del mundo real tienen recompensas fácilmente detectables y comentarios inmediatos, y es particularmente engañoso asignar recompensas cuando el agente toma múltiples acciones antes de que ocurra algo.

Mito: El aprendizaje automático es imparcial
Debido a que el aprendizaje automático aprende de los datos, replicará cualquier sesgo en el conjunto de datos. Es probable que la búsqueda de imágenes de los CEO muestre fotos de CEO blancos y masculinos, porque más CEO son blancos y hombres. Pero resulta que el aprendizaje automático también amplifica el sesgo.

El conjunto de datos COCO, que a menudo se usa para entrenar sistemas de reconocimiento de imágenes, tiene fotos de hombres y mujeres; pero se muestran más mujeres al lado del equipo de cocina y se muestra a más hombres con teclados y ratones, o raquetas de tenis y tablas de snowboard. Entrene el sistema con COCO y este asocia a los hombres con el hardware de computadora con más fuerza que las estadísticas en las fotos originales.

Un sistema de aprendizaje automático también puede agregar un sesgo a otro. Entrenar un sistema de aprendizaje automático con marcos populares para representar palabras como vectores que muestran las relaciones entre ellos, y aprenderá estereotipos como “el hombre es para la mujer como el programador de computadoras es para el ama de casa”, o el médico para la enfermera y el jefe para la recepcionista. Si usa ese sistema con uno que traduce entre idiomas que tienen pronombres como él y ella, como el inglés, a los que tienen pronombres neutrales al género, como el finlandés o el turco, “son un médico” se convierte en “él es un doctor” y “ellos son enfermeros” se convierte en “ella es enfermera”.

Obtener recomendaciones similares en un sitio de compras es útil, pero es problemático cuando se trata de áreas sensibles y puede producir un ciclo de retroalimentación; si se une a un grupo de Facebook que se opone a la vacunación, el motor de recomendación de Facebook sugerirá otros grupos que se centren en las teorías de conspiración o la creencia de que la Tierra es plana.

Es importante conocer los problemas de sesgo en el aprendizaje automático. Si no puede eliminar el sesgo en su conjunto de datos de entrenamiento, use técnicas como regularizar las asociaciones de género entre pares de palabras para reducir el sesgo o agregar elementos no relacionados a las recomendaciones y así evitar el ‘filtro burbuja’.

Mito: El aprendizaje automático solo se usa para bien
El aprendizaje automático potencia las herramientas antivirus, observa el comportamiento de los nuevos ataques para encontrarlos tan pronto como se lanzan. Pero igualmente, los hackers están utilizando el aprendizaje automático para probar las defensas de las herramientas de antivirus, así como para crear ataques de phishing a escala, mediante el análisis de grandes cantidades de datos públicos o analizando cuán exitosos fueron los intentos previos de phishing.

Mito: El aprendizaje automático reemplazará a las personas
Es común preocuparse de que la inteligencia artificial le quite empleos y ciertamente cambiará los trabajos que hacemos y cómo los hacemos; los sistemas de aprendizaje automático mejoran la eficiencia y el cumplimiento y reducen los costos. A la larga, creará nuevos roles en el negocio y hará que algunas posiciones actuales se vuelvan obsoletas. Pero muchas de las tareas que automatiza el aprendizaje automático simplemente no eran posibles antes, debido a la complejidad o escala; no podría contratar suficientes personas para mirar cada fotografía publicada en las redes sociales para ver si presenta su marca, por ejemplo.

Lo que el aprendizaje automático ya ha comenzado es a crear nuevas oportunidades comerciales, como mejorar la experiencia del cliente gracias al mantenimiento predictivo, y ofrecer sugerencias y apoyo a los responsables de la toma de decisiones empresariales. Al igual que con las generaciones anteriores de automatización, el aprendizaje automático puede liberar empleados para utilizar su experiencia y creatividad.

Fuente: http://www.cwv.com.ve/9-mitos-sobre-el-aprendizaje-automatico/

Comparte este contenido:

Colombia: Qué es «machine learning» y porqué será tan grande como la llegada de internet

Colombia / 17 de diciembre de 2017 / Autor: Redacción / Fuente: El Espectador

El «aprendizaje automático» cambiará la forma en que vivimos (para bien o para mal).

De acuerdo con un artículo escrito por el experto en tecnología en El País de España, Enrique Martín, el aprendizaje automático o “machine learning” cambiará la forma en la que vivimos y trabajamos. De hecho, esta tecnología de aprendizaje ya está presente en nuestras vidas diarias: en el software de los teléfonos, en los carros, en softwares de mapas, incluso en el algoritmo de Facebook.

Según Israel Olalla, ingeniero español de Google, el machine learning deriva de la Inteligencia artificial y consiste en desarrollar códigos o procesos que le permita a las máquinas aprender a través de un conjunto de datos que se le entregan y que, conforme al desarrollo de la máquina, se van corrigiendo. En otras palabras, es moldear la experiencia y la manera en que un cerebro (en este caso, una máquina) la procesa.

De acuerdo con Martín, este aprendizaje está cambiando el modo en el que los humanos percibimos el mundo: se reduce el tiempo de toma de decisiones, de comunicaciones entre nosotros. “El aprendizaje automático será la tecnología que defina una era”, escribió. Incluso señala que esta tecnología crece a la par con los datos abiertos y la infraestructura de “nube” que cada vez se alimenta más con grupos de datos más grandes. De acuerdo con la International Data Corporation, 7 de cada 10 compañías del mundo tienen su información “subida” en la nube (aunque solo 3 de 10 sepan realmente cómo usar la herramienta).  Adiós a edificios con pisos dedicados a alojar abarrotados archiveros: todo se aloja en la nube. De esos datos se alimenta la máquina programada para el aprendizaje automático, y entre más información tenga, más rápido y efectivamente aprende y se corrige.

El potencial del aprendizaje automático es increíble, sobre todo para grandes empresas de tecnología como Grant o Google que al final, son quienes necesitan, financian y hacen uso del machine learning a gran escala. Según él, el aprendizaje automático reduce el tiempo en el que se crean pronósticos precisos y fiables y puede tener un impacto en la capacidad de las empresas para planificar, hacer presupuestos, identificar anomalías en grandes conjuntos de datos, etc.

Pero hay quienes se oponen a este “avance de la ciencia”, o que por lo menos son escépticos con respecto a sus efectos, y con razón. El reconocido físico Stephen Hawking tiene una idea más fatalista sobre el potencial del “machine learning”. Desde 2014 ha advertido sobre el avance de la inteligencia artificial “para evitar que de destruya la raza humana. Necesitamos encontrar una manera de identificar amenazas potencialmente antes de que tengan la oportunidad de escalar y poner en peligro a la civilización”, dijo.

En noviembre de este año reiteró su escenario apocalíptico y dijo a la revista Wired que “si la gente diseña un virus de computador, alguien diseñará una Inteligencia Artificial que se mejore y se replique a sí misma. Esto sería una nueva forma de vida que superaría a los humanos”.

Malas noticias para el señor Hawking: el aprendizaje automático que se apoya en la infraestructura de la nube es parte integral de casi todas las estrategias de tecnologías de las empresas que trabajan con datos, y no solo ha llegado a las organizaciones, cada vez se intrinca más en la vida de los seres humanos. En ese orden de ideas, un apocalipsis a lo Hawking sería una versión más interesante de esa aburridísima película, Yo Robot, en donde la inteligencia artificial se ha perfeccionado a tal punto que las máquinas esclavizan a la raza humana en venganza por ser tratadas en calidad de microondas, y la única persona capaz de detenerlas es tan humano que no se da cuenta de que es (¡oh, sorpresa!) un robot.

Puede que sea tan sencillo como lo que dice Francoi Chollet, ingeniero de aprendizaje automático de Google a El País, “la IA se ocupará de las tareas en las que los humanos no somos muy buenos, y lo harán mejor. Serán una herramienta, no la competencia». O tan preocupante como lo que dijo Elon Musk, fundador de empresas como Solar X (que entre otras cosas, también usan estas tecnologías), durante una reunión de gobernadores en Estados Unidos en junio de este año: “la inteligencia artificial representa el raro caso en el que necesitamos ser proactivos con la regulación, en vez de reactivos. Creo que, para el momento en el que estemos reaccionando, será muy tarde. La inteligencia artificial representa un riesgo fundamental para la existencia de la civilización humana”.

En algo están de acuerdo: sin importar si tememos o no, el machine learning está aquí, aprendiendo de usted, entre sus dedos, mientras lee esto en el celular.

Fuente:

https://www.elespectador.com/tecnologia/que-es-machine-learning-y-porque-sera-tan-grande-como-la-llegada-de-internet-articulo-728101

Comparte este contenido:

Estados Unidos: Juez imparcial: la inteligencia artificial dicta cuál es el mejor método de enseñanza

Estados Unidos / 15 de octubre de 2017 / Autor: Redacción / Fuente: Sputnik News

Una investigación llevada a cabo por la empresa estadounidense de consultoría McKinsey & Company analizó datos del Informe del Programa Internacional para la Evaluación de Estudiantes a través de tecnologías de aprendizaje automático —una forma de inteligencia artificial— para entender cuál práctica de enseñanza es la más provechosa.

El estudio analizó los dos principales métodos de instrucción para entender el impacto relativo de cada una de estas prácticas.

La primera de ellas trata de la ‘instrucción guiada’, en la cual el maestro explica y demuestra ideas, considera preguntas y conduce discusiones entre los estudiantes.

La segunda es la ‘enseñanza basada en la investigación’, en la que se asigna a los estudiantes un papel más prominente en su propio aprendizaje, como por ejemplo el de desarrollar sus propias hipótesis y realizar experimentos.

Al analizar los resultados del Informe PISA, se descubrió que en las cinco regiones observadas —Asia-Pacífico; Europa; América Latina; Oriente Medio y África del Norte; y América del Norte— los puntajes eran generalmente más altos cuando los maestros tomaban la iniciativa, y más bajos con el aprendizaje basado en la investigación.

A primera vista, parece que la enseñanza basada en la investigación es un total fracaso, sin embargo, al profundizar el análisis de los datos, se descubrió que la solución ideal es, en realidad, cuando las dos prácticas son utilizadas conjuntamente.

Además, la investigación descubrió que es sólo cuando los estudiantes dominan suficiente contenido —normalmente obtenido a través de clases dirigidas por el profesor— es que pueden beneficiarse plenamente del aprendizaje basado en la investigación.

Fuente de la Noticia:

https://mundo.sputniknews.com/tecnologia/201710091072996235-estudio-educacion-tecnologias/

Comparte este contenido: