Por lo general, la IA debe entrenarse con el material existente para detectar objetos, pero Meta tiene una forma en que la tecnología puede detectar objetos sin ayuda. El gigante de las redes sociales ha publicado un modelo de IA «Segment Anything» que puede detectar objetos en imágenes y videos, incluso si no formaban parte del conjunto de entrenamiento. Puede seleccionar elementos haciendo clic en ellos o utilizando sugerencias de texto de formato libre. Como explica Reuters, puede escribir la palabra «gato» y ver cómo la IA resalta todos los gatos en una foto determinada.
El modelo también se puede combinar con otros modelos. Esto puede ayudarlo a reconstruir un objeto en 3D utilizando una sola imagen o dibujar a partir de representaciones de un casco de realidad mixta. Esencialmente, Segment Anything puede limitar la necesidad de capacitación adicional en IA.
Tanto el modelo de IA como el conjunto de datos estarán disponibles para su descarga bajo una licencia no comercial. Es decir, los creadores no pueden usarlo para productos. Esto es principalmente para la investigación y la ampliación del acceso a la tecnología. En este momento, Meta usa una tecnología similar para moderar el contenido prohibido, recomendar publicaciones y marcar fotos.
Los desarrolladores reconocen que el modelo existente no es perfecto. Puede pasar por alto detalles más finos y no define los bordes con tanta precisión como algunos modelos. Y aunque Segment Anything puede procesar solicitudes en tiempo real, se ralentiza cuando se requiere el procesamiento de imágenes. Meta dice que es probable que algunas herramientas de IA más especializadas superen este modelo en sus áreas.
No verá esta IA en robots u otros dispositivos donde la detección rápida y precisa de objetos es (generalmente) vital. Sin embargo, dichos modelos aún pueden ayudar en situaciones en las que no es práctico depender únicamente de los datos de entrenamiento. La red social puede usar esta tecnología para mantenerse al día con el volumen de contenido que crece rápidamente. Como mínimo, esto demuestra que Meta quiere generalizar la visión artificial.
Meta no es ajeno a compartir avances en inteligencia artificial, como un traductor de idiomas no escritos. Dicho esto, la empresa está bajo presión para demostrar que es una empresa tan poderosa en su categoría como los pesos pesados de la tecnología como Google y Microsoft. La compañía ya está planeando «personajes» generativos de IA para sus aplicaciones sociales, e inventos como Segment Anything muestran que tiene algunas ventajas propias.