Pongo
Modèle de langage visuel open-source pour comprendre les images avec des invites textuelles.
Please wait while we load the page
Moondream est un modèle de langage visuel open-source (VLM) conçu pour comprendre les images à l'aide d'invites textuelles simples. Il est léger, rapide et performant, ne nécessitant que 1 Go d'espace. Moondream peut être utilisé pour diverses applications, notamment la légende d'images, la détection d'objets, la réponse visuelle aux questions, et plus encore. Il est conçu pour les développeurs qui veulent une solution d'IA visuelle polyvalente et facile à utiliser.
Choisissez une capacité, écrivez une invite, et obtenez des résultats. Moondream peut être exécuté localement ou via une API cloud. Il fonctionne avec des clients Python et Node. Vous pouvez l'installer et l'exécuter gratuitement ou utiliser le service cloud avec un niveau gratuit disponible.
Choisissez ceci si vous êtes développeur ou passionné de technologie à la recherche d'un modèle de langage visuel léger et open-source capable de faire plein de choses sympas comme légender des images ou répondre à des questions à leur sujet. Il est rapide, facile à utiliser et ne surcharge pas votre système, ce qui en fait un choix solide pour une compréhension polyvalente des images.
Fonctionne avec les clients Python et Node, fonctionne hors ligne, compatible CPU ou GPU.
Fonctionne avec les mêmes clients Python ou Node, évolutif pour la production.
Aucun produit disponible