large-multimodal-models topics

Awesome_Matching_Pretraining_Transfering

434

Stars

49

Forks

434

Watchers

The Paper List of Large Multi-Modality Model (Perception, Generation, Unification), Parameter-Efficient Finetuning, Vision-Language Pretraining, Conventional Image-Text Matching for Preliminary Insigh...

Paranioar

awesome

awesome-list

cross-modal-retrieval

image-retrieval

BenchLMM

81

Stars

6

Forks

Watchers

[ECCV 2024] BenchLMM: Benchmarking Cross-style Visual Capability of Large Multimodal Models

AIFEG

benchmark

cv

dataset

large-language-models

MMMU

332

Stars

21

Forks

Watchers

This repo contains evaluation code for the paper "MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI"

MMMU-Benchmark

computer-vision

deep-learning

deep-neural-networks

evaluation

LLaVA-Plus-Codebase

696

Stars

52

Forks

Watchers

LLaVA-Plus: Large Language and Vision Assistants that Plug and Learn to Use Skills

LLaVA-VL

agent

large-language-models

large-multimodal-models

multimodal-large-language-models

awesome-multimodal-in-medical-imaging

486

Stars

51

Forks

Watchers

A collection of resources on applications of multi-modal learning in medical imaging.

richard-peng-xia

large-language-models

large-multimodal-models

medical-imaging

medical-report-generation

OpenAdapt

1.4k

Stars

204

Forks

1.4k

Watchers

Open Source Generative Process Automation (i.e. Generative RPA). AI-First Process Automation with Large ([Language (LLMs) / Action (LAMs) / Multimodal (LMMs)] / Visual Language (VLMs)) Models

OpenAdaptAI

gpt-4

gpt-4-api

gpt-4-vision-preview

gpt4-turbo