llava surgery script for new llava-arch model from Intel #7333

KohakuBlueleaf · 2024-05-16T17:37:33Z

Intel recently have uploaded a llava-1.5 arch model which use llama3-8B as backbone:
https://huggingface.co/Intel/llava-llama-3-8b/tree/main

And looks like their keynames in the state_dict are totally different from what it was. I think we may need some updates for llava surgery/convertion script?

Or anything did I missed?
my llama.cpp version is 9afdffe

The text was updated successfully, but these errors were encountered:

KohakuBlueleaf added the bug-unconfirmed label May 16, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

llava surgery script for new llava-arch model from Intel #7333

llava surgery script for new llava-arch model from Intel #7333

KohakuBlueleaf commented May 16, 2024

llava surgery script for new llava-arch model from Intel #7333

llava surgery script for new llava-arch model from Intel #7333

Comments

KohakuBlueleaf commented May 16, 2024