Почти, это и правда сделано из-за малого количества VRAM, но по чуть иным причинам. Представь, что у тебя 16мб VRAM, а все текстуры и модели для отрисовки сцены весят условно 20мб. Из-за ограничений API эту ситуацию разработчик ПО никак обойти не мог, поэтому драйверы начали хранить все 20мб в RAM, закидывать все 16мб что помещается в VRAM, рисовать что поместилось, переписывать оставшиеся 4мб и рисовать оставшееся.
В современных графических API есть буферы разного вида, что позволяет разработчику самому контролировать распределение памяти между RAM/VRAM.
В современных графических API я не сомневаюсь, но сомневаюсь что игра написанная по "старым правилам" заиграет новыми красками, если будет переведена на "новый язык" в автоматическом формате. В принципе вижу как могут уйти некоторые статтеры, но среднее количество кадров наверное не вырастет.
Почти верно, но есть неправильные или лишние слова.
Никакого приоритета для перенаправления нет, перенаправляется все. Скорее всего при запуске создается некий супер общий пайплайн Vulkan рендера, и все дальнейшие вызовы к d3d8 "переводятся" и пробрасываются дальше по этому пайплайну в Vulkan.
DirectX и OpenGL никак с технической точки зрения не связаны, это два не связанных между собой графических API, которые говорят с видеокартой на более понятном ей языке.
Я бы сказал так:
Данная подменная библиотека переводит все DirectX запросы в запросы Vulkan и вызывает их используя библиотеки и рендер вулкана в драйвере ГПУ полностью игнорируя directx.