Можно. Но использование таблиц и макросов, раздувающих простые процедуры в сотни и более байт - это преждевременная оптимизация.
Чаще всего в случае необходимости быстрой печати точек используются другие подходы. Например обработка точек целыми блоками (используя особенности рисования или результаты предыдущих вычислений).
set 0,(hl) имеется ввиду #CB #xx ? для set там вроде %11 bit SSS нужно, т.е. or %11000110.
По тактам ваша замена у меня получается 4+4+4+4+7+13+15=51 такт вместо заменяемых 4+7+4+4+7+7+7=40. Не нахожу оптимизации..
Проверьте мои вычисления, а то под рукой сейчас нет справочника, брал по памяти и отсюда.
Кстати, эта последовательность возможно может быть соптимизирована засчет уже имеющейся выше серии "srl b".
Просто она делает только то, что от неё требуется (;