Обучение и переобучение моделей на большом количестве данных делается на внешних графических картах - как правило на нвидеа. А процессеоры М как и проциче чипы работающие с нейронками - это в первую очередь для инференса, т.е. использования натренированных сетей для решения задач.
Так что стоит не только подумать в сторону процессора М с соответствующим чипом, но и оценить какие задачи планируется решать и подходит ли для этого железо в принципе.
"Как всякий академик и герой "Что за херня?!" - я сетую порой" (С) Вишневский