Что касается хербита:
Рабочий сервер является "основным", т.е. при отключении у него сети он у себя ничего отключать не должен, на нем как бы все работает дальше; дополнительно сделан рейд посредством mdadm (пока не учитываем случай когда он сгорает). Резервный сервер проверяет главный на доступность, при его выпадении он хербитом поднимает алиасы на интерфейсах, тем самым перехватывая виртуальный ип, на котором регистрируется оборудование. Тем же хербитом (ip r) прописывает нужные роуты, стартует софт-свитч, радиус и биллинг. Оборудка при попытке звонка перерегистрируется и начинает звонить (возможно в базе уже будет проставлена регистрация на софт-свитче, а может он часть в памяти держит, там тоже лего
).
При появлении главного он у себя стопает софт-свитч, радиус, биллинг и гасит алиасы, тем самым отдавая виртальный ип главному серверу. Оборудование при попытке звонка просто на главном перерегистрируется и все.
Про мускул:
Мускул хербитом не управляется, реплицируется сам. Мануал, собсно, можно взять любой из интернета, их там много.
Тот самый теоретически момент успевания реплицирования с "резервного" на "главный" всех совершенных звонков (при долгом выпадении главного) пока по хорошему не проверялся. В теории он должен успеть это сделать и уже начать писать текущие звонки (возможно там делается какое-то подобие очереди, пока не все маны еще не докурены
да и пока софт-свитч стартанет, пока кто-то позвонит). Пока абонентов и звонков не много, отставания в репликах нет совсем.