PicoFold — предсказание вторичной структуры белков из ДНК
Кольцегранная модель аминокислот, портированная из MAXScript в Python/Web. Уникальность подхода — прямое отображение "кодон ДНК → тип вторичной структуры" без моделирования энергии фолдинга.
- Q3
- 0.377
- random 0.347 · +3.1 п.п.
- Z-score
- 3.10
- p < 0.01 · n=15
- Валидация
- 113
- белков · 21 797 остатков
- TM-score vs AlphaFold
- 0.05
- не 3D-конкурент
Что это
PicoFold — научный веб-инструмент, предсказывающий вторичную структуру белков из последовательности ДНК (а не из аминокислотной последовательности, как AlphaFold/PSIPRED). Алгоритм основан на кольцегранной модели аминокислот (А. Ю. Кушелев, Лаборатория Наномир) и работает по принципу прямой кинематики: кодон → тип спирали + углы → координаты атомов.
Что валидировано
- 15 белков, 2 814 остатков: Z-score 3.10 (p < 0.01) — статистически значимая корреляция типа спирали с третьим нуклеотидом кодона.
- 113 белков, 21 797 остатков (DSSP):
- Q3 = 0.377 (refined), random baseline = 0.347, прирост +3.1 п.п.
- Helix-сигнал: G-ending 39.5% H vs C-ending 30.1% H.
- Beta-anti-correlation: A-ending = 18.8% strand (минимум).
- Chi-square: 6 из 18 семейств аминокислот p < 0.05 (Ser, Gly, Glu, Ile, Asp, Tyr).
- Топ-белки: Tropomyosin α (Q3=0.821), Liprin-α2 (0.726), Vimentin (0.703).
Что не делает
PicoFold не предсказывает третичный 3D-фолд. TM-score vs AlphaFold (инсулин, 110 остатков) = 0.0465 — ниже случайного. Модель строит цепь последовательно (локальная геометрия), не моделирует дальнодействия, гидрофобное ядро, дисульфидные связи или растворитель.
Серия “Шедевры белковой архитектуры”
В рассылке Лаборатории Наномир продолжается серия публикаций (на момент апреля 2026 — 193 части), описывающая структурные паттерны белков на основе кольцегранной модели: фрактальные спирали Кушелева, межвитковые дисульфидные/полисульфидные мостики, сверхдлинные α/π-спирали.
Что нужно
Заинтересованным учёным: воспроизводимая валидация на новых датасетах, независимая проверка статистической значимости helix-сигнала. Биотех-компаниям: обсуждение API-доступа и интеграции в пайплайны анализа кодонной оптимизации.
Связанные публикации
- 2025Определение вторичной структуры белка с использованием генетического кодаКушелев А.Ю. · Медицина. Социология. Философия. Прикладные исследования
- 2026Использование кольцегранных моделей аминокислот для моделирования структуры белковКожевников Д.Н., Кушелев А.Ю. · Молекулярная медицина
Что мы ищем
Для биоинформатиков: проверить алгоритм на собственном датасете через picofold.com. Для лабораторий: интерес к API-доступу для пайплайнов.