Расширение plantain2asr
plantain2asr создан для расширения. Каждый компонент - модели, нормализаторы, метрики, вкладки отчёта - это подкласс простого абстрактного базового класса.
Если вам нужно просто сравнить модели или выгрузить исследовательские артефакты, лучше сначала использовать Интерактивный конструктор или Experiment. Этот раздел нужен тем, кто пишет собственные компоненты.
graph TD
Processor["Processor (ABC)"]
Processor --> BaseNormalizer
Processor --> BaseASRModel
Processor --> BaseMetric
BaseSection["BaseSection (ABC)"]
BaseNormalizer --> SimpleNormalizer
BaseNormalizer --> DagrusNormalizer
BaseNormalizer --> YourNormalizer["✨ ВашNormalizer"]
BaseASRModel --> GigaAM
BaseASRModel --> Whisper
BaseASRModel --> YourModel["✨ ВашModel"]
BaseMetric --> WER
BaseMetric --> CER
BaseMetric --> YourMetric["✨ ВашMetric"]
BaseSection --> MetricsSection
BaseSection --> ErrorFrequencySection
BaseSection --> YourSection["✨ ВашSection"]
Правило: реализуй интерфейс — получай пайплайн
Любой компонент, унаследовавшийся от Processor, автоматически работает с >>:
dataset >> ВашNormalizer() # ✅ работает
dataset >> ВашModel() # ✅ работает
dataset >> ВашMetric() # ✅ работает
Четыре точки расширения
| Что добавить | Базовый класс | Руководство |
|---|---|---|
| Правила нормализации текста | BaseNormalizer |
Свой нормализатор |
| Новая ASR-модель | BaseASRModel |
Своя модель |
| Новая метрика качества | BaseMetric |
Своя метрика |
| Новая вкладка в отчёте | BaseSection |
Своя вкладка |
Tip
Начните с руководства для нужного типа компонента. В каждом руководстве есть минимальный пример, который можно скопировать и адаптировать.