Як ми вибрали ML-модель, яка лежить в основі вашого прогнозу. Погляд за лаштунки: 15+ моделей, 4 000 спостережень лисичок у графстві Мейо та чесний іспит 2025 року.
У 2021 році пік плодоношення лисички в Ірландії припав на вересень. У 2025-му пік був у липні. Два місяці різниці, той самий вид, та сама країна. Календар не завжди збігається, погода змінюється з року в рік, а торішній щоденник не завжди повторюється. У графстві Мейо наша команда зібрала понад 4 000 перевірених спостережень лисички за шість років, і у 2025 році ми взяли цей масив і влаштували чесний іспит 15 різним ML-моделям. Ця стаття про те, як ми їх порівнювали, хто переміг і чому ви зараз користуєтеся саме цією моделлю в ShroomCast.

Навіщо взагалі прогнозувати гриби
Ліс це не календар. Подивіться на спостереження лисички по всій Ірландії за останні 7 сезонів на одному графіку:

У 2021 році ви поїхали б у ліс у липні і знайшли б лише мох. У 2025 році ви чекали б до вересня і запізнилися б на пік на шість тижнів. Це не аномалія одного року, це норма: температура, опади, вологість ґрунту, тип лісу, місячні цикли, кожне з цих умов зсуває плодоношення на дні і тижні, а їхній спільний ефект може перетягнути пік сезону з липня на вересень і назад.
Тож збирачі віками працювали “на чуйку”, за погано формалізованими ознаками на кшталт “пройшла гроза, через чотири дні поїду в дубовий гай.” В окремих лісах і сезонах це працює. На рівні країни і року це лотерея.
З даними задача стає розв’язною. Якщо у вас тисячі реально зафіксованих плодоношень по одному регіону, прив’язаних до погоди в ці дні, можна шукати в цих даних закономірності і прогнозувати наступний сплеск. Це і є задача, заради якої існує ShroomCast.
Дані. На чому все стоїть
Станом на сьогоднішній реліз:
- 300K+ перевірених спостережень грибів з 2019 року.
- 140+ регіонів у покритті моделі по всій Європі.
- 7+ років даних про погоду на кожен з цих регіонів.
- 14 видів моделюються індивідуально (лисичка, білий, сморчок, шафрановий рижик, моховик жовто-бурий, опеньок та інші).
Джерела ми збираємо одним способом: публічні бази спостережень плюс власні польові записи нашої команди та перевірених джерел, з якими ми працюємо безпосередньо. Кожен запис це не просто “в цей день знайшли”, а трійка (регіон, вид, дата) плюс повний контекст погоди і ґрунту навколо цього дня.
Що ми аналізуємо
Кожен вид у кожному регіоні моделюється окремо. У лисички свої тригери, у сморчка свої, у білого свої. У межах однієї моделі ми дивимося на п’ять груп ознак:
- Погода: температура повітря, опади, вологість, атмосферний тиск, хмарність.
- Ґрунт: температура ґрунту, вологість ґрунту, склад.
- Ліс: тип (хвойний, листяний, мішаний), висота над рівнем моря, локальний мікроклімат.
- Природні цикли: місячні фази, сезонні патерни, видоспецифічні вікна плодоношення.
- Історична динаміка: що відбувалося в цьому регіоні з цим видом у минулі роки за схожих умов.
Кейс: графство Мейо, Ірландія, лисичка
Щоб показати, як ми вибираємо модель, візьмемо один регіон і один вид. Мейо ідеальний testbed з кількох причин: достатньо великий пул спостережень за багаторічний період (понад 4 000 лише за однією лисичкою), плюс ми доповнили датасет загальноірландськими даними по лисичці для контексту.
З 2019 по 2024 роки був наш training period. Моделі “вчили” по цих шести сезонах: які комбінації погоди і ґрунту передували реальному плодоношенню, які ні. 2025 рік ми залишили недоторканим. Це майбутнє, яке жодна модель не бачила на етапі навчання.

Кожна точка на графіку вище це або знахідка нашої команди, або підтверджене спостереження від перевірених джерел, з якими ми працюємо. Жодних inferred даних. Тільки те, що людина реально побачила і зафіксувала.
Як ми вибирали модель
Це та частина, яку більшість користувачів app ніколи не бачить: модельний тендер.
Ми перебрали понад 15 різних ML-архітектур. Їхні конкретні назви менш важливі, ніж сам підхід: кожна модель дивилася на одні й ті самі дані і мала навчитися прогнозувати ймовірність плодоношення лисички в Мейо на кожен тиждень 2025 року. У межах кожної архітектури ми прогнали десятки варіацій: різні горизонти ознак, різні регуляризації, різні способи кодування сезонності.
Головне правило відбору: модель оцінювалася не за тим, наскільки добре вона запам’ятовує старі дані (це вміє будь-яка перетренована конструкція), а за тим, наскільки точно вона прогнозує 2025 рік, який взагалі не бачила під час навчання. Це і є чесний іспит.
Модель 1 проти Моделі 2

На графіку вище один і той самий набір реальних спостережень 2025 року, і поверх них прогнози двох моделей-фіналісток. Синій графік (ML Модель 1) акуратно повторює реальні сплески: ловить початок сезону, не пропускає серпневий пік, коректно затухає до жовтня. Інший варіант або запізнюється, або переоцінює інтенсивність плодоношення в “тихі” тижні.
Різниця на око не виглядає драматичною, але в практичному сенсі вона величезна. Зайвий прогноз “Відмінно” в тиждень без грибів це втрачений вихідний і спалений бензин. Пропущений пік це втрачений сезон. Тому перемогла саме та модель, яка в середньому найменше “вводила в оману” на 2025 році.
Цей самий підхід ми прогнали для всіх видів і для кожного з 140+ регіонів. Не скрізь перемогла одна й та сама архітектура: в регіонах з тонкою спостережною базою вигравали більш консервативні моделі, в щільних регіонах брали верх більш чутливі. Фінальний production-пайплайн зібраний із цих локально-оптимальних варіантів.
Що в підсумку потрапило в застосунок
Моделі-переможці запустилися в production і тепер рахують для вас 14-денний прогноз по кожному виду у вашому регіоні. Чотири рази на добу пайплайн підтягує свіжу погоду, оновлює ознаки, проганяє модель і публікує результат. Ви бачите його у вигляді тієї самої кольорової шкали:
- 0-20% Дуже низька (фіолетовий, сьогодні не день)
- 20-40% Низька (синій, шансів майже немає)
- 40-60% Помірна (зелений, варто перевірити знайомі місця)
- 60-80% Висока (жовтий, умови хороші)
- 80-100% Відмінна (помаранчевий, бери кошик)
Тобто все, що залишилося від тисяч годин навчання моделей, це п’ять кольорів і одне число на кожен день. Так і має бути. Модель складна, відповідь проста.
Де працює найкраще, а де гірше
Прозорість це частина продукту. Не у всіх регіонах дані однаково щільні, і ми це не приховуємо.
Сильніше за все: Велика Британія та Ірландія. Тут у нас найвища щільність спостережень і найдовші ряди за видами. Мейо вище це приклад того, як повинен виглядати добре насичений регіон.
Добре: південна половина Швеції (Геталанд і більша частина Свеланду). Тут ми нещодавно розширили покриття і вже отримуємо стійкий сигнал.
Слабше: північна Швеція (Норрланд), особливо subarctic-зони на кшталт Норботтена. Там і плодоношення коротші, і спостережень менше. Модель працює, але вікно невизначеності ширше. Ми це показуємо в застосунку чесно: де даних мало, прогноз виходить стриманішим.
Це не недолік, це устрій задачі. Чим більше даних тим точніша відповідь. Щосезону ми додаємо нові спостереження і перекалібровуємо моделі заново.
Чому регіон, а не точка
Один технічний момент, у якому нам періодично доводиться виправдовуватися. ShroomCast свідомо не показує прогноз для конкретних точок на карті. Тільки для регіонів (десятки квадратних кілометрів).
Причина не технічна. Якби застосунок казав “ось у цій просіці за 50 метрів на північ від такого-то повороту сьогодні 92% імовірності лисички”, через тиждень цієї просіки б не було. Ліс не витримує масового набігу за координатами. Тому ми працюємо на рівні регіону, а свої конкретні точки залишаємо збирачам самим.
ShroomCast не зберігає ваші місця. Не запам’ятовує, де ви ходили. Не будує вашу персональну карту. Це частина дизайну, не упущення.
Що далі
Зараз у покритті Велика Британія, Ірландія і Швеція. Наступний реліз Франція, далі continental Europe ширше. Додамо нові види по мірі того, як набирається достатня спостережна база (мінімум пара тисяч validated observations на регіон, інакше модель не має сенсу).
У кожному новому сезоні ми повторюємо той самий іспит, що і у випадку Мейо: тренуємо на минулих роках, перевіряємо на поточному, відбираємо переможців. Це не разовий запуск моделі, це безперервна перекалібровка.
На завершення
Грибний прогноз це не магія і не гадання. Це спроба побачити ліс краще, ніж календар та інтуїція разом узяті, і при цьому чесно сказати користувачеві, де модель упевнена, а де ні.
Ми робимо це тому, що самі грибники. Кожен з нашої команди хоча б раз у сезоні втрачає день у порожньому лісі, і для нас цей продукт почався як спосіб перестати втрачати ці дні. Якщо для вас це теж знайомий біль, спробуйте прогноз на свій регіон.
Спецпропозиція до запуску 2026
50% знижки на перший рік Premium! Підпишіться, щоб отримати ексклюзивний промокод.
Імʼя
Електронна пошта*
Платформа*
