Czy branże fitness i konkurencyjne w pływaniu są dostosowane do danych AI? – Część 1

Opublikowano dnia 11 lutego 2025
Edytowano dnia 29 maja 2025
Wprowadzenie
Wnioski oparte na danych zrewolucjonizowały wiele sportów, umożliwiając precyzyjne plany treningowe, lepsze zapobieganie urazom i informacje zwrotne o wynikach w czasie rzeczywistym. Jednak w dziedzinie pływania — sportu, w którym liczą się milisekundy — jakość i struktura danych pozostają znaczącymi wyzwaniami. W jaki sposób AI i ML mogą pomóc nam uzyskać lepsze wyniki i jakie ryzyko pojawia się, gdy ignorujemy jakość danych?
Ta pierwsza część naszego dwuczęściowego cyklu oferuje oparty na literaturze przegląd przygotowywania danych dla AI w sporcie, z odniesieniami zaczerpniętymi z dziedzin badań AI/ML i zastosowanymi do scenariuszy specyficznych dla pływania. Naszym celem jest zniwelowanie luki między tym, czego potrzebują systemy AI, a tym, w jaki sposób pływanie może to zapewnić. Przyjrzymy się podstawom jakości danych, niebezpieczeństwom związanym ze złym zarządzaniem danymi i kluczowym filarom niezbędnym do tworzenia solidnych zestawów danych gotowych na AI. Do końca tego przeglądu zrozumiesz, dlaczego dobrze ustrukturyzowane, wysokiej jakości dane są niezbędne do zbudowania fundamentu dla zaawansowanej analizy, umożliwiając lepsze podejmowanie decyzji i wzrost wydajności w basenie.
Sekcje omówione w Części 1:
- Sekcja 1: Dlaczego jakość danych jest niezbędna dla ML/AI Opisujemy główne powody, dla których wysokiej jakości, dobrze zarządzane dane są niezbędne dla aplikacji AI i ML, szczególnie w sportach, w których liczy się wydajność, takich jak pływanie.
- Sekcja 2: Bariery, pułapki i wyzwania związane z danymi niskiej jakości Ta sekcja podkreśla praktyczne konsekwencje złych praktyk dotyczących danych, w tym stronniczych modeli, wadliwych strategii szkoleniowych i marnowanych zasobów.
- Sekcja 3: Podstawowe podstawy zapewniania wysokiej jakości danych w AI/ML Przedstawiamy kluczowe filary niezawodnego zarządzania danymi, od wewnętrznej i kontekstowej jakości danych po zgodność z etyką, które są kluczowe dla tworzenia wiarygodnych wyników AI.
Sekcja 1: Dlaczego jakość danych jest niezbędna dla ML/AI — „silnik AI”
Wyobraź sobie, że tankujesz silnik: jeśli paliwo jest niskiej jakości lub zanieczyszczone, nigdy nie osiągniesz szczytowej wydajności. Dane działają w ten sam sposób w przypadku uczenia maszynowego (ML) i sztucznej inteligencji (AI). W świecie sportu, zwłaszcza pływania, dokładne dane są siłą napędową nowoczesnej analityki, śledzenia wyników i podejmowania decyzji. Dane niskiej jakości lub niekompletne mogą wprowadzić w błąd nawet najbardziej zaawansowane systemy AI, potencjalnie wykolejając plany treningowe i wyniki zawodów.
Oto kluczowe powody, dla których jakość danych jest niezbędna dla każdej aplikacji opartej na AI:
- Dokładność i niezawodność modelu Wysokiej jakości dane zapewniają, że modele AI dostarczają precyzyjnych, niezawodnych prognoz. W pływaniu spójne i dokładne dane dotyczące wskaźników, takich jak liczba ruchów, podział okrążeń i zmienność tętna, pozwalają trenerom i sportowcom zaufać wnioskom generowanym przez AI. Z drugiej strony, słabe dane mogą prowadzić do niewiarygodnych modeli i wadliwych schematów treningowych (Priestley i in., 2023; Qayyum i in., 2020).
- Unikanie kaskad danych Błędy danych mogą rozprzestrzeniać się w całym procesie uczenia maszynowego, tworząc efekt kaskadowy, w którym małe początkowe błędy rozrastają się w większe problemy. Na przykład, ciągłe błędne rejestrowanie czasów okrążeń może zniekształcać analizę tempa, przewidywania zmęczenia i strategie wyścigu, co prowadzi do kosztownych nieefektywności (Sambasivan i in., 2021; Polyzotis i in., 2018).
- Strefy i uczciwość Strefy lub niekompletne dane, szczególnie w sportach wyczynowych, mogą prowadzić do przekłamanych spostrzeżeń i niesprawiedliwych wyników. Na przykład dane treningowe ograniczone do pewnych danych demograficznych lub warunków pływaków mogą wykluczać kluczowe czynniki, tworząc modele, które faworyzują niektórych sportowców kosztem innych. Zapewnienie zróżnicowanych, reprezentatywnych danych pomaga zmniejszyć stronniczość i poprawić generalizację (Zhou i in., 2018; Qayyum i in., 2020).
- Czyszczenie i przygotowanie danych Skuteczne czyszczenie danych usuwa szum, koryguje nieścisłości i rozwiązuje brakujące wartości. Można to porównać do utrzymania jakości wody w basenie — bez odpowiedniego czyszczenia wydajność pływaków i spostrzeżenia AI cierpią. Czyste dane zapewniają, że modele mogą dostosowywać się do nowych i zmieniających się warunków (Polyzotis i in., 2018; Priestley i in., 2023).
- Wymagania specyficzne dla domeny Każdy sport ma unikalne metryki i wymagania. W pływaniu monitorowanie metryk, takich jak częstotliwość ruchów, przerwy na odpoczynek i fazy podwodne, jest niezbędne. Dostosowanie kontroli jakości danych do tych szczegółów zapewnia, że wyniki AI odpowiadają rzeczywistym potrzebom w zakresie wydajności (Priestley i in., 2023; Ranjan, 2023). 6. Ciągły monitoring i zarządzanie Gromadzenie danych nie kończy się po wytrenowaniu modelu. Wydajność pływaków ewoluuje, nowi sportowcy dołączają do programów, a czujniki mogą się zmieniać w czasie. Ciągłe monitorowanie przychodzących danych zapewnia, że narzędzia AI pozostają dokładne i istotne (Bangari i in., 2024; Zhou i in., 2018).
- Kompleksowe zarządzanie jakością danych Zarządzanie dużymi wolumenami i różnorodnością danych treningowych — takimi jak liczba okrążeń, odczyty biometryczne i analiza wideo — wymaga solidnych, skalowalnych procesów. Jasna strategia jakości danych obejmuje objętość, różnorodność i prędkość, aby zachować spójność w całym cyklu życia ML (Ranjan, 2023; Priestley i in., 2023).
- Rozważania etyczne i prawne Gromadzenie metryk wydajności i zdrowia budzi obawy etyczne, zwłaszcza w zakresie prywatności i zgodności. Wysokie standardy jakości danych, bezpieczne zarządzanie i przestrzeganie wytycznych etycznych pomagają organizacjom wypełniać zobowiązania prawne (Qayyum i in., 2020; Zhou i in., 2018).
Jakość danych jest podstawą udanych systemów ML/AI. Dokładne, kompleksowe i dobrze zarządzane dane napędzają bardziej niezawodne modele, wzmacniając zaufanie wśród trenerów, sportowców i interesariuszy. Traktowanie danych jako „paliwa” aplikacji AI zapewnia bardziej sprawiedliwe wyniki, niezależnie od tego, czy w obiektach szkoleniowych, laboratoriach badawczych, czy na zawodach globalnych.
Sekcja 2: Bariery, pułapki i wyzwania związane z danymi niskiej jakości
W analityce sportowej niska jakość danych to coś więcej niż tylko drobna przeszkoda — może ona wykoleić programy treningowe, marnować cenne zasoby i podkopać zaufanie do spostrzeżeń opartych na AI. Od trenerów śledzących czasy skrętów po naukowców sportowych analizujących duże zestawy danych czujników, zrozumienie tych kluczowych pułapek ma kluczowe znaczenie dla zapewnienia wiarygodnych wyników.
- Degradacja wydajności modelu Modele AI opierają się na dokładnych, kompletnych danych, aby się uczyć i tworzyć prognozy. Gdy wprowadzane są brakujące lub nieprawidłowe dane — takie jak niedokładne podziały okrążeń lub błędnie zarejestrowana liczba uderzeń — modele generują niewiarygodne prognozy. Może to skutkować nieoptymalnymi strategiami tempa, a nawet zwiększonym ryzykiem kontuzji, jeśli sportowcy zostaną zmuszeni do przekroczenia bezpiecznych granic (Priestley i in., 2023; Qayyum i in., 2020).
- Kaskady danych Małe błędy danych na początku procesu mogą narastać i prowadzić do większych problemów w dalszej części procesu. Na przykład monitor pracy serca, który nieprawidłowo rejestruje częste skoki, może wywołać „fałszywe alarmy” dotyczące zdrowia sportowca, co prowadzi do niepotrzebnych zmian w planach treningowych. Te kaskady zmniejszają zaufanie do systemów AI i mogą zagrozić dobremu samopoczuciu sportowca (Sambasivan i in., 2021; Polyzotis i in., 2018). 3. Problemy z uprzedzeniami i uczciwością Niska jakość danych często wynika z niekompletnych zestawów danych, które nie odzwierciedlają zróżnicowanych populacji sportowców. Gdy modele są trenowane na ograniczonych danych — takich jak metryki pochodzące wyłącznie od pływaków elitarnych — mogą one generować porady, które są nieistotne lub nawet szkodliwe dla sportowców młodych lub na poziomie mistrzowskim. Włączające i reprezentatywne gromadzenie danych jest kluczem do łagodzenia uprzedzeń (Zhou i in., 2018; Qayyum i in., 2020).
- Brak ujednoliconych metryk Bez ujednoliconych metod rejestrowania kluczowych metryk (np. tempa uderzeń lub czasów odcinków okrążeń) porównywanie danych między zespołami lub badaniami staje się trudne. Niespójne definicje mogą powodować zamieszanie podczas przyjmowania rozwiązań AI, spowalniając postęp i wzmacniając błędy w aplikacjach (Priestley i in., 2023). 5. Zatrucie danych i zagrożenia bezpieczeństwa Gdy dane są źle zarządzane, stają się podatne na manipulacje lub złośliwe ataki. W sporcie zmienione dane dotyczące wyników mogą wprowadzać skautów w błąd, wypaczać rankingi, a nawet wpływać na rynki zakładów. Wdrożenie solidnych środków walidacji i bezpieczeństwa pomaga zapobiegać takim ryzykom zatrucia danych (Qayyum i in., 2020).
- Ograniczenia zasobów i problemy z dokumentacją Niedostatecznie zasobne zespoły i niejasne protokoły gromadzenia danych często prowadzą do błędów, których można uniknąć. Na przykład słabo udokumentowane procedury kalibracji czujników mogą skutkować błędnym etykietowaniem danych, co później wymaga dużego wysiłku, aby to naprawić. Z czasem te luki w zasobach pogłębiają nieefektywność (Sambasivan i in., 2021).
- Wyzwania etyczne i prawne Obsługa poufnych danych sportowców — w tym danych biometrycznych lub związanych ze zdrowiem — wymaga ścisłego przestrzegania przepisów dotyczących prywatności. Niedbałe zarządzanie danymi może prowadzić do niezgodności, problemów prawnych i naruszenia zaufania między sportowcami a personelem (Qayyum i in., 2020; Zhou i in., 2018).
- Nieefektywność operacyjna Niska jakość danych może znacznie spowolnić postęp, wymagając ciągłego czyszczenia i walidacji. Czas spędzony na „gaszeniu pożarów” złych danych można by lepiej wykorzystać na opracowanie zaawansowanych strategii szkoleniowych lub przeprowadzenie dodatkowych eksperymentów (Priestley i in., 2023).
- Luki w szkoleniu i edukacji Wiele organizacji sportowych nie ma odpowiedniego przeszkolenia w zakresie gromadzenia danych, zarządzania nimi i etyki. Bez tej podstawowej wiedzy zespoły mogą nieumyślnie wprowadzać błędy do zestawów danych, co stwarza dalsze wyzwania w skalowaniu rozwiązań AI (Zhou i in., 2018).
- Uogólnienie i reprezentatywność Modele trenowane na wąskich zestawach danych często mają trudności z uogólnianiem w różnych kontekstach. Na przykład model trenowany wyłącznie na pływakach elitarnych może mieć niewielką wartość dla sportowców młodych lub weteranów, co wymaga kosztownego gromadzenia danych i ponownego szkolenia (Priestley i in., 2023; Ranjan, 2023).
Niska jakość danych stwarza poważne wyzwania dla wdrażania sztucznej inteligencji w sporcie. Od pogorszonej wydajności modelu i ryzyka etycznego po opóźnienia operacyjne, te pułapki podkreślają potrzebę solidnych, dobrze udokumentowanych i bezpiecznych kanałów danych. Rozwiązując te wyzwania, organizacje mogą zapewnić, że trenerzy, naukowcy i personel pomocniczy mogą zaufać spostrzeżeniom sztucznej inteligencji — co ostatecznie prowadzi do lepszych strategii szkoleniowych i bardziej sprawiedliwych wyników.
Sekcja 3: Podstawowe podstawy zapewniania wysokiej jakości danych w sztucznej inteligencji/uczeniu maszynowym
Osiągnięcie wysokiej jakości danych nie jest przypadkiem — wymaga celowych strategii i skrupulatnych procesów. W sporcie, zwłaszcza w pływaniu, dane pochodzą z różnych źródeł, takich jak czasy okrążeń, liczba ruchów i wskaźniki fizjologiczne. Aby zapewnić, że modele AI dostarczają wiarygodnych spostrzeżeń, każdy punkt danych musi być dokładny, istotny i kontekstowo znaczący. Poniżej przedstawiono kluczowe filary wspierające skuteczne gromadzenie, zarządzanie i wykorzystywanie danych.
-
Wewnętrzna jakość danych Wewnętrzna jakość koncentruje się na zapewnieniu, że same dane są dokładne, spójne i kompletne. W pływaniu nawet niewielka niedokładność — taka jak błędnie zapisany czas okrążenia — może zniekształcić zalecenia treningowe i wpłynąć na wyniki sportowców. Aby osiągnąć wysoką wewnętrzną jakość, czujniki, takie jak podkładki pomiarowe czasu i urządzenia noszone na ciele, powinny być regularnie kalibrowane. Okresowe kontrole punktowe, takie jak porównywanie zautomatyzowanych danych z przeglądami wideo, pomagają potwierdzić dokładność kluczowych wskaźników. Zautomatyzowane systemy, które sygnalizują wartości odstające, takie jak częstość uderzeń przekraczająca limity fizyczne, są również krytyczne (Priestley i in., 2023; Ranjan, 2023). Te połączone środki zapewniają, że dane pozostają wiarygodne do analizy AI.
-
Jakość kontekstowa Jakość kontekstowa zapewnia, że dane są istotne, aktualne i odpowiednie do zamierzonego zadania AI. Na przykład dane treningowe zebrane z basenów o krótkim dystansie mogą nie mieć zastosowania do pływania na wodach otwartych, co sprawia, że segmentacja jest niezbędna. Aby zachować kontekstową istotność, zespoły powinny jasno określić cele gromadzenia danych, takie jak poprawa startów, zwrotów lub ogólnej wytrzymałości. Dane powinny być klasyfikowane na podstawie warunków, takich jak rozmiar basenu lub wysokość, aby zapewnić kontekstowo istotne spostrzeżenia. Ponadto, w miarę ewolucji potrzeb szkoleniowych, powinny ewoluować procesy gromadzenia danych, aby zachować ich zgodność z bieżącymi celami (Priestley i in., 2023; Zhou i in., 2018).
-
Jakość reprezentacyjna Jakość reprezentacyjna koncentruje się na spójnych i interpretowalnych formatach danych w zespołach i systemach. Bez standaryzacji dane dotyczące wydajności mogą zostać błędnie zinterpretowane — na przykład gdy różne zespoły oznaczają 50-metrowe okrążenie jako „50 Free” lub „FC_50”. Przyjęcie standardowych konwencji nazewnictwa i utrzymywanie wspólnego schematu danych w zespołach pomaga złagodzić te problemy. Zespoły powinny również używać metadanych do dokumentowania szczegółów dotyczących tego, kiedy i w jaki sposób dane zostały zebrane (Priestley i in., 2023). Te środki zapobiegają zamieszaniu i poprawiają współpracę między wewnętrznymi i zewnętrznymi interesariuszami.
-
Dostępność Dostępność zapewnia, że dane są dostępne dla upoważnionych użytkowników, jednocześnie chroniąc prywatność. Trenerzy, naukowcy sportowi i sportowcy często potrzebują dostępu w czasie rzeczywistym do danych o wynikach, aby dostosować trening. Bezpieczne systemy oparte na chmurze z kontrolą dostępu opartą na rolach mogą zapewnić dostęp bez narażania bezpieczeństwa. Ponadto przyjazne dla użytkownika pulpity nawigacyjne zaprojektowane dla użytkowników nietechnicznych umożliwiają szerszą dostępność. W przypadku poufnych danych sportowców należy egzekwować szyfrowanie, aby spełnić przepisy dotyczące prywatności (Zhou i in., 2018). Te środki pomagają zrównoważyć dostępność danych i prywatność, jednocześnie wspierając skuteczne podejmowanie decyzji.
-
Zarządzanie cyklem życia danych Zarządzanie cyklem życia danych nadzoruje dane od momentu ich zebrania do momentu ich przetworzenia, przechowywania, analizy i ostatecznego zarchiwizowania lub usunięcia. Kluczowa jest możliwość śledzenia — bez niej błędy mogą zostać wprowadzone do procesu AI niezauważone. Prowadzenie dokładnej dokumentacji, w tym szczegółów, takich jak daty zbierania i dzienniki kalibracji czujników, pomaga zachować integralność danych. Okresowe przeglądy są niezbędne do usuwania nieaktualnych lub nieistotnych danych przy jednoczesnym zachowaniu koncentracji na zestawach danych wysokiej jakości (Ranjan, 2023; Priestley i in., 2023). Strategie tworzenia kopii zapasowych i odzyskiwania po awarii dodatkowo zapewniają długoterminową niezawodność danych.
-
Zgodność z etyką i przepisami Zgodność z etyką i przepisami ma kluczowe znaczenie podczas przetwarzania danych wrażliwych, szczególnie w sportach, w których wykorzystywane są dane biometryczne i zdrowotne. Sportowcy ufają, że ich dane osobowe będą chronione i wykorzystywane w sposób odpowiedzialny. Aby podtrzymać to zaufanie, zespoły powinny anonimizować dane sportowców, gdy jest to możliwe, i upewnić się, że wykorzystanie danych jest zgodne z odpowiednimi przepisami, takimi jak RODO. Uzyskanie świadomej zgody od sportowców przed zebraniem i wykorzystaniem ich danych jest również niezbędne (Qayyum i in., 2020; Zhou i in., 2018). Nieprzestrzeganie tych wytycznych grozi konsekwencjami prawnymi i szkodą dla reputacji.
-
Ciągły monitoring i doskonalenie Ciągły monitoring zapewnia utrzymanie jakości danych w miarę ewolucji danych o wynikach. Programy pływackie często wprowadzają nowe wskaźniki i technologie, co sprawia, że bieżąca walidacja jest ważna. Zautomatyzowane skrypty walidacyjne mogą wykrywać anomalie, takie jak niezwykle krótkie lub długie czasy okrążeń, zanim wpłyną one na analizy. Okresowe audyty pomagają zachować kompletność i integralność, podczas gdy pętle sprzężenia zwrotnego obejmujące trenerów i sportowców umożliwiają szybkie rozwiązywanie rozbieżności (Bangari i in., 2024; Zhou i in., 2018). To proaktywne podejście pomaga utrzymać dynamiczny i niezawodny przepływ danych.
-
Integracja wiedzy domenowej Integracja wiedzy domenowej wykorzystuje wiedzę specjalistyczną trenerów, naukowców sportowych i sportowców w celu skutecznej interpretacji i walidacji danych. Anomalie, takie jak nagły wzrost tętna, mogą mieć proste wyjaśnienia, takie jak awarie czujników lub warunki środowiskowe. Eksperci domenowi potrafią odróżnić rzeczywiste problemy od błędów sprzętu, zapobiegając niepotrzebnym korektom modelu. Współpraca z trenerami nad protokołami gromadzenia danych i walidacja rekomendacji opartych na sztucznej inteligencji w odniesieniu do rzeczywistych doświadczeń zwiększa niezawodność generowanych spostrzeżeń (Ranjan, 2023). Ten iteracyjny proces zapewnia, że decyzje oparte na danych są zgodne z praktycznym doświadczeniem.
Koncentrując się na tych podstawowych fundamentach — jakości wewnętrznej i kontekstowej, spójności reprezentacyjnej, dostępności, zarządzaniu cyklem życia, zgodności, ciągłym monitorowaniu i wiedzy specjalistycznej w danej dziedzinie — organizacje mogą ustanowić wiarygodne kanały danych. W przypadku profesjonalistów pływania przekłada się to na lepsze programy treningowe, dokładne informacje zwrotne od sportowców, większe zaangażowanie, mniej kontuzji i lepsze wyniki w zawodach.
Podsumowanie
W tej pierwszej części zbadaliśmy podstawowe zasady jakości danych i pokazaliśmy, jak słabe dane mogą zniweczyć nawet najbardziej zaawansowane projekty AI. Niedokładne lub niekompletne zapisy nie tylko hamują innowacje — mogą również wprowadzać w błąd trenerów, sportowców i analityków. Ale jak te koncepcje mają się do obecnego krajobrazu danych w pływaniu?
W kolejnej części zagłębimy się w praktyczne realia zarządzania danymi z sesji treningowych pływania, podkreślając obszary, w których branża się wyróżnia i gdzie potrzebne są ulepszenia. Omówimy również możliwość stworzenia ujednoliconych ram zaprojektowanych w celu usprawnienia zarządzania danymi na wszystkich poziomach sportu. Na koniec odpowiemy na kluczowe pytanie: Czy dane dotyczące sprawności pływackiej i branży konkurencyjnej nadają się do AI? Bądź na bieżąco, aby przyjrzeć się bliżej temu, jak możemy wykorzystać AI, aby uzyskać lepsze wyniki dla pływaków na każdym poziomie.
Odniesienia:
Priestley, Maria & O’Donnell, Fionntán & Simperl, Elena. (2023). A Survey of Data Quality Requirements That Matter in ML Development Pipelines. Journal of Data and Information Quality. 15. 10.1145/3592616.
Bangad, Nikhil & Jayaram, Vivekananda & Sughaturu Krishnappa, Manjunatha & Banarse, Amey & Bidkar, Darshan & Nagpal, Akshay & Parlapalli, Vidyasagar. (2024). A Theoretical Framework For Ai-Driven Data Quality Monitoring In High-Volume Data Environments. INTERNATIONAL JOURNAL OF COMPUTER ENGINEERING & TECHNOLOGY. 15. 618-636. 10.5281/zenodo.13878755.
Zhou, Yuhan & Tu, Fengjiao & Sha, Kewei & Ding, Junhua & Chen, Haihua. (2024). A Survey on Data Quality Dimensions and Tools for Machine Learning Invited Paper. 120-131. 10.1109/AITest62860.2024.00023.
Polyzotis, Neoklis & Roy, Sudip & Whang, Steven & Zinkevich, Martin. (2018). Data Lifecycle Challenges in Production Machine Learning: A Survey. ACM SIGMOD Record. 47. 17-28. 10.1145/3299887.3299891.
Qayyum, Adnan & Qadir, Junaid & Bilal, Muhammad & Al-Fuqaha, Ala. (2020). Secure and Robust Machine Learning for Healthcare: A Survey. IEEE Reviews in Biomedical Engineering. PP. 1-1. 10.1109/RBME.2020.3013489.
Neutatz, Felix & Chen, Binger & Abedjan, Ziawasch & Wu, Eugene. (2021). From Cleaning before ML to Cleaning for ML.
Sambasivan, Nithya & Kapania, Shivani & Highfill, Hannah & Akrong, Diana & Paritosh, Praveen & Aroyo, Lora. (2021). “Everyone wants to do the model work, not the data work”: Data Cascades in High-Stakes AI. 1-15. 10.1145/3411764.3445518.
Roh, Yuji & Heo, Geon & Whang, Steven. (2019). A Survey on Data Collection for Machine Learning: A Big Data - AI Integration Perspective. IEEE Transactions on Knowledge and Data Engineering. PP. 1-1. 10.1109/TKDE.2019.2946162.
Whang, Steven & Roh, Yuji & Song, Hwanjun & Lee, Jae-Gil. (2023). Data collection and quality challenges in deep learning: a data-centric AI perspective. The VLDB Journal. 32. 10.1007/s00778-022-00775-9.
Rangineni, Sandeep. (2023). An Analysis of Data Quality Requirements for Machine Learning Development Pipelines Frameworks. International Journal of Computer Trends and Technology. 71. 16-27. 10.14445/22312803/IJCTT-V71I8P103.