Pouvez-vous exécuter un projet d’apprentissage automatique à la maison?
Avec tous les discours sur l'apprentissage automatique ces dernières années, il est difficile d'ignorer le désir de l'essayer par vous-même. La technologie semble évoluer à un rythme très rapide et elle trouve déjà des applications dans de nombreux environnements. Si vous avez des compétences en programmation et une compréhension de base de certains concepts relatifs aux statistiques, vous êtes prêt à partir en termes de compétences requises.
Cependant, vous devrez également prendre en compte le matériel dont vous aurez besoin pour cela. Vous pouvez tout héberger chez vous ou utiliser des services à distance – les deux ont leurs avantages et leurs inconvénients.
Exigences de base pour le développement de l'apprentissage automatique
Vous allez avoir besoin d'un matériel relativement puissant pour faire avancer les choses. Bien que vous puissiez exécuter la plupart des outils connexes sur un ordinateur portable bon marché, votre potentiel d'apprentissage sera considérablement limité et tout prendra beaucoup plus de temps que nécessaire.
Votre GPU (Graphics Processing Unit) est le composant le plus important ici. Cela n'a rien à voir avec les graphiques directement. C'est juste que les GPU sont mieux adaptés aux types de calculs sur lesquels repose l'apprentissage automatique.
Un GPU prenant en charge CUDA sera encore meilleur ici, bien qu'il vous en coûtera plus cher pour en mettre la main. Ne vous inquiétez pas si vous ne pouvez pas vous permettre ce type de matériel pour le moment. Vous pouvez également exécuter vos solutions à distance, même si vous devrez gérer les hauts et les bas de cette configuration.
Pourquoi vos coûts pourraient être plus élevés en 2021
Il convient également de noter que l'achat de nouveau matériel pour l'apprentissage automatique peut être encore plus difficile à l'heure actuelle. Il existe une situation mondiale délicate qui se développe autour d'une pénurie de semi-conducteurs utilisés dans la fabrication de divers produits électroniques grand public. Des GPU aux smartphones et autres appareils, de nombreux marchés ont été touchés.
Certaines prévisions affirment que cette pénurie pourrait durer encore plusieurs années, car elle était le résultat de plusieurs facteurs s'alignant de manière inattendue. Entre la pandémie affectant les capacités de production et l'augmentation de la demande, et les mineurs et les scalpeurs rachetant tout le stock, la situation a été difficile pour ceux qui veulent simplement obtenir un nouveau GPU.
On ne sait pas non plus quand les prix vont se normaliser – les prix pourraient continuer à grimper. La recherche d'un GPU d'occasion pourrait être une meilleure option, même si vous ne pouvez pas garantir que vous trouverez quelque chose qui vous convient.
Avantages et inconvénients des plates-formes hébergées
Une plate-forme hébergée pour le développement de l'apprentissage automatique vous permettra de vous concentrer sur le travail de développement réel sans vous soucier des considérations matérielles. Vous bénéficierez d'une puissance de traitement avancée, et ces plates-formes peuvent généralement exécuter vos solutions beaucoup plus rapidement que tout ce que vous pourriez créer chez vous.
Bien sûr, ce type de pouvoir n'est pas gratuit. Vous devrez payer des frais d'abonnement pour utiliser la plupart de ces services. Ceux qui sont offerts gratuitement ont leurs propres limitations.
Par exemple, vous ne pourrez peut-être pas exécuter votre programme à la demande et devrez peut-être attendre dans une file d'attente. Cela peut être particulièrement problématique pour les sessions de formation plus longues, où vous devrez ajouter quelques heures supplémentaires en plus d'une période d'attente déjà longue.
Et puis, certaines personnes se sentent plus à l'aise dans leur travail quand tout est disponible localement. Il peut certainement être plus pratique de travailler avec l'apprentissage automatique de cette manière lorsque certains modèles peuvent mesurer plusieurs gigaoctets et que leur transfert vers et depuis les serveurs appropriés peut prendre un certain temps.
Le meilleur des deux mondes
Vous pouvez utiliser une approche mixte. Effectuez la majeure partie de votre développement localement – comme le travail réel sur vos algorithmes et modèles – et utilisez un service hébergé pour des traitements importants et coûteux.
Vous pouvez généralement soumettre vos données par lots pour les faire traiter en une seule fois sur une période de temps, et il vous suffit de revenir pour récupérer vos résultats par la suite. Cela peut bien fonctionner lorsque vous n'avez pas besoin de résultats immédiats, et cela peut vous permettre d'effectuer une formation coûteuse à un coût relativement faible.
C'est l'approche que la plupart des gens adoptent ces jours-ci. Si vous ne voulez pas dépenser trop en matériel, mais que vous êtes d'accord avec l'idée de dépenser de l'argent pour cela en premier lieu, c'est probablement ce à quoi vous devriez vous pencher.
Il existe différentes offres sur le marché, certaines s'adressant aux personnes à petit budget, alors jetez un œil et voyez ce qui est disponible sur le marché. Parfois, vous pouvez vous en sortir en hébergeant vos projets pour étonnamment peu, tant qu'ils n'ont pas d'exigences complexes.
Soyez prudent avec les données sensibles
N'oubliez pas que l'apprentissage automatique peut souvent impliquer de travailler avec des données sensibles. Par exemple, vous pouvez être chargé de traiter les dossiers médicaux ou d'autres informations personnelles. Il va sans dire que vous devez être beaucoup plus prudent dans ces situations si vous travaillez avec des services hébergés à distance.
Vous devez être conscient des implications de la transmission de ces données à des serveurs distants. Parfois, vous pourriez vous retrouver en violation de certains cadres juridiques sans même vous en rendre compte. Dans l'Union européenne par exemple, il faut être très prudent avec le RGPD.
C'est une bonne idée de consulter un juriste si vos exercices d'apprentissage automatique vont impliquer n'importe quel type de données sensibles. Mieux encore, vous ne devriez probablement pas utiliser ce type de données pour vos premiers projets de formation. Choisissez simplement quelque chose de plus sûr et de plus facile à manipuler.
Apprentissage automatique par vous-même
L'apprentissage automatique à domicile est faisable et présente de nombreux avantages. Mais cela a également des implications négatives dont vous devez tenir compte et vous devez vous assurer de trouver une approche équilibrée à la fin. Portez une attention particulière aux détails tels que le travail avec des données sensibles, et familiarisez-vous toujours avec les exigences légales que votre situation pourrait vous imposer.
En fin de compte, cela peut être une expérience très amusante et productive qui peut vous mettre dans une excellente position sur le marché du travail.