Галерея диаграмм связей Топ-10 алгоритмов искусственного интеллекта
Для многих людей искусственный интеллект по-прежнему остается относительно «продвинутой» технологией, но какой бы продвинутой она ни была, она начинается с базовых принципов. В области искусственного интеллекта циркулируют 10 основных алгоритмов. Их принципы просты, они были открыты и применены очень рано. Возможно, вы даже изучили их в средней школе, и они очень распространены в жизни. В этой статье вы познакомитесь с этими 10 алгоритмами с точки зрения непрофессионала.
Отредактировано в 2023-05-29 19:40:10A segunda unidade do Curso Obrigatório de Biologia resumiu e organizou os pontos de conhecimento, abrangendo todos os conteúdos básicos, o que é muito conveniente para todos aprenderem. Adequado para revisão e visualização de exames para melhorar a eficiência do aprendizado. Apresse-se e colete-o para aprender juntos!
Este é um mapa mental sobre Extração e corrosão de mim. O conteúdo principal inclui: Corrosão de metais, Extração de metais e a série de reatividade.
Este é um mapa mental sobre Reatividade de metais. O conteúdo principal inclui: Reações de deslocamento de metais, A série de reatividade de metais.
A segunda unidade do Curso Obrigatório de Biologia resumiu e organizou os pontos de conhecimento, abrangendo todos os conteúdos básicos, o que é muito conveniente para todos aprenderem. Adequado para revisão e visualização de exames para melhorar a eficiência do aprendizado. Apresse-se e colete-o para aprender juntos!
Este é um mapa mental sobre Extração e corrosão de mim. O conteúdo principal inclui: Corrosão de metais, Extração de metais e a série de reatividade.
Este é um mapa mental sobre Reatividade de metais. O conteúdo principal inclui: Reações de deslocamento de metais, A série de reatividade de metais.
Топ-10 алгоритмов искусственного интеллекта
1. Линейная регрессия
определение
(Линейная регрессия), вероятно, самый популярный алгоритм машинного обучения. Линейная регрессия заключается в том, чтобы найти прямую линию и сделать так, чтобы эта прямая линия как можно ближе соответствовала точкам данных на диаграмме рассеяния. Он пытается представить независимые переменные (значения x) и числовые результаты (значения y) путем подгонки к этим данным уравнения прямой линии. Эту линию затем можно использовать для прогнозирования будущих значений!
Наиболее часто используемым методом для этого алгоритма является метод наименьших квадратов. Этот метод вычисляет линию наилучшего соответствия, которая минимизирует перпендикулярное расстояние от каждой точки данных на линии. Общее расстояние представляет собой сумму квадратов вертикальных расстояний (зеленая линия) всех точек данных. Идея состоит в том, чтобы соответствовать модели, минимизируя эту квадратичную ошибку или расстояние.
Например, простая линейная регрессия, имеющая одну независимую переменную (ось X) и одну зависимую переменную (ось Y).
Общие приложения
Например, спрогнозируйте рост цен на жилье в следующем году, продажи новых продуктов в следующем квартале и т. д. Это не звучит сложно, но сложность алгоритма линейной регрессии заключается не в получении прогнозируемого значения, а в том, чтобы быть более точным. Для этого, возможно, очень небольшого числа, сколько инженеров потратили на это свою молодость и волосы.
2. Логистическая регрессия
определение
Логистическая регрессия похожа на линейную регрессию, но результат логистической регрессии может иметь только два значения. Если линейная регрессия прогнозирует открытое значение, логистическая регрессия больше похожа на ответ на вопрос «да» или «нет».
Значение Y в логистической функции находится в диапазоне от 0 до 1 и является значением вероятности. Логистические функции обычно имеют S-образную кривую, которая делит график на две области, что делает их пригодными для задач классификации.
Например, приведенный выше график логистической регрессии показывает взаимосвязь между вероятностью сдачи экзамена и временем обучения и может использоваться для прогнозирования того, сможете ли вы сдать экзамен.
Общие приложения
Логистическая регрессия часто используется платформами электронной коммерции или платформами на вынос для прогнозирования покупательских предпочтений пользователей по категориям.
3. Дерево решений
определение
Выше приведена иллюстрация дерева решений, в котором каждый разветвленный круг называется узлом.
На каждом узле мы задаем вопросы о данных на основе доступных функций. Левая и правая ветви представляют возможные ответы. Последний узел (т. е. листовой узел) соответствует прогнозируемому значению.
Важность каждой функции определяется нисходящим подходом. Чем выше узел, тем важнее его свойства. Например, учитель в приведенном выше примере считает, что посещаемость важнее домашней работы, поэтому узел посещаемости выше и, конечно же, узел оценок выше.
Если линейная и логистическая регрессия завершают задачу за один раунд, то деревья решений (Decision Trees) представляют собой многоэтапное действие. Они также используются в задачах регрессии и классификации, но сценарии обычно более сложные и специфичные.
Общие приложения
Приведем простой пример: когда учитель сталкивается с учениками в классе, кто такие хорошие ученики? Кажется слишком грубым просто судить о том, что студент, набравший на экзамене 90 баллов, считается хорошим учеником и не может основываться только на баллах. Для учащихся, набравших менее 90 баллов, мы можем обсудить их отдельно от таких аспектов, как домашнее задание, посещаемость и вопросы.
4. Наивный Байес
определение
Наивный Байес основан на теореме Байеса, которая представляет собой связь между двумя условиями. Он измеряет вероятность каждого класса, условную вероятность каждого класса с учетом значения x. Этот алгоритм используется в задачах классификации и дает двоичный результат «да/нет». Взгляните на уравнение ниже.
Общие приложения
Наивный байесовский классификатор — это популярный статистический метод, который классически применяется для фильтрации спама.
Нетерминологическое объяснение теоремы Байеса означает использование вероятности возникновения B при условии A для получения вероятности возникновения A при условии B. Например, если вы нравитесь котенку, существует % вероятность того, что он повернется перед вами животом. Какова вероятность того, что вы понравитесь котенку, если он повернет живот перед вами? Конечно, ответить на этот вопрос равносильно тому, чтобы поцарапать поверхность, поэтому нам также необходимо ввести другие данные. Например, если вы нравитесь котенку, существует вероятность b% прилипнуть к вам и вероятность мурлыкания c%. Так как же нам узнать вероятность того, что мы понравимся котенку? С помощью теоремы Байеса мы можем вычислить ее, исходя из вероятности поворота живота, прилипания и мурлыканья.
5. Машина опорных векторов
определение
Машина опорных векторов (SVM) — это контролируемый алгоритм для решения задач классификации. Машина опорных векторов пытается нарисовать две линии между точками данных с наибольшим запасом между ними. Для этого мы отображаем элементы данных в виде точек в n-мерном пространстве, где n — количество входных объектов. На этой основе машина опорных векторов находит оптимальную границу, называемую гиперплоскостью, которая лучше всего разделяет возможные выходные данные по меткам классов. Расстояние между гиперплоскостью и ближайшей точкой класса называется границей. Оптимальная гиперплоскость имеет наибольший запас, который классифицирует точки так, что расстояние между ближайшей точкой данных и двумя классами максимально.
Общие приложения
Таким образом, проблема, которую хотят решить поддерживающие векторные машины, заключается в том, как разделить кучу данных. Основные сценарии применения включают распознавание символов, распознавание лиц, классификацию текста и другие виды распознавания.
6.K-Алгоритм ближайшего соседа (KNN)
определение
Алгоритм K-ближайших соседей (KNN) очень прост. KNN классифицирует объекты, просматривая во всем обучающем наборе K наиболее похожих экземпляров или K соседей и присваивая общую выходную переменную всем этим K экземплярам.
Выбор K имеет решающее значение: меньшие значения могут дать много шума и неточные результаты, тогда как большие значения невозможны. Чаще всего он используется для классификации, но также подходит для задач регрессии.
Расстояние, используемое для оценки сходства между экземплярами, может быть Евклидовым расстоянием, Манхэттенским расстоянием или расстоянием Минковского. Евклидово расстояние — это обычное расстояние по прямой между двумя точками. На самом деле это квадратный корень из суммы квадратов разности координат точек.
Общие приложения
Теория KNN проста и легка в реализации и может использоваться для классификации текста, распознавания образов, кластерного анализа и т. д.
7.K-среднее
определение
K-средства кластеризуют набор данных, классифицируя его. Например, этот алгоритм можно использовать для группировки пользователей на основе истории покупок. Он находит K кластеров в наборе данных. K-средние используются для обучения без учителя, поэтому нам нужно использовать только обучающие данные X и количество кластеров, которые мы хотим идентифицировать K.
Алгоритм итеративно присваивает каждую точку данных одной из K групп на основе ее характеристик. Он выбирает K точек для каждого K-кластера (называемых центроидами). На основе сходства новые точки данных добавляются в кластер с ближайшим центроидом. Этот процесс продолжается до тех пор, пока центр масс не перестанет меняться.
Общие приложения
В жизни K-средства играют важную роль в обнаружении мошенничества и широко используются в области автомобильного, медицинского страхования и обнаружения мошенничества в сфере страхования.
8. Случайный лес
определение
Случайный лес — очень популярный алгоритм ансамблевого машинного обучения. Основная идея этого алгоритма заключается в том, что мнения многих людей более точны, чем мнения одного человека. В случайном лесу мы используем ансамбль деревьев решений (см. Деревья решений).
(a) В процессе обучения каждое дерево решений строится на основе бутстреп-выборок из обучающего набора.
(b) Во время классификации решения по входным экземплярам принимаются большинством голосов.
Общие приложения
Случайный лес имеет широкий спектр перспектив применения: от маркетинга до медицинского страхования. Его можно использовать для моделирования маркетинговых симуляций, подсчета источников клиентов, удержания и потерь, а также для прогнозирования рисков заболеваний и восприимчивости пациентов.
9. Уменьшение размерности
Проблемы машинного обучения стали более сложными из-за огромного объема данных, которые мы можем собрать сегодня. Это означает, что обучение идет крайне медленно и найти хорошее решение сложно. Эту проблему часто называют «проклятием размерности».
Снижение размерности пытается решить эту проблему путем объединения определенных функций в функции более высокого уровня без потери наиболее важной информации. Анализ главных компонентов (PCA) — самый популярный метод уменьшения размерности.
Анализ главных компонентов уменьшает размерность набора данных, сжимая его в низкоразмерные линии или гиперплоскости/подпространства. При этом сохраняется как можно больше существенных особенностей исходных данных.
Пример уменьшения размерности может быть достигнут путем аппроксимации всех точек данных к прямой линии.
10. Искусственная нейронная сеть (ИНС).
определение
Искусственные нейронные сети (ИНС) могут решать большие и сложные задачи машинного обучения. Нейронная сеть, по сути, представляет собой набор взаимосвязанных слоев, состоящих из взвешенных ребер и узлов, называемых нейронами. Между входным и выходным слоями мы можем вставить несколько скрытых слоев. Искусственные нейронные сети используют два скрытых слоя. Помимо этого, необходимо заняться глубоким обучением.
Искусственные нейронные сети работают аналогично структуре мозга. Группе нейронов присваивается случайный вес, определяющий, как нейрон обрабатывает входные данные. Взаимосвязь между входными и выходными данными изучается путем обучения нейронной сети на входных данных. На этапе обучения системе доступны правильные ответы.
Если сеть неточно распознает входные данные, система корректирует веса. После достаточного обучения он будет последовательно распознавать правильные шаблоны.
Каждый круглый узел представляет собой искусственный нейрон, а стрелки обозначают соединения выхода одного искусственного нейрона со входом другого.
Общие приложения
Распознавание изображений — широко известное применение нейронных сетей.