Python

Общие ссылки Python

Преимущества Python

Краткий и простой в освоении синтаксис

Синтаксис Python прост и близок к естественному языку. Даже начинающие программисты могут быстро приступить к работе, снизив порог обучения.

Богатая стандартная библиотека и сторонние ресурсы.

Python предоставляет широкий спектр стандартных библиотек функций, охватывающих многие аспекты, такие как работа в сети, обработка данных и графические интерфейсы. Кроме того, мощная сторонняя экосистема, такая как NumPy, Pandas и TensorFlow, делает Python универсальным инструментом разработки.

Кроссплатформенные функции

Python — кроссплатформенный язык. Будь то Windows, macOS или Linux, можно выполнить одну и ту же программу Python, что значительно повышает гибкость разработки.

Широко используется во многих областях

Python играет важную роль во многих областях, таких как наука о данных, искусственный интеллект, веб-разработка, создание сценариев автоматизации, разработка игр и т. д., позволяя разработчикам решать множество задач с помощью одного языка.

Активная поддержка сообщества

Python имеет большое глобальное сообщество, и как новички, так и опытные разработчики могут легко найти образовательные ресурсы, дискуссионные группы и техническую поддержку.

Эффективная скорость разработки

Python предоставляет интуитивно понятный синтаксис и мощные инструменты, позволяющие разработчикам быстрее реализовывать программирование и сокращать цикл разработки продукта.

Среда разработки Python

Anaconda

Что такое Анаконда?

Anaconda — это платформа программирования на Python и R с открытым исходным кодом, предназначенная для научных вычислений, включая такие приложения, как обработка данных, машинное обучение, искусственный интеллект и анализ больших данных.

Основные функции

Интегрированная среда: предоставляет простые в использовании интегрированные среды разработки (IDE), такие как Jupyter Notebook и Spyder.
Управление пакетами: легко устанавливайте, обновляйте и управляйте тысячами библиотек с открытым исходным кодом с помощью инструмента управления Conda.
Кроссплатформенная поддержка: поддерживает Windows, macOS и Linux.
Визуализация данных. Существует множество встроенных инструментов, помогающих визуализировать данные, например Matplotlib и Seaborn.

Подходит для объектов

Anaconda подходит для пользователей в следующих сферах:

специалист по данным
Инженер по машинному обучению
исследователь искусственного интеллекта
Профессионалы, которым необходимо выполнять анализ больших данных

Как установить Анаконду?

доступОфициальный сайт Анаконды。
Выберите подходящую версию операционной системы и загрузите соответствующий установочный файл.
Следуйте инструкциям мастера установки, чтобы завершить установку и настроить переменные среды (необязательно).

Часто задаваемые вопросы

Ниже приведены проблемы, с которыми часто сталкиваются пользователи:

Как обновить Анаконду?

Можно ввести в терминалеconda update condaиconda update anaconda。

В чем разница между Анакондой и Python?

Anaconda — это платформа для обработки данных, которая интегрирует язык программирования Python с множеством встроенных инструментов и библиотек.

Окружающая среда Анаконды

Что такое среда Анаконды

Anaconda предоставляет функцию виртуальной среды (Environment), которая позволяет пользователям создавать несколько независимых сред выполнения Python на одном компьютере. Каждая среда может иметь разные версии и пакеты Python, чтобы избежать конфликтов зависимостей между разными проектами.

Создать среду

# Создайте среду с именем myenv и укажите версию Python
conda create -n myenv python=3.10

Запуск и переключение сред

# Стартовая среда
Конда активирует myenv

#Выходим из окружения
Конда деактивировать

Посмотреть среду

# Список всех сред
список окружения Конды
# или
информация конды --envs

Экспорт и восстановление сред

# Экспорт конфигурации среды в файл YAML
экспорт env conda > Environment.yml

# Создать среду из файла YAML
conda env create -f Environment.yml

Удалить среду

# Удалить указанную среду
conda удалить -n myenv --all

Jupyter

Что такое Юпитер?

Jupyter — это интерактивная вычислительная среда с открытым исходным кодом, которая поддерживает несколько языков программирования и в основном используется для анализа данных, машинного обучения и академических исследований.

Jupyter

Основные функции

Многоязычная поддержка: включая Python, R, Julia и более 40 языков.
Интерактивное программирование: пишите программы с помощью Jupyter Notebook, выполняйте код и просматривайте результаты в реальном времени.
Визуализация данных: встроенная поддержка графических инструментов, таких как Matplotlib, Plotly и т. д.
Возможности совместного использования: блокноты можно экспортировать в HTML, PDF или поделиться ими через Jupyter Hub.

Основные компоненты

Jupyter Notebook：Веб-редактор, который позволяет пользователям писать и запускать код.
JupyterLab：Пользовательский интерфейс нового поколения, обеспечивающий большую функциональность и масштабируемость.
Jupyter Hub：Многопользовательская платформа Jupyter для команд или академических учреждений.

Область применения

Jupyter широко используется в следующих областях:

Наука о данных и аналитика
Разработка моделей машинного обучения и глубокого обучения
Академические исследования и образование
Визуализация данных и отчетность

Как использовать Юпитер?

Установите Anaconda или установите Jupyter автономно.
Войдите в терминалjupyter notebookЗапустите блокнот Jupyter.
Войдите в интерфейс редактирования через браузер, чтобы создавать и запускать блокноты.

Преимущества и проблемы

Преимущества:Выполнение в реальном времени, визуализация результатов и многоязычная поддержка.
испытание:Поддержка крупных проектов ограничена, а эффективность выполнения может быть не такой хорошей, как в традиционных IDE.

Среда разработки VS Code Python

Установить код Visual Studio

Перейти кОфициальный сайт кода Visual Studio, загрузите и установите версию, подходящую для вашей операционной системы.

Установите расширение Python

В Visual Studio Code установите расширение Python, выполнив следующие действия:

Нажмите значок расширения слева.
Найдите «Питон».
Выберите расширение Python, предоставленное Microsoft, и нажмите «Установить».

Установить Python

Убедитесь, что Python установлен в вашей системе. Можно получить изОфициальный сайт PythonЗагрузите и установите.

После завершения установки введите следующую команду в командной строке, чтобы подтвердить успешность установки:

питон --версия
# или
python3 --версия

Настройка интерпретатора Python

Откройте проект или файл Python, щелкните строку состояния «Python» в правом нижнем углу кода Visual Studio и выберите соответствующий интерпретатор Python.

Выполнить программу Python

Откройте файл Python в редакторе и запустите программу, используя следующий метод:

Щелкните правой кнопкой мыши содержимое файла и выберите «Запустить файл Python в терминале».
Или используйте сочетания клавишCtrl + Shift + P, найдите «Запустить файл Python» и выполните его.

Установите необходимые пакеты

Если вам необходимо установить сторонний пакет, вы можете использовать встроенный терминал для ввода:

имя пакета установки pip

Включить автозаполнение и отладку

Наслаждайтесь автозаполнением и мощными инструментами отладки благодаря функциональности, предоставляемой расширениями Python:

Нажмите значок отладки слева.
Выберите «Создать файл launch.json» и выберите Python.
После завершения настроек нажмите F5, чтобы включить режим отладки.

Часто используемые сочетания клавиш

Вот некоторые часто используемые сочетания клавиш:

Программа выполнения: Ctrl + F5
Откройте командную панель: Ctrl + Shift + P
Код форматирования: Shift + Alt + F
Запустите терминал: Ctrl + `

VS Code

vscode/Vidual Studio Code

VS Code устанавливает параметры выполнения Python

Изменить файл запуска.json

Если вам нужно передать параметры при выполнении программы Python, вы можете установитьlaunch.jsonЗаканчивать:

Нажмите значок «Запуск и отладка» слева.
Нажмите «Создать файл launch.json» или «Добавить конфигурацию».
Выберите «Python» в качестве среды.
в сгенерированныхlaunch.jsonИзмените соответствующие настройки в файле.

Установите параметры программы и аргументов

Ниже приведен пример конфигурации, включая путь к программе и параметры выполнения:

{
    "версия": "0.2.0",
    "конфигурации": [
        {
            "name": "Python: запуск с аргументами",
            "тип": "питон",
            "запрос": "запуск",
            "program": "${workspaceFolder}/main.py", // путь к программе
            "console": "integratedTerminal", // тип терминала
            "args": ["arg1", "arg2", "--option", "value"] // Передаем параметры
        }
    ]
}

Цель аргументов

существоватьargsПараметры командной строки могут быть переданы, например:

arg1иarg2является позиционным параметром.
--optionиvalueэто параметр с опциями.

Чтение параметров в программе

использоватьsys.argvЧтобы прочитать параметры, переданные из командной строки:

импортсистем

print("Все параметры:", sys.argv)
если len(sys.argv) > 1:
    print("Первый параметр:", sys.argv[1])
    print("Второй параметр:", sys.argv[2])

Пример выполнения

Предположим, что программа:

python main.py arg1 arg2 --option value

Результат выполнения:

Все параметры: ['main.py', 'arg1', 'arg2', '--option', 'value']
Первый параметр: arg1
Второй параметр: arg2

Режим отладки VS Code Python

Включить режим отладки

1. УстановкаPython ExtensionРасширение.

2. Запустите проект Python в VS Code.

3. НажмитеF5Или нажмите на панель действий слева.Debugикона.

Настройка launch.json

1. Нажмите «Добавить конфигурацию» на панели «Отладка».

2. ВыберитеPython, система автоматически создастlaunch.json。

{
    "version": "0.2.0",
    "configurations": [
        {
            "name": "Python: Current File",
            "type": "python",
            "request": "launch",
            "program": "${file}",
            "console": "integratedTerminal"
        }
    ]
}

Установить точку останова

1. Нажмите рядом с номером строки кода, чтобы добавить точку останова.

2. Можно использовать условные точки останова: щелкните точку останова правой кнопкой мыши и выберите «Редактировать условие».

Функция отладки

Шаг за пределы:в соответствии сF10Функция пропуска.
Шаг в:в соответствии сF11Войдите внутрь функции.
Выйти:в соответствии сShift+F11Выйти из функции.

Проверьте переменные

1. Просмотрите текущий статус переменной в области «Переменные» панели «Отладка».

2. Вы можете вручную добавить определенные выражения в область «Мониторинг».

Использование консоли отладки

1. Введите команды Python в консоли отладки, чтобы проверить состояние программы в режиме реального времени.

2. Может выполнять такие операции, как запрос переменных и вызов функций.

VS Code устанавливает путь Python

Шаг 1. Установите Python и VS Code

Убедитесь, что Python установлен и добавлен в переменные среды вашей системы, затем загрузите и установите Visual Studio Code.

Шаг 2. Установите расширение Python

Откройте код Visual Studio, щелкните значок «Расширения» слева и выполните поиск.Python, а затем установите расширения Python, предоставленные Microsoft.

Шаг 3. Проверьте путь установки Python.

Введите следующую команду в терминале, чтобы подтвердить путь установки Python:

which python

Или (система Windows):

where python

Шаг 4. Установите путь Python

В коде Visual Studio нажмитеCtrl + Shift + P, введите и выберитеPython: Select Interpreter。

Выберите правильный путь Python в манифесте. Если он не отображается, введите полный путь вручную.

Шаг 5. Подтвердите настройки.

Откройте терминал и выполнитеpython --versionчтобы подтвердить, что выбрана правильная версия интерпретатора Python.

Дополнительная информация

Если вам нужен путь Python к конкретному проекту, вы можете добавить его в корневой каталог проекта..vscode/settings.jsonфайл и добавьте следующий контент:

{
  "python.pythonPath": "Ваш полный путь к Python"
}

заменятьПолный путь к вашему Pythonэто реальный путь.

Переключение среды VS Code Python

При разработке в VS Code я решаю использовать Anaconda или другие среды, в основном через настройки базового интерпретатора (Интерпретатора). Это гарантирует полную изоляцию зависимостей вашего пакета от среды выполнения программы.

1. Шаги по выбору среды Python

Нажмите на имя среды в правом нижнем углу:В правом нижнем углу окна VS Code вы увидите текст, похожий на Python 3.xx или имя среды. Нажмите непосредственно, чтобы открыть меню.
Используйте палитру команд:нажиматьCtrl + Shift + P(Окна) илиCmd + Shift + P(Mac), введите и выберитеPython: Select Interpreter。
Выберите целевую среду в списке:
- Чтобы использовать Anaconda, выберите опцию с надписьюCondaПуть слов.
- Чтобы использовать стандартную виртуальную среду, выберите параметр с надписьюVenvпроект.

2. Как решить использовать Anaconda или другие среды

тип среды	Применимые ситуации	Основные преимущества
Anaconda	Наука о данных, машинное обучение, глубокое обучение	Он предварительно установлен с большим количеством библиотек научных вычислений и обеспечивает надежное управление базовыми двоичными файлами (такими как DLL).
Venv	Общая веб-разработка, скрипты автоматизации	Легкий, быстро запускается и содержит только необходимые для выполнения пакеты.

3. Управление средами и их переключение в Conda.

Помимо графического интерфейса, для управления средой вы также можете использовать команды встроенного терминала VS Code:

Посмотреть все среды: conda env list
Вручную активируйте среду: Conda активирует имя среды
Создайте новую среду: conda create -n имя python=3.10

4. Часто задаваемые вопросы и решения

Среда Conda не найдена:Если список не отображается, подтвердите, добавила ли Anaconda переменные системной среды, или нажмите «Ввести путь к интерпретатору», чтобы вручную указатьpython.exeпуть.
Терминал не активируется автоматически:Искать в настройках VS Codepython.terminal.activateEnvironmentи убедитесь, что эта опция отмечена.
Ошибка разрешения:Если вы не можете включить Windows, запустите VS Code от имени администратора или выполните его в PowerShell.Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser。

Запустите Python на своем Chromebook

Способ 1: использование Linux (Кростини)

Включите «Linux (бета)» или «Разработчик → Среда разработки Linux» в настройках Chromebook.

Запустите терминал Linux и введите:


sudo apt update
sudo apt install python3 python3-pip -y

входитьpython3Войдите в интерактивную среду Python.
Для установки дополнительных модулей доступныимя модуля установки pip3。

Способ 2. Используйте онлайн-компилятор.

Онлайн-компиляторы Python можно использовать непосредственно через браузер, например:
- Google Colab
- Replit
- Jupyter Notebook on Binder
Подходит для сред, которые не требуют установки, или для временного тестирования кода.

Способ 3. Установите приложение для Android.

Chromebook поддерживает установку приложений Android, которые можно загрузить через Google Play:
- Pydroid 3: Полноценная среда разработки Python.
- QPython:Легкий инструмент для написания сценариев Python.

Способ 4: используйте код VS

Установите VS Code в среде Linux (Crostini):


sudo apt install wget gpg -y
wget -qO- https://packages.microsoft.com/keys/microsoft.asc | gpg --dearmor > packages.microsoft.gpg
sudo install -o root -g root -m 644 packages.microsoft.gpg /usr/share/keyrings/
sudo sh -c 'echo "deb [arch=amd64 signed-by=/usr/share/keyrings/packages.microsoft.gpg] \
https://packages.microsoft.com/repos/code stable main" > /etc/apt/sources.list.d/vscode.list'
sudo apt update
sudo apt install code -y

Установите плагин Python в VS Code для разработки программ.

в заключение

Самый быстрый способ — использоватьLinux (Crostini)Установите Питон.
Если вы не хотите нарушать работу системы, вы можете выбратьонлайн-средаилиAndroid App。
Расширенные предложения по развитиюVS CodeилиJupyter Notebook。

руководство по использованию пипа

1. Что такое пип?

определение:pip — это инструмент управления пакетами Python, его полное название — «Pip Installs Packages».
использовать:Пакет для установки, обновления, удаления и управления Python.
источник:pip загрузит пакеты из официальной библиотеки пакетов Python PyPI (индекс пакетов Python).

2. Основные операции pip

Проверьте версию:
```
pip --version
```
Установочный комплект:
```
имя пакета установки pip
```
Например:pip install requests
Комплект обновления:
```
pip install --upgrade имя пакета
```
Например:pip install --upgrade requests
Список установленных пакетов:
```
pip list
```
Удалите пакет:
```
имя пакета удаления pip
```
Например:pip uninstall requests
Проверьте пакеты с истекшим сроком действия:
```
pip list --outdated
```

3. Расширенные функции

Установите конкретную версию:
```
имя пакета установки pip == номер версии
```
Например:pip install requests==2.26.0
Установите несколько пакетов:
```
pip install -r requirements.txt
```
использоватьrequirements.txtФайл, в котором перечислены все необходимые имена и версии пакетов.
Сгенерировать файл требований:
```
pip freeze > requirements.txt
```
Эта команда экспортирует пакеты и версии в текущей среде в виде архива требований.
Очистить кеш:
```
pip cache purge
```
Очистите папку кэша pip, чтобы освободить место на диске.

4. Часто задаваемые вопросы и решения

Проблема: команда pip не найдена
Решение. Проверьте, установлен ли Python, и убедитесь, что каталог установки Python добавлен в системную переменную среды PATH.
Проблема: ошибка разрешений при установке пакета.
Решение: попробуйте добавить--userПараметры, например:имя пакета установки pip --user
Проблема: невозможно подключиться к PyPI.
Решение. Убедитесь, что сеть в порядке, или попробуйте использовать источник домашнего зеркала, например:имя пакета установки pip -i https://pypi.tuna.tsinghua.edu.cn/simple

5. Лучшие практики для pip

Используйте виртуальную среду, напримерvenvилиvirtualenv), чтобы избежать конфликтов с глобальными установочными пакетами.
Регулярно проверяйте и обновляйте установленные пакеты для обеспечения безопасности.
Используется в проектахrequirements.txtуправлять зависимостями.

папка pip/cache/http-v2

1. Что такое папка pip/cache/http-v2?

pip：Инструмент управления пакетами Python для установки, обновления и управления пакетами Python.
cache：Каталог кэша pip используется для хранения загруженных пакетов и связанных ресурсов для удобства повторного использования.
http-v2：Кэшированные данные HTTP-запроса, особенно для запросов на загрузку на основе протокола HTTP/2.

2. Назначение папки http-v2

Кэширование загруженных пакетов:При установке пакета pip загружает архив пакета и кэширует его вhttp-v2каталог, чтобы в будущем при установке того же пакета не требовалось повторно загружать его.
Ускорьте процесс установки:Повторное использование файлов в кэше позволяет сократить сетевые запросы и увеличить скорость установки.
Экономьте пропускную способность:Избегайте повторной загрузки пакета из Интернета каждый раз при его установке, что снижает потребление полосы пропускания.

3. Управление папками http-v2.

Посмотреть расположение кэша:
- Используйте инструкцииpip cache dirПросмотрите текущий каталог кэша.
Очистить кеш:
- Используйте инструкцииpip cache purgeОчистите все кэшированные данные.
- Удаляйте только определенные кэшированные данные: вы можете удалить их напрямую.http-v2папку, но это заставит pip повторно загрузить файл при следующей установке соответствующего пакета.
Отключить кеширование:
- Если вы не хотите использовать кеширование, вы можете добавить его при установке пакета.--no-cache-dirПараметры, например:pip install package_name --no-cache-dir。

4. Меры предосторожности

Размер каталога кэша:Длительное использование pip может привести к увеличению размера папки кэша. Рекомендуется регулярно чистить его, чтобы освободить место на диске.
Автономная установка:Кэшированные пакеты можно устанавливать в автономном режиме без подключения к Интернету.
Обновление версии:Очистка кеша может потребовать повторной загрузки некоторых пакетов, но это гарантирует загрузку последней версии.

Базовая структура данных Python

Проверьте тип переменной

Используйте тип()

type()Функция может возвращать тип объекта.


x = 10
print(type(x))   # <class 'int'>

y = "hello"
print(type(y))   # <class 'str'>

Используйте isinstance()

isinstance()Используется для проверки принадлежности переменной к определенному типу и поддерживает проверку нескольких типов.


x = 10

print(isinstance(x, int))         # True
print(isinstance(x, str))         # False
print(isinstance(x, (int, float))) # True

разница

type()Относительно строгий, будет возвращен только точный тип.
isinstance()Будут рассмотрены отношения наследования, которые чаще используются на практике.

Логический тип данных Python

Boolean в Python — это основной тип данных в программировании, который представляет два логических состояния: True или False. Это основа всех условных суждений и контроля процессов.

1. Булевы значения и типы

Существует только два значения Боллинджера:TrueиFalse。
Их необходимо писать с заглавной первой буквы.
Тип логического значения:bool。

а = Истина
б = Ложь
print(type(a)) # Вывод: <class 'bool'>

2. Связь между Боллинджером и цифрами

Внутри Питона,boolцелое числоintподкатегории , чтобы они могли участвовать в числовых операциях:

TrueЧисленно эквивалентно 1.
FalseЧисленно эквивалентно 0.

print(True + 1) # Вывод: 2 (1 + 1)
print(False * 5) # Вывод: 0 (0 * 5)

3. Основное использование: оператор сравнения.

Операторы сравнения сравнивают два значения и возвращают логический результат.

оператор	описывать	пример	результат
`==`	равный	`10 == 10`	`True`
`!=`	не равен	`5 != 10`	`True`
`>`	больше, чем	`10 > 5`	`True`
`<=`	меньше или равно	`5 <= 5`	`True`

4. Логические операторы

Логические операторы используются для объединения или изменения логических значений или логических выражений.

and: Логическое «и», обе стороныTrueРезультатTrue。
or: Логическое «ИЛИ», любая сторонаTrueРезультатTrue。
not: Логическое «нет», инвертирующее логическое значение.

print(True и False) # Вывод: False
print(True или False) # Вывод: True
print(not True) # Вывод: False

5. Проверка истинности

В Python все объекты имеют истинностное значение. Когда объект используется для условного суждения, Python преобразует его вTrueилиFalse：

рассматривается какFalse(Ложные) объекты включают в себя:None, число 0 (0, 0.0), пустая строка (""), пустой список ([]), пустой кортеж (()), пустой словарь ({}) и пустое множество (set())。
рассматривается какTrue(Истинные) объекты включают в себя: все остальные объекты, кроме значений Falsy (например, ненулевые числа, любой непустой контейнер).

if []: # Пустые списки считаются ложными
    print("Это не будет выполнено")
еще:
    print("Список пуст")

if "hello": # Непустые строки считаются True
    print("Строка не пуста")

Массив Python

Что такое массив?

В Python массив — это структура данных, используемая для хранения нескольких элементов одного типа. Хотя сам Python не имеет встроенного типа массива, вы можете использоватьlistилиarrayМодули для достижения аналогичной функциональности.

Использовать список как массив

listЭто встроенная структура данных Python, которая может хранить многие типы данных, но также может использоваться для моделирования массивов.

мой_список = [1, 2, 3, 4, 5]
print(my_list[0]) # Вывод: 1

Использование модуля массива

Если вам нужен настоящий массив (все элементы должны быть одного типа), вы можете использоватьarrayМоды.

импортировать массив

my_array = array.array('i', [1, 2, 3, 4, 5])
print(my_array[0]) # Вывод: 1

здесь,'i'Указывает, что элементы массива являются целыми числами.

Основные операции модуля массива

Вот некоторые основные операции:

Новые элементы:my_array.append(6)
Удалить элементы:my_array.remove(3)
Получите длину:len(my_array)

Массивы и NumPy

В ситуациях, когда требуются числовые операции,numpyОбеспечивает более мощную поддержку массивов.

импортировать numpy как np

my_numpy_array = np.array([1, 2, 3, 4, 5])
print(my_numpy_array[0]) # Вывод: 1

Массивы NumPy поддерживают многомерные данные и векторизованные операции, что делает их идеальными для обработки больших объемов данных.

в заключение

Python предоставляет множество способов реализации функций массива.listПрименимо к общим ситуациям,arrayМодули подходят для ситуаций, когда требуются элементы одного и того же типа, тогда какnumpyЭто инструмент выбора для научных вычислений.

Определить, пуст ли список

для переменныхret_value = [], существует несколько простых и эффективных способов определить, является ли список пустым в языке Python. Поскольку пустой список рассматривается какFalseНиже приведены несколько часто используемых методов суждения.

1. Используйте логическую оценку (наиболее рекомендуемый Pythonic-способ).

Это самый популярный метод, предполагающий непосредственную проверку логического значения списка. Если список пуст,notоператор приведёт к тому, что его условие будет оценено как true (True）。

ret_value = []

если не ret_value:
    #Выполнить здесь, когда список пуст
    print("ret_value — пустой список")
еще:
    #Выполнить здесь, если список не пуст
    print("ret_value не пустой список")

2. Используйте`len()`функция

Проверяет, равна ли длина списка 0.

ret_value = []

если len(ret_value) == 0:
    print("ret_value — пустой список")
еще:
    print("ret_value не пустой список")

3. Используйте эквивалентные сравнения`== []`

Непосредственно назначьте переменные пустому литералу списка[]Сделайте сравнение.

ret_value = []

если ret_value == []:
    print("ret_value — пустой список")
еще:
    print("ret_value не пустой список")

Динамическое увеличение и уменьшение массива

Использование списков для динамических операций

В Python,listЭто динамическая структура данных, в которую можно легко добавлять и удалять элементы.

Добавить новый элемент

Новые элементы можно добавлять следующими способами:

append(): добавляет элемент в конец списка.
insert(): вставить элемент в указанную индексную позицию.
extend(): добавляет элементы другого списка к существующему списку.

# Пример нового элемента
мой_список = [1, 2, 3]
my_list.append(4) # [1, 2, 3, 4]
my_list.insert(1, 10) # [1, 10, 2, 3, 4]
my_list.extend([5, 6]) # [1, 10, 2, 3, 4, 5, 6]

Удалить элемент

Удалить элементы можно с помощью:

pop(): удаление элементов по индексу, по умолчанию удаляется последний элемент.
remove(): удаляет первый соответствующий элемент на основе значения.
clear(): удалить все элементы из списка.

# Пример удаления элемента
мой_список = [1, 2, 3, 4, 5]
my_list.pop() # [1, 2, 3, 4]
my_list.remove(2) # [1, 3, 4]
my_list.clear() # []

Динамические операции с использованием модуля массива

В случаях, когда вам нужны элементы одного типа, вы можете использоватьarrayМоды.

Добавить новый элемент

append()иextend()Метод применяется кarrayМоды.

import array
my_array = array.array('i', [1, 2, 3])
my_array.append(4)  # [1, 2, 3, 4]
my_array.extend([5, 6])  # [1, 2, 3, 4, 5, 6]

Удалить элемент

remove()иpop()Можно использовать методыarrayМоды.

# Пример удаления элемента
my_array = array.array('i', [1, 2, 3, 4])
my_array.remove(2) # [1, 3, 4]
my_array.pop() # [1, 3]

в заключение

Python предоставляет множество методов для динамического увеличения и уменьшения массивов.listиarrayМодули подходят для разных нужд. Для получения дополнительных функциональных требований вы также можете рассмотреть возможность использованияnumpy。

Подсчет массивов Python

В Python,list.count()Это инструмент, специально используемый для статистики.Количество вхождений определенного элементаметод. Это то же самое, что получить длину спискаlen()В отличие от этого, параметр должен быть передан в качестве объекта сравнения.

1. Основной синтаксис list.count()

Синтаксис:list.count(value), который возвращает целое число раз, когда значение появляется в списке. Если значение не существует, возвращается 0.

фрукты = ['яблоко', 'банан', 'яблоко', 'апельсин', 'яблоко']

# Подсчитаем количество вхождений слова «яблоко»
apple_count =fruits.count('яблоко')
print(apple_count) # Вывод: 3

# Подсчитаем несуществующие элементы
Grape_count = Fruits.count('виноград')
print(grape_count) # Вывод: 0

2. Сравнение общих требований и инструментов подсчета

В зависимости от ваших потребностей (ищете ли вы один элемент, несколько элементов или всю статистику), существуют различные рекомендации:

нуждаться	Рекомендуемый метод	Пример кода
Посчитайте один конкретный элемент	`list.count()`	`arr.count(10)`
Получить общую длину списка	`len()`	`len(arr)`
Подсчитайте частоту всех элементов	`collections.Counter`	`Counter(arr)`
Количество условий (если больше 5)	выражение генератора	`sum(1 for x in arr if x > 5)`

3. Расширенные инструменты: коллекции.Счетчик.

Если вам нужно узнать, сколько раз «все элементы» появляются в списке одновременно, используйтеCounterБудет запускаться много разcount()Гораздо более эффективно (O(n) против O(n^2)).

из коллекций Счетчик импорта

данные = [1, 2, 2, 3, 3, 3, 4]
counts = Счетчик(данные)

print(counts) # Вывод: Counter({3: 3, 2: 2, 1: 1, 4: 1})
print(counts[3]) # Получаем количество раз 3:3
print(counts.most_common(1)) # Получаем элемент с наибольшим количеством вхождений

4. Напоминания об использовании легко сбивают с толку.

Не используйте count для проверки существования:Если вы просто хотите подтвердить, находится ли элемент в списке, используйтеif x in listСравниватьif list.count(x) > 0Гораздо быстрее, потому чтоinОн остановится, как только найдет первый.
Вложенный список: count()Будет выполнено только «поверхностное сравнение». Если список содержит другой список, он не будет учитываться внутри подсписка.
Примечание по производительности:Повторение вызовов одного и того же длинного списка в большом циклеlist.count()Это приведет к резкому падению производительности, поэтому приоритет следует отдатьCounter。

5. Практические навыки: условный счет.

Если вы хотите подсчитать количество элементов, соответствующих определенной логике (например, строки длиной более 3), вы можете объединитьsum()：

слова = ['привет', 'привет', 'питон', 'а', 'код']

# Подсчитаем количество слов длиной > 3
big_word_count = sum(1 для w в словах, если len(w) > 3)
print(big_word_count) # Вывод: 3

Объединение 2D-списков

Описание требований

Два 2D-списка, каждый элемент[key, value]。
Соответствует первому элементу (ключу).
Если ключи одинаковые, вторые элементы с обеих сторон будут объединены во второй и третий столбцы.
Порядок не обязательно один и тот же.

Пример программы

список1 = [
    ["а", 1],
    ["б", 2],
    ["с", 3]
]

список2 = [
    ["с", 30],
    ["а", 10],
    ["д", 40]
]

#Преобразовать список1 в dict
dict1 = {k: v для k, v в списке1}
dict2 = {k: v для k, v в списке2}

# Найти все ключи
all_keys = sorted(set(dict1.keys()) | set(dict2.keys()))

# Объединить результаты
объединен = []
для k во всех_клавишах:
    v1 = dict1.get(к)
    v2 = dict2.get(к)
    merged.append([k, v1, v2])

для строки в слиянии:
    печать (строка)

Вывод результатов


['a', 1, 10]
['b', 2, None]
['c', 3, 30]
['d', None, 40]

в заключение

Быстро сравнивайте ключи с помощью словаря.
Используйте значение, которого не существуетNoneнаполнять.
В результате получается структура из трех столбцов:[key, value1, value2]。

Зацикливание двух списков одновременно

В Python, если у вас есть два списка (например,selected_fields_listиaSqlValuesStr_list), и необходимо перебирать их одновременно, наиболее распространенным и Pythonic способом является использование встроенного методаzip()функция.

1. Используйте функцию zip().

zip()Функция упаковывает несколько итерируемых объектов (Iterable) в последовательность кортежей. Каждая итерация цикла удаляет элемент в соответствующей позиции из каждого списка.

импортировать повторно

# Предположим, что это два списка, которые вы получаете после re.split()
selected_fields = "имя,возраст,город"
aSqlValuesStr = "Алиса, 25, Тайбэй"

selected_fields_list = re.split(r',', selected_fields)
aSqlValuesStr_list = re.split(r',', aSqlValuesStr)

# Выполнить цикл
для поля значение в zip(selected_fields_list, aSqlValuesStr_list):
    print(f"Поле: {поле}, значение: {значение}")

2. Пример вывода

Поле: имя, значение: Алиса
Поле: возраст, значение: 25
Поле: город, значение: Тайбэй

3. Важные замечания по zip()

Когда вы используетеzip()При использовании функций необходимо обратить внимание на следующие моменты:

Длины списков несовместимы: zip()Итерация остановится на самом коротком списке. еслиselected_fields_listимеет 3 элемента, иaSqlValuesStr_listПри наличии 4 элементов цикл будет выполняться только 3 раза.
Необходимо иметь дело с несоответствиями длины:Если вам нужно убедиться, что длины двух списков точно совпадают, или вам нужно, чтобы более длинный список преобладал, вам следует использоватьitertools.zip_longest。

#Пример: несовместимая длина списков
список1 = [1, 2, 3]
список2 = ['а', 'б']

для элемента1, элемента2 в zip(список1, список2):
    печать(элемент1, элемент2)
#Вывод будет только:
# 1а
#2б

Выровнять отображение 2D-массива

Выровнять поля по формату

данные = [
    [1, 23, 456],
    [7890, 12, 3],
    [45, 678, 9]
]

# Вычисляем максимальную ширину каждого столбца
col_widths = [max(len(str(row[i])) для строки в данных) для i в диапазоне(len(data[0]))]

# Форматируем вывод
для строки в данных:
    print(" ".join(str(val).rjust(col_widths[i]) for i, val в enumerate(row)))

Вывод результатов


   1   23  456
7890   12    3
  45  678    9

Использование модуля таблицы

Сторонние пакетыtabulateВыровненные таблицы можно вывести напрямую.


from tabulate import tabulate

data = [
    [1, 23, 456],
    [7890, 12, 3],
    [45, 678, 9]
]

print(tabulate(data, tablefmt="grid"))

Вывод результатов


+------+-----+-----+
|    1 |  23 | 456 |
| 7890 |  12 |   3 |
|   45 | 678 |   9 |
+------+-----+-----+

в заключение

Встроенный метод: сначала вычислите ширину столбца, затем используйтеrjust()Выравнивание.
Внешний комплект: использоватьtabulateБыстро создавайте красивые таблицы.

Выровненный вывод двумерных чисел с плавающей запятой

иллюстрировать

В следующем примере показано, как распечатать двумерный список. Когда элементfloatИсправлено отображение двух знаков после запятой, остальные элементы выводятся как есть, с сохранением выравнивания полей.

Пример программы

данные = [
    [1, 23.456, 456],
    [7890.1, 12, 3.5],
    [45, 678,9, 9]
]

# Форматируем каждую строку элемента
форматированные_данные = []
для строки в данных:
    новая_строка = []
    для значения в строке:
        если isinstance(val, float):
            s = f"{val:.2f}" # float -> два знака после запятой
        еще:
            s = ул (значение)
        new_row.append(ы)
    formatted_data.append(новая_строка)

# Вычисляем максимальную ширину каждого столбца
col_widths = [max(len(row[i]) для строки в formatted_data) для i в диапазоне(len(formatted_data[0]))]

# Форматируем вывод
для строки в formatted_data:
    print(" ".join(val.rjust(col_widths[i]) for i, val in enumerate(row)))

Вывод результатов


    1  23.46  456
7890.10     12  3.50
   45  678.90     9

сосредоточиться

использоватьisinstance(val, float)Определить числа с плавающей запятой.
черезf"{val:.2f}"Отформатируйте число с плавающей запятой до двух десятичных знаков.
Сначала преобразуйте все элементы в строки, а затем рассчитайте ширину столбца, чтобы обеспечить его выравнивание.

Извлечь все значения из списка словаря

Предоставляемая вами структура данных представляет собой список, содержащий несколько словарей, где каждый словарь представляет запись временного ряда (например, данные K-линии).

data = [
    {'time': 1759028400000, 'open': '109398.3', 'close': '109364.8', 'high': '109489.2', 'low': '109364.8', 'volume': '518.7594'},
    {'time': 1759024800000, 'open': '109305.6', 'close': '109398.3', 'high': '109496.4', 'low': '109296.0', 'volume': '757.0290'},
    # ...
]

Если вы хотите получить все значения во всех записях (1759028400000, '109398.3', '109364.8'и т. д.) и собрать их в список, вы можете использовать Nested List Comprehension.

1. Извлечь все значения в единый список (сведение)

Используйте двухуровневое понимание списка для перебора каждого словаря в списке, а затем вызовите.values()Метод получает значения и, наконец, собирает все значения в плоский список.

данные = [
    {'время': 1759028400000, 'открытие': '109398.3', 'закрытие': '109364.8', 'высокая': '109489.2', 'низкая': '109364.8', 'объем': '518.7594'},
    {'время': 1759024800000, 'открытие': '109305.6', 'закрытие': '109398.3', 'высокая': '109496.4', 'низкая': '109296.0', 'объем': '757.0290'}
]

все_значения = [
    ценность
    для записи в данных # Пройти каждую запись словаря во внешнем списке
    for value in Record.values() # Обход всех значений в записи словаря
]

печать (все_значения)

2. Вывод результатов

В результате получается единый список, содержащий все значения:

[1759028400000, '109398.3', '109364.8', '109489.2', '109364.8', '518.7594', 1759024800000, '109305.6', '109398.3', '109496.4', '109296.0', '757.0290']

3. Извлеките значение определенного поля.

Если вам нужно извлечь только определенные поля (например, только всеopenцена), вы можете использовать одноуровневое понимание списка:

data = [
    {'time': 1759028400000, 'open': '109398.3', ...},
    {'time': 1759024800000, 'open': '109305.6', ...}
]

open_prices = [record['open'] for record in data]

print(open_prices)

Результат вывода:

['109398.3', '109305.6']

Извлечь значение определенного ключа из списка словаря

1. Используйте понимание списка (рекомендуется) ✅

Понимание списков — это краткий однострочный синтаксис для создания новых списков из существующих списков.

Примеры реализации Python

из даты и времени импорта даты и времени

список_данных = [
    {'videoid': 'b5HxsaM_E2Y', 'publishedat': datetime(2025, 12, 7, 3, 0, 53), 'rankno': 7, 'viewcount': 913053, 'query': 'бейсбол'},
    {'videoid': 'FEbMCBxsoWI', 'publishedat': datetime(2025, 11, 25, 5, 28, 6), 'rankno': 13, 'viewcount': 754598, 'query': 'бейсбол'},
    {'videoid': 'nOJUI0PGB68', 'publishedat': datetime (2025, 12, 7, 3, 7, 46), 'rankno': 14, 'viewcount': 748349, 'query': 'бейсбол'},
    {'videoid': 'uMHXIudw_w0', 'publishedat': datetime (2025, 12, 2, 10, 1, 38), 'rankno': 8, 'viewcount': 687949, 'query': 'бейсбол'}
]

target_key = 'идентификатор видео'

# Используйте понимание списка: для каждого элемента словаря в data_list извлеките элемент [target_key]
video_ids = [item[target_key] для элемента в data_list]

print(f"Извлеченный ключ: {target_key}")
print("Все значения videoid:")
печать (video_ids)

Вывод результатов

['b5HxsaM_E2Y', 'FEbMCBxsoWI', 'nOJUI0PGB68', 'uMHXIudw_w0']

2. Обработка ситуации, когда ключ может не существовать (безопасный доступ).

Если в некоторых словарях в списке может отсутствовать целевой ключ (например, в некоторых словарях нет ключа `videoid`), использование `item[target_key]` напрямую приведет к ошибке `KeyError`. Вы можете использовать метод `.get()` словаря или условное выражение для его безопасной обработки.

Пример реализации Python (безопасный доступ)

data_with_missing_key = [
    {'videoid': 'A1', 'query': 'футбол'},
    {'query': 'basketball'}, # Отсутствует ключ 'videoid'
    {'videoid': 'C3', 'query': 'Волейбол'}
]

target_key = 'идентификатор видео'

# Вариант A: используйте .get(), чтобы установить значение по умолчанию None (или любое другое значение)
Safe_video_ids_A = [item.get(target_key) для элемента в data_with_missing_key]
# Вывод: ['A1', Нет, 'C3']

# Вариант Б: извлечь только значения с этим ключом
Safe_video_ids_B = [item[target_key] для элемента в data_with_missing_key, если target_key в элементе]
# Вывод: ['A1', 'C3']

print(f"\nРезультаты безопасного извлечения (План Б): {safe_video_ids_B}")

Преобразование значений dict в список

вы изonesymbollist.values()Полученный результат представляет собой объект представления словаря Python.dict_values. Хотя он выглядит как список, это динамическое представление, а не стандартный список, который можно индексировать или изменять.

dict_values([1763510400000, '0.00015218', '0.00015336', '0.00015415', '0.00015067', '1634523'])

Не показыватьdict_values()Чтобы получить содержимое тега, самый простой и распространенный способ — использовать встроенный методlist()Функция приводит его к списку.

1. Преобразовать в список (список)

Воляdict_valuesперешел кlist()Функция, которая немедленно скопирует все элементы объекта представления в новый стандартный список.

# Предположим, что это полученный вами объект представления dict_values
dict_values_object = your_dictionary.values() # Предположим, что onesymbollist — это словарь

# Шаг: используйте функцию list() для преобразования
result_list = список (dict_values_object)

печать (список_результатов)

Вывод результатов

[1763510400000, '0.00015218', '0.00015336', '0.00015415', '0.00015067', '1634523']

2. Преобразовать в кортеж

Если ваша цель — создать неизменяемую последовательность, вы можете использоватьtuple()Функция преобразует его в кортеж.

result_tuple = tuple(dict_values_object)

print(result_tuple)

Вывод результатов

(1763510400000, '0.00015218', '0.00015336', '0.00015415', '0.00015067', '1634523')

3. Прямая итерация (преобразование не требуется)

Обратите внимание: если вы просто хотите обрабатывать значения по одному в цикле, вам не нужно явно преобразовывать их в список.dict_valuesСам по себе является итерируемым объектом (Iterable).

# Предположим, что это полученный вами объект представления dict_values
dict_values_object = your_dictionary.values()

print("Выводные элементы один за другим:")
для значения в dict_values_object:
    печать (значение)

Короче говоря, используйтеlist(your_dict.values())— это наиболее распространенный способ получить чистый и действенный список значений.

Преобразование значений словаря в строку, разделенную запятыми

начать сdict_valuesИзвлекает все значения из объекта представления и объединяет их в одну строку, разделенную только запятыми и пробелами (например:1763510400000, '0.00015218', ...), вам необходимо объединить следующие шаги:

взять из словаряdict_valuesПосмотреть объект.
Преобразует все элементы в этом объекте представления в строковые типы.
Использование Python", ".join()метод для объединения этих строк.

1. Реализация Python

Предположим, ваш исходный словарь называетсяonesymbol_dict, и вам необходимо преобразовать нестроковые значения (например, метки времени) в строки для использования.join()Установите связь.

onesymbol_dict = {
    «время»: 1763510400000,
    «открыть»: «0,00015218»,
    'закрыть': '0,00015336',
    «высокий»: «0,00015415»,
    «низкий»: «0,00015067»,
    'объем': '1634523'
}

# Шаг 1 и усиление; 2. Получите значения и преобразуйте все значения в строки.
# Используйте понимание списков, чтобы гарантировать, что все элементы являются строками
values_as_strings = [str(v) для v в onesymbol_dict.values()]

# Шаг 3: Используйте ', '.join() для объединения этих строк
values_string = ", ".join(values_as_strings)

печать (строка_значений)

2. Вывод результатов

Это создаст одну строку, содержимым которой является только значение без каких-либо внешних скобок илиdict_valuesЭтикетка:

1763510400000, 0.00015218, 0.00015336, 0.00015415, 0.00015067, 1634523

3. Примечания к строковым кавычкам

Обратите внимание, что в ожидаемом выводе примера значения, отличные от меток времени, заключены в одинарные кавычки:1763510400000, '0.00015218', ...。

Если ваша цель — чтобы строковые значения сохраняли одинарные кавычки в конечном выводе, вам нужно будет добавлять кавычки вручную во время конкатенации. Обычно это требуется при подготовке строк для операторов SQL или определенных форматов.

# Дополнительный шаг: обработка котировок вручную, предполагая, что нецелые значения требуют кавычек
Quote_values = []
для v в onesymbol_dict.values():
    если isinstance(v, (str, float)) или (isinstance(v, int) и v< 1000000000000): # 假設小數字串需要引號
        quoted_values.append(f"'{v}'")
    else:
        quoted_values.append(str(v))

final_quoted_string = ", ".join(quoted_values)

print(final_quoted_string)

Это даст вам ожидаемый формат (при условии, чтоtimeКавычки не требуются, можно использовать другие числовые строки):

1763510400000, '0.00015218', '0.00015336', '0.00015415', '0.00015067', '1634523'

Определить, является ли строка числом

Используйте str.isdigit()

isdigit()Метод можно использовать для проверки того, содержит ли строка только числовые символы.

# Пример
строка = "12345"
если строка.isdigit():
    print("это число")
еще:
    print("Не число")

Уведомление:isdigit()Невозможно обрабатывать десятичные точки или отрицательные знаки.

Используйте str.replace() для обработки десятичных знаков.

Если вам нужно проверить строку с десятичной точкой, вы можете удалить десятичную точку перед использованиемisdigit()。

# Пример
строка = "123,45"
если string.replace(".", "").isdigit():
    print("это число")
еще:
    print("Не число")

Этот метод не работает с отрицательными числами.

Преобразование в число с помощью try-кроме

Самый распространенный подход — попытаться преобразовать строку в число с плавающей запятой или целое число и перехватить исключение, если преобразование завершится неудачно.

# Пример
строка = "-123,45"
попробуйте:
    float(string) # Вместо этого вы можете использовать int(string) для проверки целых чисел
    print("это число")
кроме ValueError:
    print("Не число")

Используйте регулярные выражения

Регулярные выражения могут точно соответствовать числам, включая целые, десятичные и отрицательные числа.

# Пример
импортировать повторно

строка = "-123,45"
шаблон = r"^-?\d+(\.\d+)?$"
если re.match(шаблон, строка):
    print("это число")
еще:
    print("Не число")

в заключение

В простых случаях используйтеisdigit(). В более сложных случаях (например, работа с десятичными или отрицательными числами) рекомендуется использоватьtry-exceptили регулярное выражение.

Python f-string

f-строка (форматированный строковый литерал) — это мощный и эффективный метод форматирования строк, представленный в Python 3.6. Он обеспечивает краткий и легко читаемый способ встраивания значений переменных и выражений в строки.

Основная особенность f-строки: использование префиксов в начале строки.fилиFи используйте фигурные скобки{}содержать то, что должно быть рассчитано и отображено.

1. Основное использование: встраивание переменных.

Вы можете поместить любое имя переменной непосредственно в фигурные скобки.

имя = "Алиса"
возраст=30
message = f"Здравствуйте, меня зовут {name}, мне {age} лет."
# Вывод: Здравствуйте, меня зовут Алиса, мне 30 лет.

2. Встроенные выражения

Преимущество f-строки в том, что вы можете поместить любое допустимое выражение Python в фигурные скобки, и оно будет оценено во время выполнения.

цена = 19,99
налог_ставка = 0,05
итого = цена * (1 + ставка_налога)

# Выполняем вычисления внутри f-строки
result = f"Общая цена, включая налог, составляет: {price * (1 + Tax_rate):.2f} юаней."
# Вывод: общая цена, включая налог, составляет 20,99 юаней.

# Функция вызова
защита get_status():
    вернуть «ОК»

status_msg = f"Состояние системы: {get_status()}"
# Вывод: Статус системы: ОК

3. Форматирование и выравнивание строк.

поддерживает фа-струны и.format()Тот же метод, что и в мини-языке спецификатора формата, с использованием двоеточия.:для разделения выражений и спецификаторов формата.

код формата	использовать	пример	выход
`:.2f`	Число с плавающей запятой с двумя десятичными знаками	`f"{3.14159:.2f}"`	`3.14`
`: <10`	Выровнять по левому краю, ширина 10	`f"{'Name':<10}"`	`Name`
`: >10`	Выровнять по правому краю, ширина 10	`f"{'Value':>10}"`	`Value`
`:^10`	Выравнивание по центру, ширина 10	`f"{'Hi':^10}"`	`Hi`
`:,`	Числовой разделитель тысяч	`f"{1000000:,}"`	`1,000,000`

4. Отладка F-строк

Начиная с Python 3.8, f-строка предоставляет удобную функцию отладки, которая позволяет добавлять знак равенства после переменной.=, автоматически отображает имена переменных и их значения.

user_id = 42
is_active = Истина

debug_output = f"Идентификатор пользователя: {user_id=}, статус: {is_active=}"
# Вывод: идентификатор пользователя user_id=42, статус: is_active=True

5. Меры предосторожности

Цитата: Выражения внутри f-строки могут использовать другой тип кавычек, чем внешняя строка. Если одинарные кавычки используются снаружи'...'вы можете использовать двойные кавычки внутри"...",наоборот.
Фигурные скобки: если вам нужно отобразить фигурные скобки для буквального значения внутри f-строки, используйте двойные фигурные скобки.{{}}。
обратная косая черта: обратная косая черта внутри f-строки\Его не разрешается использовать для представления строковых форматов, таких какf"{{'\n'}}"вызовет ошибки.

f-строка не отображает десятичные точки с плавающей запятой

1. Решение 1. Преобразование целых чисел внутри f-строки (рекомендуется)

Подтяжки на стрингах{}Внутри вы можете напрямую использоватьint()Функция преобразует переменную обратно в целочисленный тип. Это самый ясный и прямой метод.

Примеры реализации Python

inta = 12 # при условии необработанного целого числа
float_a = inta * 2.0 # Результат — 24,0 (число с плавающей запятой)

# Преобразование числа с плавающей запятой обратно в целое число непосредственно в f-строке
result_str = f"abc def {int(float_a)}"

print(f"Исходное значение (float_a): {float_a}")
print(f"Отформатированный результат: {result_str}")

2. Вариант 2. Используйте спецификатор формата f-строки (описатель формата).

Вы можете использовать коды целочисленного формата из мини-языка форматирования.dили.0fдля управления выходным форматом.

A. Используйте коды целочисленного формата`:d`

использовать:dPython просят рассматривать значение как целое число при отображении. если переменнаяa— это число с плавающей запятой, Python автоматически округлит его до ближайшего целого числа перед отображением (если результат вашего расчета равен $24,0$, он отобразит $24$).

float_a = 24,0
result_d = f"abc def {float_a:d}"
# Вывод: abc def 24

Б. Используйте код формата с плавающей запятой`:.0f`

использовать:.0fозначает форматирование значения как числа с плавающей запятой, но требует 0 цифр после десятичной точки. Это также приведет к округлению результатов перед отображением.

float_a = 24,0
result_0f = f"abc def {float_a:.0f}"
# Вывод: abc def 24

Резюме и предложения

Если ваша цель — обеспечить, чтобы результат был абсолютным целым числом без десятичной точки, рекомендуется использовать вариант 1:

str = f"abc def {int(a)}"

Функция повторного разделения Python

В Python,re.split()ФункцияreМощный инструмент в модуле (регулярное выражение), используемый для разделения строк в соответствии с разделителями (шаблонами), определенными в регулярных выражениях, и возврата результатов в виде списка (списка).

1. Синтаксис функции

re.split(pattern, string, maxsplit=0, flags=0)

pattern: шаблон регулярного выражения, используемый для разделения строк.
string: целевая строка, которую нужно обрезать.
maxsplit(Необязательно): укажите максимальное количество разрезов. Значение по умолчанию 0 означает отсутствие ограничений на количество разрезов.
flags(необязательно): флаги, управляющие поведением регулярных выражений (например,re.IGNORECASE）。

2. Основное использование

Используйте регулярные выражения для определения нескольких или сложных разделителей.

импортировать повторно

text = "яблоко,банан;апельсин-виноград"
# Используйте запятую, точку с запятой или дефис в качестве разделителя
результат = re.split(r'[;,-]', текст)

печать (результат)
# Вывод: ['яблоко', 'банан', 'апельсин', 'виноград']

3. Обработка нескольких пробелов (обычное использование)

со стандартными струнамиsplit()другой,re.split()Несколько последовательных разделителей (например, несколько пробелов) можно легко обработать и игнорировать.

текст = "Слово1 Слово2 Слово3"
# Используйте \s+ для соответствия одному или нескольким символам пробелов в качестве разделителей
результат = re.split(r'\s+', текст)

печать (результат)
# Вывод: ['Слово1', 'Слово2', 'Слово3']

4. Используйте maxsplit, чтобы ограничить количество разрезов.

Если установленоmaxsplit, операция вырезания будет выполнена только указанное количество раз, а остальные детали останутся в списке последним элементом.

текст = "один:два:три:четыре"
# Разрезать только один раз
результат = re.split(r':', text, maxsplit=1)

печать (результат)
# Вывод: ['один', 'два:три:четыре']

5. Сохраняйте разделители

Если вы поместите шаблон-разделитель внутри скобок(), сам разделитель также будет включен между элементами списка результатов.

текст = "15 января 2025 г."
# Поместите дефисы в круглые скобки, чтобы они сохранились
результат = re.split(r'(-)', текст)

печать (результат)
# Вывод: ['2025', '-', '01', '-', '15']

Определить начало строки начинается с

использовать

startswith()это строка Python (str) метод объекта, используемый для определения того, начинается ли строка с указанной подстроки. Если оно соответствует, вернитеTrue; В противном случае вернитеFalse。

грамматика


str.startswith(prefix[, start[, end]])

Описание параметра

prefix: Начальная строка для сравнения может быть одной строкой или кортежем строк.
start(Необязательно): укажите, с какой позиции индекса исходной строки следует начинать оценку.
end(Необязательно): укажите позицию индекса (исключая конец).

возвращаемое значение

Логическое значение: если строка начинается с указанного префикса, вернитеTrue,в противном случаеFalse。

пример

text = "Программирование на Python"

#Основное использование
print(text.startswith("Py")) # True
print(text.startswith("Java")) # False

#Указать диапазон
print(text.startswith("thon", 2)) # True (начиная с индекса 2 — "thon")

# несколько выравниваний
print(text.startswith(("Py", "Java", "C"))) # Верно, потому что любое совпадение

# Не чувствителен к регистру (можно сначала преобразовать в нижний регистр)
print(text.lower().startswith("py")) # True

Общие приложения

Имя файла или URL-адрес:

URL = "https://openai.com"
если url.startswith("https://"):
    print("URL безопасного соединения")

Список фильтров:


files = ["data1.csv", "data2.csv", "readme.txt"]
csv_files = [f for f in files if f.startswith("data")]
print(csv_files)  # ['data1.csv', 'data2.csv']

продлевать

Чтобы определить, «заканчивается» ли строка определенным текстом, вы можете использоватьendswith()методы, синтаксис иstartswith()такой же.

имя файла = "отчет.pdf"
если имя_файла.endswith(".pdf"):
    print("Это PDF-файл")

Удалить последний символ строки

иллюстрировать

В Python строки являются неизменяемыми объектами. Чтобы удалить последний символ, обычно используется разрезание строки для создания новой строки.

пример

текст = "Привет!"

#Метод 1: используйте нарезку
новый_текст = текст[:-1]
print(new_text) #Вывод: Здравствуйте

#Метод 2: используйте rstrip() для удаления определенных конечных символов
text2 = "Привет!!!"
новый_текст2 = text2.rstrip("!")
print(new_text2) #Вывод: Здравствуйте

#Метод 3: убедитесь, что он не пуст, а затем удалите последний символ.
если текст:
    текст = текст[:-1]
печать (текст)

Вывод результатов


Hello
Hello
Hello

иллюстрировать

text[:-1]Подстрока от начала до предпоследнего символа будет удалена.
rstrip(chars)Указанные символы в конце (не ограничиваясь одним) можно удалить.
Перед нарезкой вы можете проверить, пуста ли строка, чтобы избежать ошибок значений.

продлевать

Чтобы удалить ведущие символы, используйте:


text = text[1:]

Подвести итог

Самый простой способ удалить последний символ:s[:-1]。
Чтобы удалить определенные конечные символы, рекомендуется использоватьrstrip()。

Найдите содержимое перед подстрокой в строке

Постановка задачи

Учитывая строкуstr1, мы надеемся найти вstrAилиstrBТа часть, которая предшествует. Например:

str1 = "Hello World, this is a test. Stop here or continue."
strA = "Stop"
strB = "continue"

Цель состоит в том, чтобы получить"Hello World, this is a test. "。

Используйте re.split()

re.split()Вы можете разделить строку на основе нескольких ключевых слов и взять первую часть:

import re

def get_substring_before(text, strA, strB):
    result = re.split(f"{re.escape(strA)}|{re.escape(strB)}", text, maxsplit=1)[0]
    return result

str1 = "Hello World, this is a test. Stop here or continue."
strA = "Stop"
strB = "continue"

print(get_substring_before(str1, strA, strB))  # "Hello World, this is a test. "

Используйте исследование.search()

re.search()можно использовать для сопоставленияstrAилиstrBи получите содержимое перед сопоставлением:

import re

def get_substring_before(text, strA, strB):
    match = re.search(f"{re.escape(strA)}|{re.escape(strB)}", text)
    return text[:match.start()] if match else text

str1 = "Hello World, this is a test. Stop here or continue."
print(get_substring_before(str1, "Stop", "continue"))  # "Hello World, this is a test. "

Используйте метод find()

find()Вы можете вручную выполнить поиск самого раннегоstrAилиstrB, а затем извлеките соответствующую часть:

def get_substring_before(text, strA, strB):
    indexA = text.find(strA)
    indexB = text.find(strB)
    
    indices = [i for i in [indexA, indexB] if i != -1]
    first_index = min(indices, default=len(text))
    
    return text[:first_index]

str1 = "Hello World, this is a test. Stop here or continue."
print(get_substring_before(str1, "Stop", "continue"))  # "Hello World, this is a test. "

в заключение

использоватьre.split()Самый простой, подходит для одиночного поиска.
использоватьre.search()Обеспечьте более гибкое регулярное сопоставление.
использоватьfind()Метод является наиболее эффективным и подходит для простой обработки строк.

Объединение нескольких значений в строку

Используйте соединение (сначала вам нужно преобразовать все в строки)

значения = ["str1", "str2", 123, "str3", 456]

s = ", ".join(str(v) для v в значениях)
print(s) # Вывод: str1, str2, 123, str3, 456

Автоматически обрабатывать смешанные строки и целые числа

def join_values(*args, sep=", "):
    return sep.join(str(v) для v в args)

print(join_values("str1", "str2", 88, "str3"))
# Вывод: строка1, строка2, 88, строка3

Если источником является dict, отсортируйте по ключу, а затем объедините

данные = {
    "str1": "привет",
    "str2": "мир",
    "int1": 123,
    "str3": "ок"
}

# Сортируем по ключу и затем присоединяемся
s = ", ".join(str(data[k]) for k in sorted(data.keys()))
print(s) # привет, мир, 123, ок

Чтобы соединить ключ + значение вместе

s = ", ".join(f"{k}={v}" для k, v в data.items())
печать(и)
# Вывод: str1=привет, str2=мир, int1=123, str3=ok

Источником является список диктовок, каждый диктовок объединен в один столбец.

rows = [
    {"str1": "A", "int1": 10},
    {"str1": "B", "int1": 20},
]

for row in rows:
    print(", ".join(str(v) for v in row.values()))
# A, 10
# B, 20

Универсальная функция: переключение между режимами «с кавычками» и «без кавычек».

def join_values(values, sep=", ", quote=False):
    если цитировать:
        # Используйте полные одинарные кавычки ''
        return sep.join(f"'{v}'" для v в значениях)
    еще:
        return sep.join(str(v) для v в значениях)

значения = ["str1", "str2", 88, "str3"]

print(join_values(значения, кавычки=False))
# Вывод: строка1, строка2, 88, строка3

print(join_values(значения, кавычки=True))
# Вывод: «str1», «str2», «88», «str3»

Может поддерживать версию ввода *args

def join_args(*args, sep=", ", quoted=False):
    if quoted:
        return sep.join(f"‘{v}’" for v in args)
    return sep.join(str(v) for v in args)

print(join_args("str1", "str2", 88, "str3", quoted=True))
# ‘str1’, ‘str2’, ‘88’, ‘str3’

Поддержка dict (только выходное значение)

data = {"str1": "hello", "str2": "world", "int1": 123}

print(join_values(data.values(), quoted=True))
# ‘hello’, ‘world’, ‘123’

Поддержка формата ключ=значение

def join_key_value(d, sep=", ", quoted=False):
    if quoted:
        return sep.join(f"{k}=‘{v}’" for k, v in d.items())
    return sep.join(f"{k}={v}" for k, v in d.items())

print(join_key_value(data, quoted=True))
# str1=‘hello’, str2=‘world’, int1=‘123’

re.match()

Питонre.matchФункция в модуле регулярных выражений, используемая для сопоставления с начала строки. Если совпадение прошло успешно, вернитеMatchобъект; в противном случае возвратNone。

грамматика

re.match(pattern, string, flags=0)

Описание параметра:

pattern: Соответствующее регулярное выражение.
string: строка, которую нужно проверить.
flags: Необязательный параметр, используемый, например, для изменения поведения сопоставления.re.IGNORECASE。

Общие свойства и методы

group(n):Вернуться к первомуnзахваченные подгруппы,n=0Верните весь матч.
start(): Возвращает начальную позицию матча.
end(): Возвращает конечную позицию совпадения.
span(): Возвращает соответствующий диапазон (начало, конец).

Примеры использования

импортировать повторно

#Определяем строку
text = "123 Привет, мир!"

# Используйте re.match для сопоставления чисел с начала
match = re.match(r"(\d+)\s+(.*)", text)

если совпадение:
    print(f"Весь результат сопоставления: {match.group(0)}") # 123 Hello World!
    print(f"Часть числа: {match.group(1)}") # 123
    print(f"Текстовая часть: {match.group(2)}") # Привет, мир!
еще:
    print("совпадение не удалось")

Вывод результатов

Полный результат сопоставления: 123 Hello World!
Числовая часть: 123
Текстовая часть: Привет, мир!

На что следует обратить внимание

re.matchСоответствует только с начала строки, если начало не совпадает, вернутьNone。
Если вам нужно искать по всему миру, используйтеre.searchилиre.findall。

регулярное выражение

Регулярное выражение (сокращенно Regex) — это синтаксис, используемый для описания правил сопоставления строк. Он часто используется для поиска, замены или проверки строк. на PythonreВ модулеpatternЭто основная часть определения этих правил.

основные элементы синтаксиса

Класс персонажа：
- \d: Соответствует любому числу (0–9).
- \D: Соответствует всему, что не является числом.
- \w: Соответствует любому отдельному символу (букве, цифре, подчеркиванию).
- \W: Соответствует любому неодиночному символу.
- \s: Соответствует любому пробельному символу (пробелу, табуляции и т. д.).
- \S: Соответствует любому символу без пробелов.
- .: Соответствует, за исключением символов новой строки (\n), кроме любого отдельного символа.
квантификатор：
- *: Соответствует предыдущему выражению 0 или более раз.
- +: Соответствует предыдущему выражению 1 или более раз.
- ?: Соответствует предыдущему выражению 0 или 1 раз.
- {n}: Соответствует предыдущему выражению ровно n раз.
- {n,}: Соответствует предыдущему выражению как минимум n раз.
- {n,m}: Соответствует предыдущему выражению не менее n раз, но не более m раз.
символ границы：
- ^: соответствует началу строки.
- $: соответствует концу строки.
- \b: Соответствует границам слов (например, началу или концу слова).
- \B: Соответствует границам, не содержащим слов.
Группировка и выбор：
- (...):Group, запишите содержимое в скобки.
- |: Логическое «или», напримерa|bсоответствоватьaилиb。
- (?:...): группирует, но не захватывает контент.

Расширенное использование

Просмотр вперед и просмотр назад：
- (?=...): Заглядывая вперед, за совпадением должен следовать указанный контент.
- (?!...): Негативный обзор, соответствие не может сопровождаться указанным содержимым.
- (?<=...): Прямой просмотр, сопоставлению должно предшествовать указанное содержимое.
- (?<!...): Отрицательный ретроспективный анализ, сопоставлению не может предшествовать указанный контент.

пример

импортировать повторно

# Пример 1: Сопоставление содержимого, начинающегося с цифры
шаблон = r"^\d+"
текст = "123abc"
match = re.match(шаблон, текст)
если совпадение:
    print(f"Результат сопоставления: {match.group()}") # Вывод: 123

#Пример 2: Сопоставление текста после чисел
шаблон = r"(\d+)\s+(.*)"
text = "123 Привет, мир"
match = re.match(шаблон, текст)
если совпадение:
    print(f"Часть числа: {match.group(1)}") # Вывод: 123
    print(f"Текстовая часть: {match.group(2)}") # Вывод: Hello World

Сценарии применения регулярных выражений

Проверьте адрес электронной почты или формат номера телефона.
Извлекайте из текста определенные данные, например даты или URL-адреса.
Пакетная замена текста, например замена знаков препинания пробелами.

Применение исследования()

Основное использование

re.search()Используется для поиска первого совпадения регулярного выражения в строке и его возврата.MatchОбъект, возвращаемый, если совпадений нетNone。

импортировать повторно

text = «Привет, 2024!»
match = re.search(r"\d+", текст)

если совпадение:
    print("Найден номер:", match.group()) # 2024

Объект обратного совпадения

когдаre.search()Когда совпадение найдено, оно возвращаетMatchОбъекты могут получать доступ к информации следующими способами:

group(): вернуть соответствующую строку
start(): соответствующий начальный индекс
end():Конечный индекс совпадения
span():Вернуть (начало, конец) диапазона индексов

импортировать повторно

text = "Python 3.10 великолепен!"
match = re.search(r"\d+\.\d+", text)

если совпадение:
    print("Сопоставить содержимое:", match.group()) # 3.10
    print("Начальный индекс:", match.start()) # 7
    print("Конечный индекс:", match.end()) # 11
    print("диапазон:", match.span()) # (7, 11)

Используйте групповое сопоставление

через скобки()создать группу и использоватьgroup(n)для извлечения соответствующего соответствующего контента.

импортировать повторно

text = "Джон Доу, Возраст: 25"
match = re.search(r"(\w+) (\w+), Возраст: (\d+)", text)

если совпадение:
    print("Фамилия:", match.group(1)) # Джон
    print("name:", match.group(2)) # Доу
    print("Возраст:", match.group(3)) # 25

Сравнение с re.findall()

re.search()Возвращается только первый соответствующий результат, тогда какre.findall()Все совпадающие результаты будут возвращены.

import re

text = "Price: $10, Discount: $2, Tax: $1"

match = re.search(r"\$\d+", text)
print("re.search:", match.group())  # $10

matches = re.findall(r"\$\d+", text)
print("re.findall:", matches)  # ['$10', '$2', '$1']

в заключение

re.search()Подходит для поиска первого результата сопоставления и может использоваться дляMatchОбъект для получения подробной информации. Для нескольких совпадающих результатов используйтеre.findall()。

Незахватывающие группы регулярных выражений

Улучшите производительность сопоставления

В регулярном выражении(...)Соответствующий контент будет записан и сохранен вgroup(n), но не группа захвата(?:...)Он используется только для организационной структуры и не влияет на номер группы, поэтому сопоставление происходит быстрее.

Не влияйте на групповой индекс

Если используется в регулярном выражении()организовать условия сопоставления, которые повлияютgroup(n)число. использовать(?:...)Это гарантирует, что индекс группы останется неизменным.

import re

text = "2024-03-12"
pattern = r"(\d{4})-(?:\d{2})-(\d{2})"

match = re.search(pattern, text)
print(match.group(1))  # 2024
print(match.group(2))  # 12

В сочетании с оператором OR

использовать(?:...|...)могу позволить|Оператор влияет на сопоставление содержимого, но не на групповой доступ.

import re

text = "bar123"
pattern = r"(?:foo|bar|baz)\d+"

match = re.search(pattern, text)
print(match.group())  # bar123

Применяется к анализу --user-data-dir

При анализе параметров Chrome используйте(?:...)Это гарантирует, что формат соответствия не повлияет на номер группы.

import re

cmdline = '--user-data-dir="C:\\Users\\moirg\\AppData\\Local\\Google\\Chrome\\User Data"'

match = re.search(r'--user-data-dir=(?:"([^"]+)"|(\S+))', cmdline)
user_data_dir = match.group(1) or match.group(2)

print(user_data_dir)  # C:\Users\moirg\AppData\Local\Google\Chrome\User Data

в заключение

(?:...)Он может повысить производительность регулярных выражений, избежать влияния на индекс группы и подходит для|Операции и сопоставление конкретных условий делают код более эффективным и понятным.

Дата и время Python

Модуль импорта

import datetime

Получить текущее время

now = datetime.datetime.now()
print(now)

Создать указанное время

dt = datetime.datetime(2025, 7, 2, 14, 30, 0)
print(dt)

Форматировать строку времени

now = datetime.datetime.now()
formatted = now.strftime("%Y-%m-%d %H:%M:%S")
print(formatted)

Разобрать строку времени

dt_str = "2025-07-02 14:30:00"
parsed = datetime.datetime.strptime(dt_str, "%Y-%m-%d %H:%M:%S")
print(parsed)

Сложение и вычитание времени

now = datetime.datetime.now()
delta = datetime.timedelta(days=7)
next_week = now + delta
print(next_week)

Получить сегодняшнюю дату

today = datetime.date.today()
print(today)

Сравнить даты

dt1 = datetime.datetime(2025, 7, 1)
dt2 = datetime.datetime(2025, 7, 2)
print(dt1 < dt2)

Получить разницу во времени

dt1 = datetime.datetime(2025, 7, 1, 12, 0, 0)
dt2 = datetime.datetime(2025, 7, 2, 14, 30, 0)
diff = dt2 - dt1
print(diff)
print(diff.total_seconds())

Получить день недели

сегодня = дата-время.дата.сегодня()
print(today.weekday()) # 0 = понедельник, 6 = воскресенье

проблема с часовым поясом datetime

ошибка вычитания даты и времени с учетом смещения и смещения

Когда один объект datetime не имеет часового пояса (наивный), а другой имеет часовой пояс (осведомлен) и вычитается, он выдает:

TypeError: can't subtract offset-naive and offset-aware datetimes

Проверьте, является ли datetime наивным или осведомленным

from datetime import datetime

def is_aware(dt):
    return dt.tzinfo is not None and dt.tzinfo.utcoffset(dt) is not None

def is_naive(dt):
    return not is_aware(dt)

dt1 = datetime.now()                 # naive
dt2 = datetime.now().astimezone()    # aware

print(is_naive(dt1), is_aware(dt1))
print(is_naive(dt2), is_aware(dt2))

Решение А. Преобразовать в осведомленный (рекомендуется)

Подходит для ситуаций в разных часовых поясах или когда требуется точный расчет времени.

из даты и времени импорта даты и времени, часового пояса

sql_dt = sql_dt.replace(tzinfo=timezone.utc) # поддержка передачи данных SQL
now_dt = datetime.now(timezone.utc) # Использовать информацию о текущем времени

разница = now_dt - sql_dt
печать(diff.total_секунды())

Решение Б. Преобразование в простой формат (не рекомендуется, разница часовых поясов будет игнорироваться).

sql_dt = sql_dt.replace(tzinfo=None)
now_dt = datetime.now()

diff = now_dt - sql_dt

Подвести итог

Два даты и времени должны быть либо наивными, либо оба осознавать, чтобы их можно было вычесть.
Рекомендуется преобразовать все данные в формат UTC, чтобы избежать ошибок часового пояса.

Вычислить стандартное отклонение ряда

иллюстрировать

В Python вы можете использовать встроенные модулиstatisticsизstdev()илиpstdev()Рассчитайте стандартное отклонение выборки или стандартное отклонение генеральной совокупности.

пример

статистика импорта

соотношения = [2,3, 2,8, 3,1, 2,5, 3,0]

# средний
среднее = сумма(отношения) / len(отношения)

#Выборочное стандартное отклонение (n-1)
std_sample = статистика.stdev(отношения)

#Стандартное отклонение матрицы (n)
std_population = статистика.pstdev(коэффициенты)

print(f"Среднее: {среднее:.2f}")
print(f"Стандартное отклонение выборки: {std_sample:.3f}")
print(f"Стандартное отклонение населения: {std_population:.3f}")

Вывод результатов

Средний: 2,74
Стандартное отклонение выборки: 0,303
Стандартное отклонение населения: 0,271.

Метод формулы (без использования модов)

Если вы не хотите полагаться наstatisticsМодуль, вы можете рассчитать самостоятельно, используя математические формулы:

соотношения = [2,3, 2,8, 3,1, 2,5, 3,0]
среднее = сумма(отношения) / len(отношения)

#Стандартное отклонение (население)
дисперсия = sum((x - среднее) ** 2 для x в отношениях) / len(отношения)
std_dev = дисперсия ** 0,5

print(f"Стандартное отклонение: {std_dev:.3f}")

Вывод результатов

Стандартное отклонение: 0,271

Описание разницы

statistics.stdev(): стандартное отклонение выборки (деленное наn-1）
statistics.pstdev(): Родительское стандартное отклонение (деленное наn）
Если данные представляют собой всю матрицу → используйтеpstdev()
Если данные являются выборочными → используйтеstdev()

Подвести итог

среднее значение:avg = sum(data) / len(data)
Выборочное стандартное отклонение:statistics.stdev(data)
Родительское стандартное отклонение:statistics.pstdev(data)

Python отображает цветовую строку ANSI

базовый пример

# Пример цветового кода ANSI
print("\033[31м красный текст\033[0м")
print("\033[32м зеленый текст\033[0м")
print("\033[33myellow text\033[0m")
print("\033[34м синий текст\033[0м")
print("\033[35м фиолетовый текст\033[0м")
print("\033[голубой текст длиной 36 м\033[0 м")
print("\033[37м белый текст\033[0м")

Жирный шрифт и цвет фона

print("\033[1;31м жирный красный текст\033[0м")
print("\033[42 м зеленый фоновый текст\033[0 м")

Пользовательское сочетание цветов

# Формат: \033[стиль; цвет переднего плана; цвет фона м
# Стиль: 0=по умолчанию, 1=жирный, 4=подчеркивание
# Цвет переднего плана: 30~37
# Цвет фона: 40~47

print("\033[1;33;44m жирный желтый текст + синий фон\033[0m")

Может быть инкапсулирован в функции

Защиту color_text(текст, color_code):
    верните f"\033[{color_code}m{text}\033[0m"

print(color_text("Внимание!", "1;31")) # Жирный красный
print(color_text("Успех!", "1;32")) # Жирный зеленый

Проверьте, поддерживает ли текущий терминал цвета ANSI.

Способ 1: проверьте sys.stdout.isatty()

импортсистем

если sys.stdout.isatty():
    print("Терминал может поддерживать цвета ANSI")
еще:
    print("Это может быть файл или среда вывода, не поддерживающая цвет")

Способ 2. Используйте Colorama (кроссплатформенное решение).

импорт колорамы
колорама.init()

print("\033[32mЭтот текст должен быть зеленым\033[0m")

Метод 3: Фактический результат теста

защита support_ansi():
    попробуйте:
        print("\033[31м тестовый красный\033[0м")
        вернуть истину
    кроме:
        вернуть ложь

print("ANSI поддерживается", если support_ansi(), иначе "ANSI не поддерживается")

Пополнить

Терминалы Linux/macOS обычно по умолчанию поддерживают цвета ANSI.
Windows 10 ранее требовала установки дополнительных инструментов или использованияcolorama。
Если выходные данные направляются в файл, цветовой код будет отображаться в виде текста, а не цвета.

Ввод Python поддерживает автозаполнение

иллюстрировать

В Python,input()Сама функция не поддерживаетTabЗавершено автоматически. Для достижения этой функции вы можете объединитьreadlineМодуль, который позволяет пользователям использоватьTabВыполните автодополнение (аналогично Bash или IPython).

базовый пример

импортировать строку чтения

# Определить список строк, которые можно дополнить
СЛОВА = ['яблоко', 'банан', 'вишня', 'виноград', 'апельсин', 'арбуз']

def Completer(текст, состояние):
    """Функция автозаполнения: сравнение доступных строк на основе входных префиксов"""
    options = [w вместо w в WORDS, если w.startswith(text)]
    если состояние < Лен (варианты):
        варианты возврата [состояние]
    еще:
        возврат Нет

# Включить функцию завершения
readline.set_completer(завершитель)
readline.parse_and_bind('вкладка: завершена')

# Пользовательский ввод (поддерживает Tab)
user_input = input("Введите название фрукта (для завершения можно нажать Tab): ")
print(f"Вы ввели: {user_input}")

Инструкция по эксплуатации

readline.set_completer()Установите логику автозаполнения.
readline.parse_and_bind('tab: complete')позволятьTabКлюч запускает автозаполнение.
completer(text, state)：
- text— это введенный в данный момент текст.
- stateПредставляет соответствующий элемент (0, 1, 2...).
- Если совпадений больше нет, вернитеNone。

Дополнительно: динамическое завершение

Вы также можете обновить список завершения на основе текущего контекста или динамического содержимого:

импортировать строку чтения

Защиту Dynamic_completer (текст, состояние):
    current_words = ['кошка', 'автомобиль', 'собака', 'утка', 'олень']
    options = [w вместо w в current_words, если w.startswith(text)]
    если состояние < Лен (варианты):
        варианты возврата [состояние]
    возврат Нет

readline.set_completer(dynamic_completer)
readline.parse_and_bind('вкладка: завершена')

команда = input("Введите имя животного: ")
print("Вы вводите:", команда)

На что следует обратить внимание

readlineМодуль находится вLinux / macOSВышеуказанные пресеты доступны.
существоватьWindowsВключено, вам необходимо установить пакет:
```
pip install pyreadline3
```
Этот метод работает только в терминале (консоли) и не может использоваться в графическом интерфейсе или неинтерактивной среде.

Подвести итог

использоватьreadlineМодули позволяютinput()Поддерживает завершение табуляции.
Логику завершения можно настроить в зависимости от входного содержимого.
Windows требует дополнительной установкиpyreadline3набор.

Python-процесс

Цикл Python

для с диапазоном()

Самый распространенный цикл используется для запуска фиксированного количества раз или последовательности.

# от 0 до 4
для меня в диапазоне (5):
    печать(я) #0,1,2,3,4

#Укажите начальную точку, конечную точку и размер шага
для я в диапазоне (2, 10, 2):
    печать(я) #2,4,6,8

для с повторяемыми объектами

Непосредственно перебирать списки, строки, словари и т. д.

фрукты = ["яблоко", "банан", "вишня"]

для фруктов во фруктах:
    принт(фрукты)

для ch в «привет»:
    печать (ч)

#Перебор словаря
person = {"name": "Том", "возраст": 25}
для ключа значение в person.items():
    печать (ключ, значение)

пока цикл

Он всегда будет выполняться, если условие истинно.


count = 0
while count < 5:
    print(count)
    count += 1

перерыв и продолжить

Контролируйте процесс цикла.

для меня в диапазоне (10):
    если я == 3:
        продолжить # пропустить этот раз
    если я == 7:
        перерыв # Закончить раньше
    распечатать(я)

вложенный цикл

Вернитесь в круг и поместите его обратно в круг.


for i in range(3):
    for j in range(2):
        print(f"i={i}, j={j}")

Цикл сопоставления else

Вы можете добавить либо на время, либо на времяelse, будет выполнено только «нормальное завершение (без перерыва)».

для меня в диапазоне (5):
    распечатать(я)
еще:
    print("Цикл завершается нормально")

Понимание списка

Метод краткого письма позволяет завершить цикл и сгенерировать список в одну строку.


squares = [x**2 for x in range(5)]
print(squares)  # [0,1,4,9,16]

в заключение

for in range(): Подходит для фиксированного времени или последовательности.
для итерируемого объекта: подходит для обработки списков, строк и словарей.
while: Подходит для циклов с неопределенным количеством раз и заканчивающихся в соответствии с условиями.
break / continue / else: Управляйте процессом цикла.
Генерация списка: быстро генерируйте данные в одной строке.

Обработка исключений Python

основная грамматическая структура

Python использует оператор try...кроме для перехвата и обработки ошибок, возникающих во время выполнения программы, чтобы предотвратить ее сбой.

попробуйте:
    # Код, который может вызывать исключения
    результат=10/0
кроме ZeroDivisionError:
    # Код, выполняемый при возникновении определенного исключения
    print("Делитель не может быть равен нулю")
кроме исключения как e:
    #Перехватываем все остальные типы исключений
    print(f"Произошла ошибка: {e}")
еще:
    # Выполнить, если в блоке try не возникает исключений
    print("работает нормально")
наконец:
    # Будет выполнено независимо от возникновения исключения
    print("Очистить ресурсы или закрыть файлы")

Описание функции блока

попробуйте: поместите отслеживаемый фрагмент кода.
кроме: Определите логику для обработки определенных типов ошибок. Вы можете использовать as для получения сообщения об ошибке.
else: Необязательный блок, код программы будет выполняться только при отсутствии ошибок.
наконец: необязательный блок, обычно используемый для закрытия соединений с базой данных или файлов для обеспечения освобождения ресурсов.

Перехват нескольких исключений

Вы можете использовать кортежи в исключении для одновременной обработки нескольких типов ошибок.

попробуйте:
    # Выполняем операции
    пройти
кроме (ValueError, TypeError):
    print("Введенный тип данных или значение неверен")

Активно генерировать исключения

Используйте ключевое слово raise, чтобы вручную инициировать исключения на основе логических требований.

age = -1
if age < 0:
    raise ValueError("年齡數值不可為負數")

лучшие практики

Старайтесь перехватывать конкретные типы ошибок (например, FileNotFoundError), а не общие исключения.
Сохраняйте код в блоке try простым и включайте только несколько строк, которые могут вызвать ошибки.
Используйте инструкцииfinally или with для обработки чтения и записи файлов, чтобы гарантировать, что файлы по-прежнему могут быть правильно закрыты при возникновении программного исключения.

Категории Python

1. Основные понятия категорий

Классы Python — это структуры, используемые для инкапсуляции данных и поведения. Категории используются для создания объектов, которые являются экземплярами категорий. Например:

классМойКласс:
    def __init__(self, значение):
        self.value = значение

    Защитный дисплей (сам):
        print(f"Значение: {self.value}")

объект = МойКласс(10)
obj.display() # Вывод: Значение: 10

2. Статический метод

Статические методы определяются с помощью декоратора @staticmethod и не имеют ничего общего с категориями и объектами. Они не могут получить доступ к свойствам категории или свойствам объекта. Применяется к некоторым инструментальным функциям:

класс МойКласс:
    @staticmethod
    Защиту добавить(а, б):
        вернуть а + б

результат = MyClass.add(5, 3)
print(result) # Вывод: 8

3. Метод класса

Методы класса определяются с помощью декоратора @classmethod, первым параметром является сам класс (обычно называемый cls), а к атрибутам класса можно получить доступ:

класс МойКласс:
    количество = 0

    @classmethod
    защита приращения_count (cls):
        cls.count += 1

МойКласс.increment_count()
print(MyClass.count) # Вывод: 1

4. Наследование и политип

Python поддерживает наследование классов. Подклассы могут наследовать свойства и методы родительского класса и переопределять методы родительского класса:

Родитель класса:
    защита приветствия (сам):
        print("Привет от родителя!")

класс Ребенок (Родитель):
    защита приветствия (сам):
        print("Привет от Чайлда!")

объект = Ребенок()
obj.greet() # Вывод: Привет от ребенка!

5. Атрибуты категорий и атрибуты объектов

Атрибуты категории принадлежат всей категории и являются общими для всех объектов; Атрибуты объекта принадлежат каждому объекту:

класс МойКласс:
    class_attr = "Я атрибут класса"

    def __init__(self, значение):
        self.instance_attr = значение

obj1 = МойКласс(10)
obj2 = МойКласс(20)

print(MyClass.class_attr) # Вывод: я атрибут класса
print(obj1.instance_attr) # Вывод: 10
print(obj2.instance_attr) # Вывод: 20

6. Используйте объект в качестве базового класса

Все классы в Python по умолчанию наследуются от объекта, который является встроенным базовым классом, предоставляющим некоторые базовые методы, такие как __str__ и __eq__:

класс MyClass (объект):
    def __init__(self, значение):
        self.value = значение

    защита __str__(сам):
        return f"MyClass со значением {self.value}"

объект = МойКласс(5)
print(obj) # Вывод: MyClass со значением 5

7. Резюме

- **Статический метод**: независимый от категорий, в основном используется для функций инструмента. - **Метод класса**: манипулирование данными на уровне категории. - **Метод объекта (метод экземпляра)**: манипулирование данными на уровне объекта. - **Наследование и политип**: поддержка повторного использования кода и гибкого дизайна. - **базовый класс объекта**: предоставляет базовые методы, обеспечивающие единообразное поведение всех категорий.

Наследование классов

1. Основные понятия наследования

В Python наследование классов позволяет подклассам (производный класс) наследовать свойства и методы родительского класса (базовый класс) для повторного использования кода. Например:

Родитель класса:
    защита приветствия (сам):
        print("Привет от родителя!")

класс Ребенок (Родитель):
    пройти

с = Ребенок()
c.greet() # Вывод: Привет от родителя!

2. Подкласс переопределяет метод родительского класса.

Подклассы могут переопределять (Override) методы родительского класса и переписывать его функции:

Родитель класса:
    защита приветствия (сам):
        print("Привет от родителя!")

класс Ребенок (Родитель):
    защита приветствия (сам):
        print("Привет от Чайлда!")

с = Ребенок()
c.greet() # Вывод: Привет от ребенка!

3. Используйте super() для вызова метода родительского класса.

В подклассе вы можете вызвать метод родительского класса через super() и расширить поведение родительского класса:

Родитель класса:
    защита приветствия (сам):
        print("Привет от родителя!")

класс Ребенок (Родитель):
    защита приветствия (сам):
        супер().приветствие()
        print("Привет от Чайлда!")

с = Ребенок()
c.greet()
# Вывод:
# Привет от Родителя!
# Привет от Чайлда!

4. Множественное наследование

Python поддерживает множественное наследование, а подклассы могут наследовать несколько родительских классов одновременно:

класс Родитель1:
    защита приветствия (сам):
        print("Привет от Parent1!")

класс Родитель2:
    защита приветствия (сам):
        print("Привет от Parent2!")

класс Child(Parent1, Parent2):
    пройти

с = Ребенок()
c.greet() # Вывод: Привет от Parent1! (согласно очередности наследования)

5. Порядок разрешения метода (MRO)

Множественное наследование использует MRO (порядок разрешения методов) для определения порядка разрешения методов. Это можно проверить с помощью атрибута `__mro__`:

печать(Child.__mro__)
# Вывод: (, , , )

6. Абстрактный базовый класс

Используйте модуль abc для определения абстрактного базового класса, чтобы заставить подклассы реализовывать определенные методы:

из abc импорт ABC, абстрактный метод

класс AbstractParent(ABC):
    @abstractmethod
    защита приветствия (сам):
        пройти

класс Child(AbstractParent):
    защита приветствия (сам):
        print("Привет от Чайлда!")

с = Ребенок()
c.greet() # Вывод: Привет от ребенка!

7. Резюме

— Наследование делает код класса более пригодным для повторного использования и расширения. — Подклассы могут переопределять методы родительского класса и вызывать методы родительского класса с помощью super(). — Поддерживает множественное наследование, но необходимо обратить внимание на порядок разрешения методов (MRO). — Абстрактные базовые классы могут использоваться для того, чтобы заставить подклассы реализовывать определенные методы, что подходит для проектирования интерфейсов.

Создайте временный класс, наследующий ClassB.

Пример кода

классКлассB:
    защита приветствия (сам):
        print("Привет из класса B!")

# Динамически создать временный класс, унаследованный от ClassB
TempClass = type('TempClass', (ClassB,), {
    'greet': лямбда self: (print("Привет от TempClass!"), super(TempClass, self).greet())[0]
})

#Создаем экземпляр и тестируем
темп = ТемпКласс()
temp.greet()

объяснять

функция типа():
type('TempClass', (ClassB,), {...})
- 'TempClass': новое имя категории.
- (ClassB,): Кортеж базовых категорий, здесь есть только ClassB.
- {...}: Новые атрибуты или методы.
Лямбда-функции используются для переопределения методов:
- НастроитьgreetМетод состоит в том, чтобы сначала распечатать новое сообщение, а затем передатьsuper()вызвать родительскую категориюgreet。

Вывод результатов

Hello from TempClass!
Hello from ClassB!

Переключайтесь между использованием разных категорий с помощью одного и того же интерфейса.

иллюстрировать

Предположим, есть две категории.AClassиBClass, у них есть функции с одинаковым именем и параметрами. Мы хотим иметь возможность легко переключать используемые категории без необходимости изменения основной логики программы.

Пример программы

класс АКласс:
    процесс определения (я, данные):
        print(f"Обработка AClass: {data}")

    результат определения (сам):
        вернуть «результат из AClass»


класс BКласс:
    процесс определения (я, данные):
        print(f"Обработка BClass: {data}")

    результат определения (сам):
        вернуть «результат из BClass»


# Вы можете контролировать, какую категорию использовать, через настройки
USE_A = Истина

#Динамический выбор категорий
SelectedClass = AClass, если USE_A, иначе BClass

# Создайте экземпляр и используйте его
объект = ВыбранныйКласс()
obj.process("Тестовые данные")
печать(obj.result())

Результаты вывода (USE_A=True)

Обработка AClass: тестовые данные
Результаты AClass

Вывод результатов (USE_A=False)

Обработка BClass: тестовые данные
Результаты BClass

Более продвинутый способ записи: использование заводской функции.

защита get_class (имя):
    отображение = {
        «А»: Класс А,
        «Б»: BКласс
    }
    return Mapping.get(name, AClass) # По умолчанию — AClass

# Динамический выбор
cls = get_class("B")
объект = кл()
obj.process("Тестовые данные")

в заключение

Если две категории имеют одинаковый интерфейс, их можно переключать напрямую с помощью условных выражений или фабричных функций.
Сохранение согласованности имени функции и параметров позволяет вообще не менять основную программу.
Если вам нужен более гибкий дизайн, рассмотрите возможность использования «Интерфейса» или «Абстрактного класса (abc)».

Python использует абстрактные категории

короткий ответ

В Python,Не обязательно требуетсяНаписан как C++ или Javaabstract class. Python принимает «утиную типизацию». Пока объекты имеют одинаковые имена методов и поведение, их можно считать совместимыми.

пример набора текста утки

класс АКласс:
    процесс определения (я, данные):
        print(f"Обработка AClass: {data}")

класс BКласс:
    процесс определения (я, данные):
        print(f"Обработка BClass: {data}")

защита запуска (объект):
    obj.process("data") # Нет необходимости указывать тип, пока есть этот метод

запустить (АКласс())
запустить (BКласс())

Вывод результатов

Обработка класса A: данные
Обработка B-класса: данные

Ситуации с использованием абстрактных категорий (ABC)

Хотя Python не требует соблюдения типов, если вы хотите четко определить интерфейс при групповой разработке или больших проектах, вы можете использоватьabcМоды.

из abc импорт ABC, абстрактный метод

класс BaseClass (ABC):
    @abstractmethod
    процесс определения (я, данные):
        пройти

класс AClass(БазовыйКласс):
    процесс определения (я, данные):
        print(f"Обработка AClass: {data}")

класс BClass(БазовыйКласс):
    процесс определения (я, данные):
        print(f"Обработка BClass: {data}")

# BaseClass() сообщит об ошибке, поскольку абстрактный метод не реализован

в заключение

Python не требует использования абстрактных категорий, а динамически типизированный язык по своей сути поддерживает «разные категории для одного и того же интерфейса».
Если проект требует четких спецификаций интерфейса, высокой читаемости или автоматической проверки, рекомендуется использоватьabcМоды.
В небольших проектах или проектах быстрого развития утиная типизация может удовлетворить потребности.

Модули Python

определение

В Python,Модульэто файл, содержащий программный код, обычно с расширением файла.pyКонец. Модули могут определять функции, категории, переменные, а также могут содержать исполняемый код для облегчения повторного использования и структурирования программы.

использовать

Разделите программу на несколько файлов для облегчения обслуживания и чтения.
Предоставляйте повторно используемые библиотеки или инструменты.
Избегайте дублирования кода и повышайте эффективность разработки.
Поддержка управления пространством имен для уменьшения конфликтов имен.

Использование

Python черезimportКлючевое слово для представления модуля, например:

импорт математики

print(math.sqrt(16)) # Вывод 4.0

Пользовательские модули

Разработчики могут создавать свои собственные моды. Например, создайтеmymodule.py：


# mymodule.py
def greet(name):
    return f"Hello, {name}!"

Используйте в другом файле программы:


import mymodule

print(mymodule.greet("Alice"))

Общие встроенные группы

os: Обработка операций, связанных с операционной системой.
sys: доступ к информации, связанной с интерпретатором Python.
datetime: Дата и время обработки.
math: Предоставляет математические функции.
random: генерировать случайные числа.

Пакет Python

определение

В Python,УпаковкаЭто способ организации модулей. Пакет — это каталог, содержащий несколько модулей, что упрощает управление и обслуживание программы благодаря иерархической структуре.

особенность

Пакет — это каталог (папка).
В каталоге есть хотя бы один__init__.pyархив (опущен в Python 3.3+, но добавлен, чтобы помочь четко определить набор).
Пакеты могут содержать поднаборы для формирования иерархической структуры.

базовый пример

Создайте файл с именемmypackageКомплект:


mypackage/
│── __init__.py
│── module1.py
└── module2.py

module1.pyпример:


def add(a, b):
    return a + b

module2.pyпример:


def multiply(a, b):
    return a * b

Используйте комплект

импортировать mypackage.module1
импортировать mypackage.module2

print(mypackage.module1.add(2, 3)) # Вывод 5
print(mypackage.module2.multiply(2, 3)) # Вывод 6

Импортируйте определенные проекты из пакета

из импорта mypackage.module1 добавить
из mypackage.module2 импортировать умножить

print(add(10, 5)) # Вывод 15
print(multiply(10, 5)) # Вывод 50

Обычное использование

Интегрируйте связанные модули и управляйте ими для облегчения обслуживания.
Избегайте конфликтов имен и обеспечивайте четкие пространства имен.
Сделайте структуру крупных проектов более понятной.

Получить текущее имя пакета

иллюстрировать

В Python, чтобы получить текущий модульИмя пакета, вы можете использовать специальные переменные__package__. Это и__module__Концепция получения текущего имени модуля аналогична.

Пример: структура модуля и комплекта


mypackage/
│── __init__.py
└── submodule.py

submodule.pyсодержание:


print("__name__:", __name__)
print("__package__:", __package__)
print("__module__:", __module__)

Результат выполнения

Если используется в других программах какimport mypackage.submoduleИмпортируйте, результат примерно следующий:


__name__: mypackage.submodule
__package__: mypackage
__module__: __main__

объяснять

__name__: Полное имя модуля.
__package__: имя пакета, которому принадлежит текущий модуль. Если это модуль верхнего уровня, это будет пустая строка.
__module__: Обычно используется в определении класса или функции, чтобы указать, в каком модуле они определены.

Сценарии применения

Определите контекстное положение модулей в больших проектах.
При импорте относительного используйте__package__Помогите подтвердить пути к пакетам.

Версия пакета Python

Есть два основных способа проверить версию пакета Python: через терминал (командную строку) или запустив его в коде Python. Это поможет вам убедиться, соответствует ли среда требованиям проекта.

1. Проверка через терминал (Командная строка)

Это самый быстрый метод, не требующий входа в интерактивную среду Python.

Ознакомьтесь с конкретными пакетами: имя пакета pip show(Напримерpip show pandas）。
Список всех установленных пакетов: pip list。
Найдите конкретную версию пакета: список пипов | findstr "Имя пакета"(Окна) илисписок пипов | grep "имя пакета" (Linux/Mac)。
Среда Конды: имя пакета списка conda。

2. Проверьте код Python

Если вам необходимо определить версию при выполнении программы, вы можете использовать следующие два метода:

Используйте атрибут __version__:Большинство основных пакетов поддерживают это свойство.
```
import pandas
print(pandas.__version__)
```
Используйте importlib.metadata (рекомендуется):Это стандартный метод, встроенный в Python 3.8+, и его можно проверить без предварительного импорта пакета.
```
from importlib.metadata import version
print(version('pandas'))
```

3. Сравнительная таблица методов контроля

метод	Инструкции/Код	Применимые ситуации
Пип-команда	`pip show`	Просмотр подробной информации, такой как путь установки, автор, зависимости и т. д.
Список пипов	`pip list`	Получите краткий обзор всех пакетов и версий в вашей текущей среде.
внутренние свойства	`.__version__`	Делайте логические выводы во время работы сценария.
Metadata	`version()`	Стандартизированный способ проверки без загрузки всего пакета.

4. Проверьте собственную версию Python

Иногда проблема не в пакете, а в самом интерпретаторе Python:

Терминал: python --version
В рамках программы:
```
import sys
print(sys.version)
```

5. Часто задаваемые вопросы и напоминания

Множественные конфликты среды:еслиpip listОтображаемая версия отличается от версии, выполненной в VS Code. Пожалуйста, подтвердитеInterpreterПравильный ли выбор.
Пакет не установлен:Если вы используетеimportlibПроверка неустановленных пакетов выдаст ошибкуPackageNotFoundError。
С учетом регистра:существоватьpip showне чувствителен к регистру, но для некоторой логики кода могут потребоваться точные имена.

Получить имя пакета из категории и объекта модуля.

Объект класса

В Python доступ к объектам классов можно получить черезcls.__module__Найдите имя модуля, определяющего категорию, а затем используйтеsys.modulesПолучите объект модуля и, наконец, прочитайте его.__package__Свойство для получения имени пакета.

импортсистем

# Предположим, что категория определена в mypackage.submodule
классМойКласс:
    пройти

# Получить имя модуля, к которому принадлежит категория
имя_модуля = МойКласс.__модуль__
print("Имя модуля:", имя_модуля)

# Получить объект модуля
mod = sys.modules[имя_модуля]

# Получите имя пакета из объекта модуля
print("Имя пакета:", mod.__package__)

Объект модуля

Сам модуль является объектом, и к нему можно получить прямой доступ.__package__свойство.

импорт математики
импортировать mypackage.submodule как подмодуль

# math — это стандартный модуль библиотеки функций, пакета нет, поэтому __package__ — пустая строка
print("math.__package__:", math.__package__)

# Модули для пользовательских комплектов
print("sub.__package__:", sub.__package__)

Пример результата выполнения

Имя модуля: mypackage.submodule
Имя пакета: мойпакет
math.__package__:
sub.__package__: мой пакет

в заключение

категория → __module__ → sys.modules[...] → __package__
Объект модуля → __package__Получите напрямую

inspect.getfile

Когда файл Python выполняется напрямую, имя его модуля —__main__. Это делает использование толькоcls.__module__Невозможно получить исходное имя и путь к файлу.

Предположим, что структура вашего проекта:

/проект
  |-- test_runner.py <-- Файл, который вы запускаете напрямую (будет рассматриваться как __main__)
  |-- тест/
        |-- db_test.py <-- Файл, определяющий DbCmdAgent

Если вы выполните следующий код в `test_runner.py`:

из test.db_test импортировать DbCmdAgent
Agent_obj = DbCmdAgent(...) # Создание экземпляра

# В настоящее время cls.__module__ по-прежнему имеет значение «test.db_test» (правильное имя модуля)

Однако, если вы определите категории в `test_runner.py`:

# Содержимое test_runner.py
класс DbCmdAgent:
    пройти

агент_объект = DbCmdAgent()
#В настоящее время cls.__module__ == '__main__' (неверное имя модуля)

Это означает, что класс, для которого вы получаете информацию, определен в файле, который исполняется как `__main__`.

использовать`inspect`Модуль может напрямую получить путь к файлу

Независимо от того, определена ли категория в `__main__`, вы можете обойти атрибут `__module__` и использоватьinspectмодуль, чтобы получить путь к файлу исходного кода, соответствующий этой категории. Это более надежный и универсальный метод.

Исправленная реализация Python

импортная проверка
импортировать ОС

# --- Ситуация моделирования: категории, определенные в __main__ (исполняемый в данный момент скрипт) ---

класс DbCmdAgent:
    """Эта категория определена в исполняемом в данный момент основном скрипте"""
    def __init__(сам, данные):
        self.data = данные

Agent_obj = DbCmdAgent("некоторые_данные")

защита get_class_location_robust(obj):
    """
    Используйте Inspect.getfile, чтобы обойти проблему __module__ == '__main__'.
    """
    cls = тип (объект)
    
    # 1. Используйте Inspect.getfile(), чтобы получить путь к файлу, определяющему категорию.
    попробуйте:
        путь_файла = проверить.getfile(cls)
        
        # 2. Получите имя файла и каталог
        имя_файла = os.path.basename(путь_файла)
        каталог = os.path.dirname(путь_файла)
        py_name = os.path.splitext(имя_файла)[0]
        
        # 3. Если __module__ — это __main__, замените его именем архива, чтобы предоставить больше контекста.
        имя_модуля = cls.__module__
        если имя_модуля == '__main__':
            имя_модуля = имя_py_# Используйте db_test или test_runner в качестве контекста
            
    кромеТипОшибка:
        # Обработка встроенных типов
        file_path = "Н/Д (встроенное расширение или расширение C)"
        имя_файла = "Н/Д"
        каталог = "Н/Д"
        py_name = "Н/Д"
        имя_модуля = cls.__module__
        
    вернуть {
        "имя_модуля_или_основной": имя_модуля,
        "py_name_no_ext": py_name,
        «каталог»: каталог,
        «путь_файла»: путь_файла,
    }

# Выполняем и просматриваем результаты
location_info = get_class_location_robust(agent_obj)

print("--- Информация о файле определения категории ---")
print(f"Имя файла (имя .py): {location_info['py_name_no_ext']}")
print(f"Путь к каталогу (Пакет): {location_info['directory']}")
print(f"Полный путь к файлу: {location_info['file_path']}")

4. Краткое изложение ключевых моментов

использоватьinspect.getfile(type(obj)): это наиболее надежный способ получить исходный путь к файлу определений напрямую, совершенно независимо от того, рассматривается ли модуль.__main__。
__module__Это отражает только пространство имен модуля класса в текущей программе, но не обязательно его фактическое имя в структуре проекта.

Модуль динамического импорта

Описание функции

Этот метод используетimportlib.import_moduleПопробуйте импортировать указанный модуль. Если вы столкнетесьModuleNotFoundError, попытается импортировать свои подмодули из текущего загруженного пакета.

Пример программы

импортировать импортную библиотеку
импортсистем

защита Safe_import (имя_модуля):
    попробуйте:
        # Попробуйте импортировать напрямую
        вернуть importlib.import_module(имя_модуля)
    кроме ModuleNotFoundError:
        # Если не удалось, попробуйте импортировать подмодуль из известного пакета
        для пакета в списке (sys.modules.keys()):
            если pkg, а не pkg.startswith("_"):
                попробуйте:
                    return importlib.import_module(f"{pkg}.{module_name}")
                кроме ModuleNotFoundError:
                    продолжать
        поднять # Если все еще не найдено, выдать исключение

Примеры использования

импортировать число

mod1 = Safe_import("random") # Это может быть успешным, потому что это стандартная библиотека
mod2 = Safe_import("linalg") # Попробую numpy.linalg
print(mod2.__name__) # Вывод numpy.linalg

иллюстрировать

sys.modulesСохраните все загруженные модули.
В случае сбоя импорта будет предпринята попытка с помощьюpackage.module_nameметод, попробуйте еще раз.
Этот метод имитирует механизм автоматического поиска подмодулей Python.

Путь поиска модуля Python: состав sys.path

В Python,sys.path— это список, содержащий все пути к каталогам, которые интерпретатор Python будет искать по порядку при попытке импортировать модуль. Когда вы выполняетеimport some_module, Python проверит по порядкуsys.pathкаждый каталог в списке, пока не найдете каталог с именемsome_moduleфайлы (например,some_module.py、some_module/__init__.pyждать).

Три основных компонента sys.path

sys.pathСписки обычно состоят из следующих трех частей и ищутся в следующем порядке:

1. Каталог входа (точка входа) программного кода.

Каталог для выполнения скрипта: первый элемент списка (sys.path[0]) обычно является выполняющимся в данный момент скриптом Python (например,main.py) находится в каталоге.
Интерактивный режим: если вы находитесь в интерактивном интерпретаторе или блокноте Jupyter, этим элементом будет пустая строка.'', который представляет текущий рабочий каталог (текущий рабочий каталог, CWD).

2. Переменная среды PYTHONPATH.

Python прочитает файл с именемPYTHONPATHпеременные системной среды.
Все пути к каталогам, определенные в этой переменной, будут добавлены вsys.pathсередина.
использовать:PYTHONPATHОбычно используется для постоянного добавления в путь поиска некоторых часто используемых каталогов проектов или библиотек, расположенных в нестандартных местах, без необходимости вручную устанавливать их в каждом проекте.

3. Стандартная библиотека функций и каталог установки.

Стандартная библиотека: содержит все встроенные модули Python (например,os, sys, json, socket) каталог установки.
Каталог установки сторонних пакетов (site-packages): это все.pipУстановлены сторонние пакеты (например.fastapi, numpy, pandas) каталог установки. В виртуальной среде он обычно расположен вlib/site-packagesкаталог.

---

Системные переменные, связанные с sys.path

В дополнение к вышесказанномуPYTHONPATHКроме того, существует несколько переменных среды, связанных со средой выполнения Python, которые влияют на поведение интерпретатора и поиск пути, но влияютsys.pathОсновные переменные, составляющиеPYTHONPATH：

Системные переменные	Описание функции	Связь с sys.path
`PYTHONPATH`	Определяет дополнительные каталоги, которые будут добавлены в путь поиска модов.	прямое воздействие`sys.path`состав.
`PYTHONHOME`	Используется для установки альтернативного пути к каталогу установки Python, особенно для встроенных систем.	Косвенно влияет на стандартную библиотеку и`site-packages`расположение.
`PATH`	Используется операционной системой для поиска исполняемых файлов (например,`python.exe`) путь.	не влияет напрямую`sys.path`, но влияет на то, какой интерпретатор Python выполняется.
`VIRTUAL_ENV`	Когда вы находитесь в виртуальной среде, эта переменная указывает на корневой каталог виртуальной среды.	косвенное воздействие`sys.path`, поскольку это обеспечивает`site-packages`Оно исходит из виртуальной среды, а не всей системы.

Как изменить sys.path

потому чтоsys.path— это обычный список Python, который вы можете динамически изменять во время работы программы, но такие изменения вступают в силу только в рамках текущего сеанса интерпретатора:

импортсистем
импортировать ОС

# Добавьте родительский каталог в путь поиска (обычно используется для тестирования или внутренней ссылки на проект)
sys.path.append(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))

Мод Тень

Затенение модулей (или затенение имен) — распространенная ошибка или проблема программирования в Python. Это происходит, когда вы случайно создаете файл кода или имя переменной, которое конфликтует с именем встроенного модуля или сторонней библиотеки, которую вы пытаетесь импортировать или использовать.

1. Определение и причины возникновения

Определение: Когда интерпретатор Python пытается загрузить модуль, он следует определенному порядку поиска (sys.path), чтобы найти мод.
Возникает тень: если в каталоге вашего проекта есть стандартный модуль, соответствующий тому, который вы собираетесь импортировать (например,socket, json, random) или файл или каталог с тем же именем, что и у сторонней библиотеки (например, вы создаете файл с именемsocket.pyфайл), Python сначала загрузит ваш локальный файл.

В результате ваш локальный файл «закрывает» или «переопределяет» стандартный модуль, который должен быть загружен, что делает ваш код неспособным получить доступ к функциям стандартного модуля (например,socket.AF_UNSPEC) завершится ошибкой, поскольку загруженный вами локальный файл не имеет этих свойств.

2. Распространенные примеры

Имя стандартного модуля	Имя локального файла, вызвавшего тень	в результате
`socket`	`socket.py`	Невозможно использовать стандартный`socket`Сетевые константы модуля (например,`AF_INET`, `AI_PASSIVE`）。
`json`	`json.py`	Невозможно использовать стандартный`json`Модульный`loads`или`dumps`функция.
`test`(название проекта)	`test.py`	В среде модульного тестирования могут возникнуть конфликты с внутренней логикой среды тестирования.

3. Решение

Переименуйте архив: Это самое простое и эффективное решение. Просто переименуйте локальные файлы или каталоги, которые конфликтуют со стандартными именами модулей или библиотек. Например, изменитьsocket.pyпереименованnetwork_handler.py。
Проверьте sys.path: сделайте это в своем кодеimport sys; print(sys.path)Проверьте путь поиска Python, чтобы убедиться, что он загружает ваши локальные файлы вместо каталога стандартной библиотеки.
Используйте виртуальную среду. Хотя виртуальная среда сама по себе не предотвращает теневое копирование локальных архивов, она может гарантировать, что устанавливаемые вами сторонние пакеты не будут конфликтовать с другими средами.

Получить имя текущей записи .py

иллюстрировать

Чтобы получить текущее выполнение программы Python__main__Имя файла .py, которому он принадлежит, которое можно использовать.__main__.__file__илиsys.argv[0]. Но в интерактивном режиме Jupyter или-cМожет не существовать во время выполнения и поэтому требует безопасного обращения.

Получить текущее имя основного файла .py (безопасная версия)

импортировать ОС
импортсистем
импортировать __main__

защита get_main_py_path():
    """Возвращает абсолютный путь к файлу .py, которому принадлежит main. Если его невозможно найти, возвращается None"""

    # Случай 1: Нормальное выполнение .py
    main_file = getattr(__main__, "__file__", нет)
    если основной_файл:
        вернуть os.path.abspath(main_file)

    # Случай 2: Решение sys.argv[0]
    если len(sys.argv) > 0:
        argv0 = sys.argv[0]
        если argv0 отсутствует ("", "-c", ""):
            кандидат = os.path.abspath(argv0)
            если os.path.exists(кандидат):
                возвратный кандидат

    # Случай 3: Интерактивный режим, Jupyter, встраивание и т. д.
    возврат Нет

# Пример
путь = get_main_py_path()
если путь:
    print("Основной путь:", путь)
    print("основное имя файла:", os.path.basename(path))
еще:
    print("main.py не найден (возможно, в интерактивной среде или не запущен из архива)")

Просто имя файла (базовое имя)

path = get_main_py_path()
filename = os.path.basename(path) if path else None
print(filename)

Подвести итог

__main__.__file__Это самый надежный способ, но он не всегда существует.
sys.argv[0]это метод резервного копирования, но вам необходимо подтвердить, что значение не-cили<stdin>。
Interactive (REPL/Jupyter) не может получить имя .py и возвращает None.

Получить имена параметров и значения текущей функции

To get the parameter names and their corresponding values of a function in Python, you can use the `inspect` module, which provides introspection utilities. Specifically, `inspect.signature()` can help you retrieve the names of the parameters, and you can pass the current frame's local variables to get their values.

Here is an example that demonstrates how to get the function name, parameter names, and their values:

```python
import inspect

# Sample function
def my_function(a, b, c=5):
    # Get the current frame
    frame = inspect.currentframe()
    
    # Get the function name
    func_name = frame.f_code.co_name
    print(f"Function name: {func_name}")
    
    # Get the parameter names and their values
    args, _, _, values = inspect.getargvalues(frame)
    
    # Print parameter names and values
    for arg in args:
        print(f"Parameter name: {arg}, Value: {values[arg]}")

# Call the function
my_function(1, 2)
```

### Output:
```
Function name: my_function
Parameter name: a, Value: 1
Parameter name: b, Value: 2
Parameter name: c, Value: 5
```

### Explanation:
1. **`inspect.currentframe()`**: Retrieves the current execution frame.
2. **`frame.f_code.co_name`**: Extracts the name of the current function.
3. **`inspect.getargvalues(frame)`**: Gets the argument names and their corresponding values from the frame. This function returns a tuple containing:
   - `args`: List of argument names.
   - `_`: Placeholder for unused information.
   - `values`: Dictionary containing argument names as keys and their values.

This allows you to print both the names of the function's parameters and their values at runtime.

Получить тип параметров функции

Использование модуля проверки

В Python вы можете использоватьinspect.signature()Получить информацию о параметрах функции, и дальше отParameter.annotationСвойство получает аннотацию типа (подсказку типа) для каждого параметра.

импортная проверка

def my_function(a: int, b: str, c: float = 3.14) -> bool:
    вернуть ул(а) == б

сиг = проверить.подпись(my_function)

для имени, параметра в sig.parameters.items():
    print(f"Имя параметра: {имя}")
    print(f"Значение по умолчанию: {param.default}")
    print(f"Введите аннотацию: {param.annotation}")
    печать()

Вывод результатов

Имя параметра: а
  По умолчанию: <class 'inspect._empty'>
  Введите аннотацию: <class 'int'>

Имя параметра: б
  По умолчанию: <class 'inspect._empty'>
  Введите аннотацию: <class 'str'>

Имя параметра: c
  По умолчанию: 3.14
  Введите аннотацию: <class 'float'>

иллюстрировать

param.annotationПолучит аннотации типов (например,int、str）。
Если параметр не имеет аннотации типа, он будетinspect._empty。
доступныйget_type_hints()Получите полный словарь подсказок типов.

Используйте get_type_hints

Этот метод автоматически разрешает прямые ссылки (типы, помеченные как строки).


from typing import get_type_hints

hints = get_type_hints(my_function)
print(hints)

Вывод результатов


{'a': <class 'int'>, 'b': <class 'str'>, 'c': <class 'float'>, 'return': <class 'bool'>}

Подвести итог

inspect.signature()Можно получить порядок и имя параметра.
param.annotationВы можете проверить аннотацию типа каждого параметра.
get_type_hints()Легче получить все подсказки типов (включая возвращаемые значения) одновременно.

Получить имя класса объекта

иллюстрировать

В Python вы можете использовать объект__class__атрибут илиtype()функция, Получите категорию (класс), к которой он принадлежит, а затем получите имя категории.

пример

класс Животное:
    пройти

класс Собака(Животное):
    пройти

объект = Собака()

#Метод 1: Используйте __class__.__name__
print(obj.__class__.__name__) # Вывод: Собака

#Метод 2: использовать type()
print(type(obj).__name__) # Вывод: Собака

#Метод 3. Получите полное имя модуля и категории.
print(obj.__class__) # Вывод: <class '__main__.Dog'>
print(obj.__class__.__module__) # Вывод: __main__

Вывод результатов


Dog
Dog
<class '__main__.Dog'>
__main__

иллюстрировать

obj.__class__: получить объект категории объекта.
obj.__class__.__name__: Получить строку названия категории.
type(obj)Эквивалентноobj.__class__。
__module__: можно получить имя модуля, в котором определена категория.

Расширенные приложения

Чтобы одновременно получить полное «имя модуля + категории», вы можете написать:


cls = type(obj)
full_name = f"{cls.__module__}.{cls.__name__}"
print(full_name)

Вывод результатов


__main__.Dog

Подвести итог

type(obj).__name__Это самый простой способ получить имя категории.
Если вам необходимо полностью определить источник категории (включая модули), вы можете использоватьf"{obj.__class__.__module__}.{obj.__class__.__name__}"。

Определить категорию, к которой принадлежит атрибут

Ниже приведен пример кода, который использует Python для определения того, к какому классу наследования принадлежит свойство:

Пример кода

импортная проверка

класс Базовыйкласс:
    base_attr = "Я атрибут из BaseClass"

Подкласс класса (Базовыйкласс):
    sub_attr = "Я атрибут из подкласса"

# Определить функцию для поиска категории, к которой принадлежит атрибут
защита find_attribute_owner(cls, attr_name):
    для базы в Inspect.getmro(cls): # Получить MRO (порядок разрешения метода)
        если attr_name в base.__dict__:
            возвратная база
    возврат Нет

# тест
sub_obj = Подкласс()
атрибуты = sub_obj.__class__.__dict__.items() # Получить все атрибуты на уровне категории
для имени, значения в атрибутах:
    владелец = find_attribute_owner(sub_obj.__class__, имя)
    print(f"Атрибут '{name}' принадлежит категории: {owner.__name__}")

Описание программы

inspect.getmro(cls):Получает MRO (порядок разрешения методов) категории, который является унаследованным порядком иерархии категорий.
base.__dict__:Каждая категория имеет свою__dict__, в котором хранятся атрибуты, определенные категорией.
Функция проверяет каждую категорию в MRO, чтобы определить, в какой категории определен атрибут.

Результат выполнения

Для категорий в примере результаты выполнения следующие:

Атрибут «__module__» принадлежит классу: SubClass.
Атрибут «sub_attr» принадлежит классу: SubClass.
Атрибут «__doc__» принадлежит классу: SubClass.
Атрибут «base_attr» принадлежит классу: BaseClass.

Получить аннотацию функции (Docstring)

Используйте doc

class MyClass:
    def fun1(self):
        '''
        Fun1 comment
        '''
        pass

obj = MyClass()
print(obj.fun1.__doc__)

Использование модуля проверки

import inspect

class MyClass:
    def fun1(self):
        '''
        Fun1 comment
        '''
        pass

print(inspect.getdoc(MyClass.fun1))

Функция помечена как устаревшая

Использование модуля предупреждений

В Python вы можете использовать встроенныйwarningsМодули, которые предупреждают пользователей во время выполнения (а не во время компиляции) о том, что функция устарела, и предлагают новые альтернативы.

импортировать предупреждения

защита old_function(x, y):
    предупреждения.предупреждать(
        «Функция old_function() устарела, используйте вместо нее new_function(x, y).»,
        категория = Предупреждение об устаревании,
        уровень стека = 2
    )
    вернуть х + у

защита new_function(x, y):
    вернуть х + у

Пример выполнения


result = old_function(3, 4)
print(result)

Вывод результатов

Предупреждение об устаревании: функция old_function() устарела, вместо нее используйте new_function(x, y).
  результат = старая_функция (3, 4)
7

Дополнительная информация

warnings.warn()Предупреждение отображается на этапе выполнения и не прерывает программу.
category=DeprecationWarningИспользуется для обозначения предупреждений об устаревании.
stacklevel=2Пусть предупреждающее сообщение укажет на местоположение вызывающего абонента, а не внутри функции.
Если вы хотите рассматривать предупреждения как ошибки во время разработки, используйте:
```
python -W error::DeprecationWarning your_script.py
```

Дополнительно: Создайте декоратор для автоматической пометки устаревших функций.

Декораторы можно использовать, чтобы позволить нескольким старым функциям использовать одну и ту же логику запроса на прекращение поддержки:

импортировать предупреждения
из оберток импорта functools

защита устарела (новое_имя_функции):
    декоратор защиты (функция):
        @wraps(функция)
        def-обертка(*args, **kwargs):
            предупреждения.предупреждать(
                f"Функция {func.__name__}() устарела, используйте вместо нее {new_func_name}().",
                категория = Предупреждение об устаревании,
                уровень стека = 2
            )
            return func(*args, **kwargs)
        возвратная обертка
    вернуть декоратор

@deprecated("новая_функция")
защита old_function(x, y):
    вернуть х + у

Разница между @staticmethod и @classmethod

В Python,@staticmethodи@classmethodОба декоратора могут определять методы, которые можно вызывать без создания экземпляра класса, но их назначение и поведение различаются.

@staticmethod

определение：@staticmethodне принимает какой-либо неявный первый аргумент (нетselfилиcls) метод. Это как обычная функция, просто принадлежащая пространству имен класса.
использование: Статические методы не могут изменять состояние класса или экземпляра и обычно используются для функциональности, связанной с классом, но не требуют доступа или изменения класса или экземпляра.
Когда использовать: используйте, когда вам не нужен доступ к категории или экземпляру, но вы хотите отнести связанные функции к категории.@staticmethod。

Пример @staticmethod:

класс МойКласс:
    @staticmethod
    защита static_method(x, y):
        вернуть х + у

# Статические методы можно вызывать без создания экземпляра
result = MyClass.static_method(5, 10) # Результат: 15

сосредоточиться：@staticmethodКатегория недоступна (cls) или экземпляр (self）。

@classmethod

определение：@classmethod— это сама категория принятия (cls) в качестве первого параметра. Это позволяет ему получать доступ к статусу категории и изменять его.
использованиеМетоды :Category могут изменять состояние иерархии категорий (например, переменных категории) и могут вызываться для экземпляра или категории.
Когда использовать: используйте, когда вам нужно получить доступ к данным уровня категории или изменить их (например, переменные категории) или создать альтернативный конструктор для категории.@classmethod。

Пример @classmethod:

классМойКласс:
    класс_переменная = 0

    def __init__(self, значение):
        self.value = значение
        MyClass.class_variable += 1

    @classmethod
    защита get_class_variable (cls):
        вернуть cls.class_variable

#Создать экземпляр
obj1 = МойКласс(10)
obj2 = МойКласс(20)

# Метод категории вызова
print(MyClass.get_class_variable()) # Результат: 2

сосредоточиться：@classmethodМожет получить доступ к статусу уровня категории (cls）。

Подвести итог

особенность	@staticmethod	@classmethod
первый параметр	Нет неявного первого аргумента	`cls`(сама категория)
экземпляр доступа	никто	никто
Категория доступа	никто	иметь
использование	Служебные функции, связанные с категориями, но не требующие экземпляров или категорий.	Необходимо манипулировать данными уровня категории или предоставить альтернативные конструкторы.

Статический класс выполняет инициализацию

Сам Python не предоставляет «статический метод по умолчанию» или «метод класса по умолчанию», то есть функцию автоматического выполнения метода при первом вызове любого статического метода или метода класса. Но мы можем добиться аналогичного поведения с помощью методов ленивой загрузки.

Решение: используйте статические переменные и отложенную загрузку.

Вы можете определить статическую переменную в классе для отслеживания инициализированного состояния, а затем выполнить логику инициализации при первом вызове статического метода или метода класса.

пример:

класс МойКласс:
    инициализирован = False # Статическая переменная, отслеживающая, была ли она инициализирована

    @staticmethod
    защита init_once():
        если не MyClass.initialized:
            print("Выполнение логики инициализации...")
            MyClass.initialized = Истина

    @classmethod
    защита class_method (cls):
        cls.init_once()
        print("Вызов метода класса")

    @staticmethod
    защита static_method():
        МойКласс.init_once()
        print("Вызвать статический метод")

# Вызовите метод категории в первый раз, чтобы запустить инициализацию
MyClass.class_method() # Вывод: выполнение логики инициализации... Вызов метода класса

# Вызываем метод категории второй раз и больше не выполняем инициализацию
MyClass.class_method() # Вывод: вызов метода класса

# При первом вызове статического метода инициализация не выполняется, поскольку он уже инициализирован.
MyClass.static_method() # Вывод: вызов статического метода

Как это работает:

статические переменныеinitialized: This variable is used to track whether the category has been initialized. Начальное значениеFalse。
init_once()метод: Этот метод отвечает за выполнение логики инициализации и будетinitializedустановлен наTrue, чтобы предотвратить повторную инициализацию.
Статические методы и методы класса: каждый раз, когда вызываются эти методы, сначала проверяется, требуется ли инициализация, чтобы гарантировать, что логика инициализации будет выполнена только один раз.

Подвести итог

Хотя Python не имеет встроенного «статического метода по умолчанию» или «метода класса по умолчанию», с помощью статических переменных и методов отложенной загрузки вы можете автоматически выполнять логику инициализации при первом вызове статического метода или метода класса и гарантировать, что эта логика будет выполнена только один раз.

Python-поток

В Python поток — это механизм, используемый для реализации параллелизма. Это позволяет программе выполнять несколько задач одновременно в рамках одного процесса (Процесса). Это очень полезно для выполнения операций с интенсивным вводом-выводом (таких как сетевое соединение, чтение и запись файлов) и может предотвратить блокировку программы (блокировку) в ожидании завершения внешних операций.

1. Зачем использовать потоки?

Неблокирующий ввод-вывод: пока программа ожидает ответа сети или чтения и записи с диска, другие потоки могут продолжать выполнять вычисления для повышения эффективности.
Пользовательский интерфейс: сохраняйте отзывчивость пользовательского интерфейса, даже если основная программа выполняет трудоемкие фоновые задачи.
Параллельные задачи: одновременная обработка нескольких независимых задач, например запросов на подключение нескольких клиентов.

2. Ограничения потоков Python: GIL (глобальная блокировка интерпретатора)

В стандартном интерпретаторе CPython имеется «Глобальная блокировка интерпретатора» (Global Interpreter Lock, GIL). GIL гарантирует, что только один поток может выполнять биткод Python в любой момент времени. Это означает:

Потоки хорошо справляются с задачами с интенсивным вводом-выводом (поскольку Python может освобождать GIL во время ожидания ввода-вывода, позволяя выполняться другим потокам).
Влияние потоков на ускорение задач, интенсивно использующих ЦП, неочевидно (поскольку GIL ограничивает возможности параллельных вычислений многоядерных ЦП). Для задач с интенсивным использованием процессора рекомендуется использовать многопроцессный режим (multiprocessingмодуль).

3. Модуль потока выполнения:`threading`

Python использует стандартную библиотеку функцийthreadingМодуль для обработки потоков выполнения. Существует два основных метода создания потоков:

Способ 1: передать функцию как цель (целевая функция)

Это самое простое и распространенное использование.

импорт потоков
время импорта

задача def (имя, задержка):
    """Целевая функция, выполняемая потоком"""
    print(f"Тема {имя}: Начало...")
    time.sleep(delay) # Имитация трудоемких операций ввода-вывода
    print(f"Тема {name}: Задача выполнена.")

#Создаем поток выполнения
thread1 = threading.Thread(target=task, args=("T1", 2))
thread2 = threading.Thread(target=task, args=("T2", 4))

# Начать ветку
поток1.start()
поток2.start()

# Дождитесь завершения всех потоков (заблокируйте основной поток, пока они не завершатся)
поток1.join()
поток2.join()

print("Все потоки выполнения завершены. Основная программа завершается.")

Способ 2: Наследование`threading.Thread`категория

Подходит для более сложных сценариев, инкапсулируя логику потока выполнения в категорию.

импорт потоков
время импорта

класс MyThread(threading.Thread):
    def __init__(я, имя, задержка):
        супер().__init__()
        self.name = имя
        self.delay = задержка

    защита запуска (сам):
        """
        При запуске потока автоматически вызывается метод run().
        Здесь вы определяете задачи, которые будет выполнять поток.
        """
        print(f"Поток {self.name}: Начало...")
        time.sleep(self.delay)
        print(f"Тема {self.name}: Задача выполнена.")

#Создаем и запускаем поток
поток3 = МойПоток("T3", 3)
поток3.start()
поток3.join()

print("Пользовательский поток выполнения завершен.")

4. Синхронизация потоков и обмен данными

Когда несколько потоков получают доступ к общим данным и изменяют их, могут возникнуть условия гонки. Вам необходимо использовать механизм синхронизации для защиты ваших данных:

Lock: Блокировка — это самый простой примитив синхронизации. Вызывается перед тем, как поток получит доступ к общему ресурсуlock.acquire(), позвоните после завершенияlock.release()。
RLock(Реентерабельная блокировка): позволяет одному и тому же потоку получать блокировку несколько раз.
Semaphore(Журнал): используется для ограничения количества потоков, которые могут одновременно получать доступ к ресурсам.

Использование примера блокировки

импорт потоков

# Общие ресурсы
счетчик = 0
# Создать блокировку
блокировка = резьба.Lock()

защита приращения_счетчика():
    глобальный счетчик
    # Получите блокировку, чтобы гарантировать, что только один поток может выполнить этот блок одновременно
    блокировка.приобретать()
    попробуйте:
        # Раздел соревнований
        текущее_значение = счетчик
        time.sleep(0.001) # Имитация переключения
        счетчик = текущее_значение + 1
    наконец:
        # Снять блокировку
        блокировка.выпуск()

темы = []
для меня в диапазоне (100):
    t = threading.Thread(target=increment_counter)
    потоки.append(т)
    т.старт()

за т в темах:
    t.join()

print(f"Окончательное значение счетчика: {counter}") # Если блокировки нет, это значение не может быть 100

Запуск, синхронизация и остановка потоков Python

ПитонthreadingМодуль предоставляет функцию создания и управления потоками выполнения, но из-за ограничений операционной системы и философии проектирования Python не предоставляет безопасный, прямой и принудительный метод остановки (уничтожения) внешних потоков выполнения. Принудительная остановка может привести к утечке ресурсов или повреждению данных.

Следовательно, остановка потока выполнения должна достигаться с помощью **Механизма сотрудничества****, то есть позволяя потоку выполнения самостоятельно проверять флаг остановки и корректно завершать работу.

1. Механизм остановки потока: использование флагов (Flag)

Это самый безопасный и наиболее рекомендуемый метод остановки потока. Он требует, чтобы поток периодически проверял внешнюю переменную (флаг) в цикле выполнения задачи.

Примеры реализации Python

импорт потоков
время импорта

# Общий флаг остановки
stop_flag = поток.Событие()

def Monitored_task (имя, задержка):
    """
    Функция задачи, которая периодически проверяет флаг остановки.
    """
    print(f"Тема {имя}: Начало...")
    я = 0
    while not stop_flag.is_set(): # Проверяем, установлен ли флаг
        я += 1
        print(f"Поток {name}: шаг выполнения {i}")
        
        # Моделируйте трудоемкие операции и регулярно проверяйте
        time.sleep(задержка)
        
        # Здесь вы можете установить ограничение на количество выполнений, чтобы не было бесконечного цикла
        если я >= 5:
            сломать
            
    print(f"Поток выполнения {name}: получил сигнал остановки или задача завершилась и корректно завершился.")

# --- Главный блок управления программой ---

#Создаем поток выполнения
worker_thread = threading.Thread(target=monitored_task, args=("Worker-1", 1))

# Начать ветку
рабочий_поток.start()

print("\nОсновная программа: поток выполнения запущен, подождите 3 секунды...\n")
time.sleep(3) # Пусть поток поработает некоторое время

# Отправить сигнал остановки
print("\nОсновная программа: Установить флаг остановки...\n")
stop_flag.set() # Установить событие и позволить is_set() вернуть True

# Подождите, пока поток корректно завершится и завершится (обычно быстро)
рабочий_поток.join()

print("\nОсновная программа: поток благополучно остановлен и присоединен. Программа завершена.")

2. Описание ключевых компонентов

threading.Event(): простой примитив синхронизации. Внутри него поддерживается флаг Боллинджера.
- stop_flag.is_set(): проверьте, имеет ли флаг значение True (т. е. выдается ли сигнал остановки).
- stop_flag.set():Установите флаг в значение True, чтобы отправить сигнал остановки.
while not stop_flag.is_set():: это основная управляющая структура потока. Пока не получен сигнал остановки, цикл будет продолжать выполняться.
worker_thread.join(): убедитесь, что основная программа будет ждать завершения рабочего потока (корректного завершения), прежде чем продолжить выполнение. Это важный шаг для обеспечения чистого завершения процедуры.

3. Другие механизмы остановки (принудительная остановка не рекомендуется)

Хотя существуют некоторые экспериментальные или небезопасные способы принудительной остановки, такие как использование `_thread.stop()` или создание исключения, эти методы могут привести к:

Блокировка ресурса: если поток выполнения вынужден остановиться, удерживая блокировку (Lock), блокировка никогда не будет снята, что приведет к постоянной блокировке других потоков выполнения.
Повреждение данных. Поток может быть прерван в процессе изменения общих данных, что приведет к несогласованному состоянию.

Поэтому в Python вам всегда следует использовать скоординированный механизм пометки для остановки потоков.

Решение многопоточного конфликта общих объектов

1. Наиболее часто используемое решение: локальное хранилище потоков.

Это наиболее рекомендуемый подход в многопоточных средах. Вместо того, чтобы все потоки захватывали один и тот же объект, каждый поток имеет независимую копию объекта. В Python вы можете использоватьthreading.local()достичь.

импорт потоков

# Создайте область потока для хранения объектов
thread_data = threading.local()

защита get_service():
    # Если текущий поток не имеет собственного сервиса, создайте его
    если нет, hasattr(thread_data, 'service'):
        print(f"Создать новое соединение для потока {threading.current_thread().name}")
        thread_data.service = create_new_connection()
    вернуть поток_данных.сервис

задача определения():
    сервис = get_service()
    # Выполняем операции...

2. Второй по распространенности способ: запорный механизм (Locking).

Если объект должен быть одинаковым (например, запись в один и тот же файл или работа с одним и тем же глобальным счетчиком), вы должны использоватьLock. Это гарантирует, что только один поток может одновременно получить доступ к объекту, избегая условий гонки.

блокировка = резьба.Lock()

защита Safe_task():
    с замком:
        # Внутри этого блока другие потоки должны ждать
        общий_объект.do_something()

---

Альтернативы многопоточности: асинхронная и многопроцессорная обработка

Если вы хотите избежать риска конфликтов блокировок или сбоев, связанных с несколькими потоками, следует рассмотреть две основные альтернативы:

1. Асинхронные сопрограммы (Asyncio) — подходят для задач с интенсивным вводом-выводом.

В настоящее время это самый популярный подход в Python (например, основной принцип FastAPI). Он работает в одном потоке и ожидает ввода-вывода (например, запросов API, запросов к базе данных), переключая задачи.

преимущество: нет проблем с конкуренцией потоков, нет необходимости использовать блокировки и очень низкое потребление памяти.
Подходит для сцены: большое количество запросов API, сканеров и веб-серверов.

импортировать асинхронный код

асинхронная защита fetch_api (url):
    # Используйте асинхронные библиотеки, такие как aiohttp
    ответ = ожидайте call_api (url)
    обратный ответ

асинхронное определение main():
    # Выполнять несколько задач одновременно, но переключаться внутри одного потока
    результаты = ждут asyncio.gather(fetch_api("url1"), fetch_api("url2"))

2. Многопроцессорность – подходит для задач с интенсивными вычислениями.

Поток выполнения Python ограничен GIL (глобальной блокировкой интерпретатора) и не может по-настоящему распараллеливать операции.multiprocessingБудет открыто несколько независимых экземпляров интерпретатора Python.

преимущество: Каждый процесс имеет независимое пространство памяти, и проблема «сбоя общего объекта» вообще не возникнет. Возможность использовать преимущества многоядерных процессоров.
Подходит для сцены: обработка изображений, операции с большими данными и анализ больших JSON.

из многопроцессорного процесса импорта

задача определения (имя):
    print(f"Процесс {name} выполняется")

если __name__ == "__main__":
    p = Процесс(цель=задача, args=('A',))
    п.старт()
    p.join()

3. Очередь задач – подходит для распределенной обработки.

Если вы хотите полностью разделить задачи, вы можете использовать Celery или Redis Queue. Поместите задачу в очередь и позвольте внутреннему работнику (который может представлять собой несколько процессов или несколько компьютеров) подобрать и выполнить ее.

---

Сводные предложения

план	Решение	Применимые ситуации
Thread-Local	Каждый поток получает копию	Служба API, подключение к базе данных
Asyncio	Однопоточное переключение (несинхронное)	Высокое число одновременных сетевых запросов (рекомендуется)
Multiprocessing	независимое пространство памяти	Вычисления на ЦП, полностью избегая конфликтов совместного использования

Баланс между хранением области потоков и обменом информацией

основные понятия

Когда вы используете локальное хранилище потоков (TLS), цель состоит в том, чтобы защитить эти «непотокобезопасные» объекты (такие как служба API, подключения к базе данных). Но если между потоками необходимо обмениваться данными (например, результаты, загруженные потоком А, необходимо обработать потоком Б), необходимо установить специальный «канал связи».

1. Используйте потокобезопасные очереди (Queue) — наиболее рекомендуется.

Питонqueue.QueueЯвляется ли потокобезопасным. Это самый стандартный и безопасный способ передачи информации между потоками. Он уже обработал всю логику блокировки внутри себя.

импорт потоков
очередь импорта

# Создайте глобальную очередь, к которой будут иметь доступ все потоки выполнения
Task_queue = очередь.Очередь()

Защитный продюсер():
    # Производим данные и помещаем их в очередь
    data = {"video_id": "abc", "status": "pending"}
    Task_queue.put (данные)

защита потребителя():
    # Получаем данные из очереди
    данные = Task_queue.get()
    # Обработка данных...
    Task_queue.task_done()

2. Используйте переменные безопасности потока (например, блокировку общего списка).

Если вам нужно поделиться большим списком или словарем, вы можете использовать общие глобальные переменные, но доступ к ним должен осуществляться с помощью сопоставления.threading.Lock。

общие_результаты = []
results_lock = резьба.Lock()

задача определения():
    result = "Результаты некоторых операций"
    
    #Блокировка перед доступом к общим ресурсам
    с результатами_блокировки:
        shared_results.append(результат)
    # Автоматически разблокировать после выхода из блока with

3. Используйте объекты «Событие» или «Условие» (синхронизация сигналов).

Иногда вы хотите делиться не «данными», а «состоянием» (например, сообщать другим потокам, что API инициализирован).

api_ready = резьба.Событие()

инициализатор защиты():
    #Выполняем инициализацию
    api_ready.set() # Отправить сигнал

рабочий рабочий():
    api_ready.wait() # Ждем сигнала, пока инициализатор не вызовет set()
    print("Начнём работать")

Резюме: Региональное хранилище и общая информация

Тип контента	место хранения	стиль управления
Объекты инструментов(API, подключение к БД)	Thread-Local (регион)	У каждого есть копия, чтобы избежать сбоев.
Информация о миссии(идентификатор, параметр)	Очередь (глобальная)	Используйте потокобезопасную передачу очереди.
Результат расчета(статистика)	Глобальный список/Dict (глобальный)	Должно соответствовать`threading.Lock`。

Проще говоря: **"Получите частные инструменты (соединения) самостоятельно и поместите общедоступную информацию (данные) в очередь (Очередь/Блокировка)".**

фиксатор резьбы

Основные понятия

В многопоточной среде, когда несколько потоков пытаются одновременно изменить одну и ту же глобальную переменную или общий ресурс (например, файл, соединение с базой данных, глобальный список), возникает ошибка.Состояние гонки, что приводит к путанице данных.threading.LockЭто примитив синхронизации, который гарантирует, что только один поток может одновременно войти в защищенный блок кода.

1. Стандартное использование

Самый безопасный и рекомендуемый способ — сопоставитьwithИспользуйте повествовательные предложения. Это гарантирует, что даже если внутри блока возникнет исключение, блокировка будет снята правильно, чтобы избежать взаимоблокировки.

импорт потоков

# 1. Создайте объект блокировки
my_lock = резьба.Lock()
общий_счетчик = 0

защита приращения_задачи():
    глобальный общий_счетчик
    # 2. Используйте with для автоматического управленияacquire() и Release().
    с my_lock:
        # Код в этом блоке может выполняться только одним потоком одновременно
        темп = общий_счетчик
        температура += 1
        общий_счетчик = температура

# Запускаем несколько тестов потоков
threads = [threading.Thread(target=increment_task) для _ в диапазоне (100)]
для t в потоках: t.start()
для t в потоках: t.join()

print(f"Окончательный счетчик: {shared_counter}")

2. Ручной метод управления.

Хотя это и не рекомендуется, иногда требуется более точный контроль. Вы должны вручную позвонитьacquire()получить замок иfinallyпозвонить в блокrelease()。

блокировка = резьба.Lock()

защита manual_task():
    lock.acquire() #Получить блокировку. Если замок уже занят, он заблокируется (подождет) здесь.
    попробуйте:
        # Выполняем задачи
        пройти
    наконец:
        lock.release() # Должен быть освобожден, иначе другие потоки никогда не смогут выполниться

3. Характеристики блокировки: неповторяемость.

threading.LockЭто не реентерабельно. Это означает, что если тот же поток снова запросит ту же блокировку, когда он уже удерживает блокировку, он «заблокируется» сам (взаимная блокировка).

решение: Если вам нужно получить одну и ту же блокировку несколько раз в одном потоке, используйте вместо этогоthreading.RLock()(Реентерабельный замок).

4. Когда следует использовать Lock?

Изменить глобальные переменные: например, счетчик и аккумулятор.
Непотокобезопасные объекты: Как вы упомянули ранееGoogle API Serviceобъект.
Написание файла: Предотвратить одновременную запись одного и того же файла несколькими потоками выполнения, что приведет к путанице содержимого.
Операции с базой данных: Если несколько потоков выполнения используют одно и то же соединение для запроса и отправки.

Вопросы производительности

Чрезмерное использование блокировок приведет к снижению производительности программы, поскольку несколько потоков попадут «в очередь на выполнение». Если возможно, отдайте приоритет использованиюqueue.Queueили то, что мы обсуждали ранееThread-Local Storage, эти методы обычно более эффективны и менее подвержены ошибкам, чем частая блокировка.

Асинхронное программирование на Python

В Python,async defиawaitреализованАсинхронное программированиеосновной синтаксис. Они не позволяют программе зависать во время ожидания задач ввода-вывода (таких как сетевые запросы, чтение файлов) и вместо этого могут выполнять другие задачи, значительно повышая производительность.

1. async def: определить функцию сопрограммы

Когда вы добавляете определение функции с помощьюasync, функция станетФункция сопрограммы. Когда вы его вызываете, он не выполняет содержимое немедленно, а возвращает «объект сопрограммы».

асинхронная защита fetch_data():
    print("Начать получение данных...")
    # Моделирование трудоемких задач
    вернуть {"данные": "успех"}

# Прямой вызов получит только объект сопрограммы и не выполнит печать
результат = выборка_данных()
print(result) # Вывод: <coroutine object fetch_data at ...>

2. ожидание: приостановить и подождать

awaitможет быть толькоasync defДля внутреннего использования. Его функция — «временно приостановить текущую сопрограмму, дождаться завершения последующих задач и получить возвращаемое значение». Во время ожидания система может выполнять другие асинхронные задачи.

импортировать асинхронный код

асинхронное определение main():
    # Используйте await для выполнения сопрограммы и получения результатов
    данные = ожидайте выборки_данных()
    print(f"Собрать результаты: {данные}")

# Запускаем запись для асинхронных программ
asyncio.run(main())

3. Таблица сравнения ключей

грамматика	Описание функции	На что следует обратить внимание
async def	Объявить асинхронную функцию	Возвращается объект сопрограммы, а не результат выполнения.
await	Дождитесь завершения асинхронных задач	Может быть написано только внутри асинхронных функций.
asyncio.run()	Запустить самую внешнюю асинхронную запись	Программу обычно нужно вызвать только один раз.

4. Распространенные ошибки и исправления

Забыл написать жду:Это самая распространенная ошибка. если не напишиawait, ты получишьcoroutineобъекта, когда вы пытаетесь прочитать свойства (например,result.text) будет распыляться, когдаAttributeError。
Используйте await в общих функциях:Это приведет кSyntaxError. Вы должны убедиться, что внешняя функция имеетasyncУход.
Блокирующая операция:существоватьasyncиспользуется в функцияхtime.sleep()Это заблокирует весь цикл событий. Пожалуйста, используйте вместо этогоawait asyncio.sleep()。

5. Зачем использовать асинхронный режим?

Представьте, что вы готовите:

Синхронизация:При кипячении воды вы стоите перед чайником в оцепенении, а потом идете резать овощи после того, как вода закипит.
Асинхронный (Асинхронный):Вскипятить воду(await) при этом, когда вы пойдете нарезать овощи, звук закипающей воды (уведомление о событии) позовет вас разобраться с этим.

Завершите сопрограмму и верните результат

loop.run_until_complete()даasyncioМетод нижнего уровня в модуле используется для выполнения сопрограммы до ее завершения и возврата результата. После Python 3.7, хотя официально рекомендуется использоватьasyncio.run(), но вам все равно придется использовать этот метод в некоторых конкретных ситуациях (например, когда вам нужно повторно использовать циклы событий или настроить логику запуска).

1. Основной процесс использования

использоватьrun_until_completeСначала необходимо получить или создать объект цикла событий, а затем передать ему сопрограмму.

импортировать асинхронный код

асинхронная защита my_task():
    ожидайте asyncio.sleep(1)
    вернуть «Задача выполнена»

# 1. Получить цикл событий
цикл = asyncio.get_event_loop()

# 2. Выполнить сопрограмму до завершения и напрямую получить возвращаемое значение
результат = цикл.run_until_complete(my_task())

print(result) #Output: Задача завершена

2. Отличия от asyncio.run()

Оба могут получить возвращаемое значение, но управляют жизненным циклом по-разному:

характеристика	asyncio.run() (рекомендуется)	loop.run_until_complete()
степень автоматизации	высокий. Автоматически создавайте, замыкайте циклы и очищайте задачи.	Низкий. Жизненным циклом цикла необходимо управлять вручную.
возможность повторного использования	Низкий. Каждый вызов создает новый цикл.	высокий. В одном цикле может выполняться несколько задач.
Ограничения использования	Невозможно использовать в уже работающем цикле.	Более гибкий и часто используется в устаревшем коде или средах тестирования.

3. Получите результаты в существующих циклах

Если вы находитесь в уже запущенном скрипте и хотите убедиться, что сопрограмма выполнена и значение получено, вы можете использовать этот метод:

импортировать асинхронный код

асинхронное определение add(a, b):
    вернуть а + б

цикл = asyncio.new_event_loop()
asyncio.set_event_loop(цикл)

попробуйте:
    # Выполняем первое задание
    val1 = цикл.run_until_complete(добавить(10, 20))
    #Выполняем второе задание
    val2 = цикл.run_until_complete(add(val1, 5))
    print(f"Окончательный результат: {val2}")
наконец:
    # Должно быть закрыто вручную
    цикл.закрыть()

4. Получите результаты нескольких задач

Если вы хотите, чтобы несколько сопрограмм выполнялись параллельно и равномерно получали возвращаемое значение, вам необходимо сопоставитьasyncio.gather：

асинхронная задача определения (идентификатор):
    вернуть f"результат {id}"

цикл = asyncio.get_event_loop()
# сбор объединит несколько сопрограмм в одну задачу, а run_until_complete будет ждать завершения всех.
результаты = цикл.run_until_complete(asyncio.gather(задача(1), задача(2), задача(3)))
print(results) #Output: ['Результат 1', 'Результат 2', 'Результат 3']

5. Общие меры предосторожности

RuntimeError：Если вы уже используетеasync defвызов внутри функцииrun_until_complete, выльетсяThis event loop is already running. Пожалуйста, всегда используйте его внутри асинхронных функций.await。
Очистка ресурса:После использования цикла вы должны вызватьloop.close()для освобождения ресурсов, иначе программа может не завершиться нормально или выдать предупреждение.
Тип возвращаемого значения: run_until_completeВернет сопрограммуreturnЕсли в сопрограмме возникает неперехваченное исключение, оно будет выброшено на вызывающую сторону.

asyncio.run()Это API высокого уровня, представленный начиная с Python 3.7. Это наиболее рекомендуемый способ запуска асинхронных программ. оно автоматически позаботится об этомУстановите цикл событий, выполните сопрограмму и закройте цикл после завершения.. Самое главное, что оно будет передано непосредственно обратно в сопрограмму.returnценить.

1. Основные методы сбора данных

Вам просто нужноasync defВызов функции передаетсяasyncio.run(), она вернет результат как обычная синхронная функция.

импортировать асинхронный код

асинхронная защита Calculate_score (имя):
    print(f"Подсчет очков {name}...")
    await asyncio.sleep(1) # Имитация трудоемких задач
    вернуть 95

# Получите результат возврата напрямую
Final_score = asyncio.run(calculate_score("Чжан Сяомин"))

print(f"Итоговый результат: {final_score}") # Вывод: 95

2. Обработка результатов нескольких задач

Обычно мы определяемmain()функционировать как точка входа и получать результаты всех подзадач внутри, и, наконец, с помощьюasyncio.run(main())Единый вывод.

асинхронная защита Task_a():
    вернуть «яблоко»

асинхронная защита Task_b():
    вернуть «банан»

асинхронное определение main():
    # Используйте сбор в основном для одновременного выполнения
    результаты = ждут asyncio.gather(task_a(), Task_b())
    return results # Возвращаем список

# Получите возвращаемое значение main через asyncio.run
all_fruits = asyncio.run(main())
print(all_fruits) # Вывод: ['apple', 'banana']

3. Правила выполнения asyncio.run()

Элементы правил	иллюстрировать
единственный вход	В продолжении выполнения обычно вызывается только один раз.`asyncio.run()`。
Автоматическая очистка	Он автоматически отменяет все оставшиеся задачи и закрывает пул потоков, что очень безопасно.
Предел вложенности	не могууже есть`async def`внутренний вызов функции`asyncio.run()`。

4. Распространенные ошибки: RuntimeError.

Если вы находитесь внутри асинхронной функции и пытаетесь получить результаты другой асинхронной функции, используйтеawait, вместоasyncio.run()。

# Демонстрация ошибки
асинхронная защита sub_task():
    вернуть 10

асинхронное определение main():
    # Здесь произойдет ошибка: RuntimeError: asyncio.run() нельзя вызвать из работающего цикла событий.
    res = asyncio.run(sub_task())
    
# Правильная коррекция
асинхронное определение main():
    res = await sub_task() # Пожалуйста, используйте await в асинхронной среде

5. Практические рекомендации

Самый внешний слой использует:Пучокasyncio.run()В качестве кнопки запуска программы поместите ее вif __name__ == "__main__":в блоке.
Обработка исключений:Если ошибка возникает внутри сопрограммы и не обнаруживается,asyncio.run()Исключение будет выброшено напрямую. Рекомендуетсяrunвнешний слой плюсtry...except。
Тип постбека:Независимо от того, возвращает ли сопрограмма строку, словарь или пользовательский объект,asyncio.run()можно удалить целиком.

Анализ данных Python

Научные операции Python NumPy

NumPy(Numerical Python) — самая важная библиотека научных вычислений в Python. Он обеспечивает эффективные объекты многомерного массива.ndarrayи большую библиотеку математических функций для работы с этими массивами. Это основа науки о данных, машинного обучения (например, Pandas, Scikit-learn, TensorFlow) и других областей.

1. Зачем выбирать NumPy вместо собственного списка?

Высокая производительность:Написанные на языке C, операции с массивами выполняются в непрерывной памяти, что намного быстрее, чем встроенный список Python (List).
Векторизация:Позволяет выполнять математические операции над целыми массивами без необходимости явной записиforКруг.
Вещание:Автоматически обрабатывать операции между массивами различной формы.

2. Основной объект: базовые операции ndarray.

импортировать numpy как np

# Создаём одномерные и двумерные массивы
arr1 = np.array([1, 2, 3])
arr2 = np.array([[1, 2], [3, 4]])

# Быстро создать определенный массив
нули = np.zeros((3, 3)) # матрица 3x3 со всеми нулями
ones = np.ones((2, 4)) # матрица 2x4 со всеми единицами
глаз = np.eye(3) # единичная матрица 3x3
range_arr = np.arange(0, 10, 2) # [0, 2, 4, 6, 8]

3. Часто используемые операции с массивами и атрибуты

Функция	Пример кода	иллюстрировать
Проверка формы	`arr.shape`	Возвращает размер каждого измерения (например, (3, 2)).
изменить форму	`arr.reshape(1, 6)`	Изменение размеров без изменения данных.
Умножение матрицы	`np.dot(a, b)`или`a @ b`	Выполните умножение матриц в линейной алгебре.
статистическая функция	`np.mean()`, `np.std()`	Рассчитайте среднее, стандартное отклонение, максимальное и минимальное значения.

4. Нарезка и индексирование

Синтаксис нарезки NumPy аналогичен синтаксису Python List, но более мощный и поддерживает одновременную многомерную нарезку:

arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

# Получаем второй столбец (индекс 1)
print(arr[1, :]) # [4, 5, 6]

# Получаем подматрицу 2x2 в правом нижнем углу
print(arr[1:, 1:]) # [[5, 6], [8, 9]]

5. Установка и проверка версии

Установить: pip install numpyилиconda install numpy。

Проверить версию:

import numpy as np
print(np.__version__)

6. Используйте с Нумбой

Как упоминалось ранее,NumbaОн может прекрасно распознавать структуру массива NumPy и далее компилировать сложные операции NumPy в машинный код, достигая предела выполнения, близкого к родному языку C.

Python эффективно обрабатывает большие объемы данных Numba

NumbaЭто JIT-компилятор с открытым исходным кодом, специально разработанный для ускорения кода Python, обрабатывающего большие объемы данных. Он может переводить функции Python в машинный код со скоростью выполнения, сравнимой со скоростью C, C++ или Fortran, и особенно подходит дляNumPyОперации с массивами.

1. Основные функции и преимущества

JIT-компиляция:Компиляция «точно в срок» во время выполнения программы, а не компиляция с опережением времени (AOT).
Поддержка NumPy:Отличный эффект оптимизации для массивов и функций NumPy.
Ускорение графического процессора:Благодаря поддержке CUDA или ROCm вычислительные задачи можно передавать для выполнения на видеокарты NVIDIA или AMD.
Параллельные операции:Поддерживает параллельную обработку многоядерных процессоров, чего можно добиться с помощью простых тегов.

2. Основные примеры использования

Самый простой способ использовать Numba — добавить@jitили@njitДекоратор.

из numba import njit
импортировать numpy как np

# @njit представляет режим «nopython», который гарантирует отсутствие входа в парсер Python и является самым быстрым
@njit
защита fast_function(n):
    итого=0
    для я в диапазоне (n):
        всего += я
    общая сумма возврата

# Первый вызов скомпилируется, второй вызов напрямую выполнит машинный код
печать (fast_function (10000000))

3. Сравнение шаблонов: nopython против объекта

модель	Декоратор	иллюстрировать
режим nopython	`@njit`	Рекомендуется.Полностью отделен от интерпретатора Python и напрямую компилируется в машинный код. Если код программы содержит части, которые не могут быть скомпилированы, будет сообщено об ошибке.
объектный режим	`@jit`	Если его не удастся скомпилировать, он вернется к синтаксическому анализатору Python для выполнения. Улучшения производительности обычно ограничены.

4. Часто используемые методы: параллельные операции.

Чтобы воспользоваться преимуществами многоядерных возможностей вашего процессора, просто включитеparallel=Trueи использоватьprange。

из numba import njit, prange

@njit(параллельно=Истина)
защитапараллельная_сумма(А):
    с = 0
    # prange автоматически распределит циклы по разным ядрам процессора
    для меня в prange(A.shape[0]):
        s += А[я]
    вернуть с

5. Установка и проверка зависимостей.

Инструкции по установке: pip install numbaилиconda install numba。
Зависимости:Зависимость от НумбыLLVMФреймворк компилятора (черезllvmliteбиблиотека).
Проверьте установку:
```
import numba
print(numba.__version__)
```

6. Ограничения использования

Нечистые численные расчеты:Numba работает над Pythondict、listИли низкая производительность при настройке объектов.
Накладные расходы на компиляцию:При первом выполнении функции произойдет небольшая задержка из-за компиляции.
Сторонние библиотеки:Если у Numba нет официальной поддержки (например, NumPy), большинство функций сторонних библиотек невозможно скомпилировать.

Инструмент анализа данных Pandas

Что такое панды?

Pandas — это инструмент анализа и манипулирования данными на основе Python, предназначенный для обработки структурированных данных, таких как табличные данные или данные временных рядов.

Основные структуры данных Pandas

Series：Одномерный массив тегов, который можно рассматривать как индексированный список.
DataFrame：Двумерная структура данных, похожая на электронную таблицу или таблицу SQL.

Основные особенности Панды

Чтение и запись данных в нескольких форматах (например, CSV, Excel, JSON, SQL).
Очистка и предварительная обработка данных, например заполнение пропущенных значений и удаление повторяющихся значений.
Операции фильтрации, группировки и агрегирования данных.
Анализ и обработка временных рядов.
Интегрируйте другие инструменты обработки данных, такие как NumPy и Matplotlib.

Примеры использования

импортировать панд как pd

# Создать фрейм данных
data = {'Имя': ['Алиса', 'Боб', 'Чарли'],
        «Возраст»: [25, 30, 35],
        «Город»: [»Тайбэй», «Тайчжун», «Гаосюн»]}
df = pd.DataFrame(данные)

# Просмотр данных
печать (дф)

# Фильтровать информацию старше 28 лет
filtered_df = df[df['age'] > 28]
печать (filtered_df)

Применимые сценарии

Анализируйте большие наборы данных.
Выполняйте задачи по очистке данных и преобразованию формата.
Быстро исследуйте и визуализируйте данные.

Почему стоит выбрать панд?

Pandas предоставляет эффективные, гибкие и интуитивно понятные методы работы, которые особенно подходят для анализа и обработки данных. Это один из незаменимых инструментов в области науки о данных и машинного обучения.

в заключение

Pandas — мощный инструмент анализа данных, и как новички, так и опытные пользователи могут извлечь выгоду из его простого в использовании дизайна и обширных функций.

Python Googletrans

Установить Гуглтранс

Сначала вам нужно установитьgoogletransнабор. Введите следующую команду в командной строке:

pip install googletrans==4.0.0-rc1

Примечание. Пожалуйста, подтвердите версию при установке.4.0.0-rc1, поскольку более старые версии могут больше не работать.

Основные примеры использования

Вот пример перевода с английского на традиционный китайский:

из переводчика импорта Googletrans

#Инициализируем объект переводчика
переводчик = Переводчик()

# Перевести текст
text = "Привет, как дела?"
результат = переводчик.translate(text, src="en", dest="zh-tw")

# Вывод результатов перевода
print("исходный текст:", текст)
print("Перевод:", result.text)

Поддерживаемые языковые коды

Вы можете переводить на несколько языков, вот коды распространенных языков:

Английский:en
Традиционный китайский:zh-tw
Упрощенный китайский:zh-cn
японский:ja
Корейский язык:ko
Французский:fr
Немецкий:de

На что следует обратить внимание

Googletrans — это неофициальный API-интерфейс Google Translate, который может перестать работать из-за изменений со стороны Google. Если вы обнаружите, что функция перевода не работает, рассмотрите возможность использования других API перевода, например официального облачного перевода Google. API.

Другие наборы для перевода Python

DeepL Translator

DeepL предоставляет услуги высокоточного перевода, но для использования API разработчика требуется ключ API.

Microsoft Translator

Инструмент перевода, предоставляемый Microsoft, поддерживает многоязычный перевод, но требует использования настроек ключа API Azure.

Amazon Translate

Служба перевода, предоставляемая Amazon Web Services (AWS), обеспечивает эффективный перевод многоязычных текстов, доступ к которой осуществляется через ключ API, предоставленный AWS.

LibreTranslate

LibreTranslate — это инструмент перевода с открытым исходным кодом, который может настроить собственный сервер и не требует ключа API. Некоторые сторонние публичные серверы также предлагают возможность использовать их без ключа API.

TextBlob

TextBlob — это инструмент для обработки естественного языка со встроенными функциями Google Translate. Однако более старые версии не требуют ключа API и, возможно, придется обратить внимание на поддержку версий.

MyMemory

MyMemory обеспечивает перевод на основе памяти. Для некоторых функций не требуется ключ API, но для расширенного использования может потребоваться приложение.

в заключение

Среди конкурентов Googletrans LibreTranslate и некоторые версии TextBlob предлагают варианты, не требующие ключа API. Если вам нужен инструмент, который совершенно бесплатен и не требует дополнительной настройки, рассмотрите эти варианты.

OpenCC китайская конвертация

OpenCC(Open Chinese Convert) — проект с открытым исходным кодом, посвященный преобразованию упрощенного китайского языка в традиционный китайский. Это не просто преобразование слов в слова, но, что более важно, оно обрабатываетуровень словарного запасаконверсия и различия в привычках использования слов в разных регионах (материковый Китай, Тайвань, Гонконг).

1. Основные преимущества OpenCC

Точное преобразование:Умеет различать простые и сложные ситуации, такие как «фа (развитый)» и «фа (волосы)».
Региональная поддержка:Поддерживает преобразование терминологии между традиционным китайским языком Тайваня, традиционным китайским языком Гонконга и упрощенным китайским языком материкового Китая (например: программное обеспечение и программное обеспечение).
Высокая производительность:Разработан с использованием C++ и предоставляет несколько языковых интерфейсов, таких как Python, Node.js и Java.
Пользовательский словарь:Позволяет пользователям создавать свои собственные правила преобразования.

2. Установка Python и базовое использование

В Python наиболее часто используемой библиотекой упаковки являетсяopencc-python-reimplemented。

# Инструкции по установке
pip install переопределенная opencc-python

# Пример базового кода
из opencc импортировать OpenCC

# Инициализация, s2t расшифровывается как Simplified to Traditional (упрощенный до традиционного)
cc = OpenCC('s2t')
text = "Искусственный интеллект изменил мир"
результат = cc.convert(текст)

print(result) #Вывод: Искусственный интеллект изменил мир

3. Сравнительная таблица общих режимов преобразования

Имя схемы	иллюстрировать	Применимые ситуации
s2t	Упрощенный китайский на традиционный китайский	Преобразуйте стандартные символы из простых в традиционные.
t2s	Традиционный китайский на упрощенный китайский	Стандартные символы преобразуются из традиционных в упрощенные.
s2twp	С упрощенного китайского на тайваньский традиционный китайский (включая словарный запас)	Чаще всего используется на Тайване.Превратим «программное обеспечение» в «программное обеспечение».
tw2s	Тайваньский традиционный китайский на упрощенный китайский	Преобразуйте тайваньские идиомы в упрощенный китайский язык материкового Китая.
s2hk	Упрощенный до традиционного гонконгского	Это соответствует привычкам использования слов в Гонконге (например, «里» заменено на «里»).

4. Инструменты командной строки (CLI)

Если вы не хотите писать программу, OpenCC также можно использовать непосредственно в терминале:

# Преобразование input.txt в выходной.txt, используя упрощенный режим в традиционный тайваньский.
opencc -i input.txt -o output.txt -c s2twp.json

5. Часто задаваемые вопросы и напоминания

Одно простое против множества сложных:Хотя OpenCC работает хорошо, в некоторых крайних ситуациях по-прежнему могут возникать ошибки, и рекомендуется, чтобы важные документы по-прежнему требовали ручной корректуры.
Зависимости от среды:Для собственного OpenCC требуется среда выполнения C. Если при установке библиотеки Python возникает ошибка, попробуйте использоватьreimplementedВерсия.
Конфигурация JSON:Логика преобразования задается формулой.jsonОпределения файлов, вы можете перейти в каталог установки OpenCC, чтобы увидеть, как работают эти словари.

Запрос Python на китайском фонетическом обозначении

В следующем примере показано, как использовать Python для запроса всех фонетических обозначений китайских иероглифов. мы используемpypinyinКомплект для получения пиньинь китайских иероглифов и настройки таблицы соответствия пиньинь фонетическим символам.

Шаг 1. Установите пакет pypinyin.

pip install pypinyin

Шаг 2. Пример кода Python

Ниже приведен код Python, включая таблицу фонетического соответствия и логику программы для запроса и генерации результатов HTML.

из pypinyin импорт пиньинь, стиль
из шаблона импорта jinja2

# Простая таблица соответствия от Пиньинь до Чжуинь
pinyin_to_zhuyin = {
    "a": "ㄚ", "ai": "ㄞ", "an": "ㄢ", "ang": "ㄤ", "ao": "ㄠ",
    "ба": "ㄅㄚ", "бай": "ㄅㄞ", "бан": "ㄅㄢ", "bang": "ㄅㄤ", "бао": "ㄅㄠ",
    # Опустить некоторые соответствия и нужно их улучшить самостоятельно
    «хао»: «ㄏㄠ», «хао»: «ㄏㄠ», «хо»: «ㄏㄠˇ», «хао»: «ㄏㄠˋ»
}

# Запросить все китайские иероглифы пиньинь и преобразовать их в пиньинь
защита get_zhuyin (символ):
    пиньинь = пиньинь (char, style=Style.NORMAL, гетероним=True)
    unique_pinyins = set(пиньины[0])
    zhuyins = {p: pinyin_to_zhuyin.get(p, p) for p in unique_pinyins} # Преобразование пиньинь в чжуинь
    список возврата (zhuyins.values())

# Символы запроса
chinese_char = 'good' # можно заменить другими символами
zhuyin_results = get_zhuyin(chinese_char)

иллюстрировать

Преобразование пиньинь в фонетическое:использоватьpinyin_to_zhuyinСловарь для сопоставления пиньинь с фонетическими символами. Эту таблицу соответствия необходимо расширить отдельно.
Шаблон Jinja2:Используйте шаблон Jinja2 для генерации HTML и вывода результатов на веб-страницу для отображения.
Поддержка полифонетических символов:использоватьheteronym=TrueУбедитесь, что отображаются все произношения многофонетических символов.

Хранилище Python

Проверьте, существует ли файл или папка

Используйте os.path

импортировать ОС

# Проверяем, является ли это файлом
если os.path.isfile("example.txt"):
    print("Файл существует")

# Проверяем, является ли это папкой
если os.path.isdir("my_folder"):
    print("Папка существует")

# Проверяем, существует ли файл или папка
если os.path.exists("путь/к/проверке"):
    print("путь существует")

Использование pathlib (Python 3.4+)

из пути импорта pathlib

путь = Путь("пример.txt")

если путь.существует():
    print("путь существует")

если путь.is_file():
    print("это файл")

если путь.is_dir():
    print("Это папка")

Операции с файлами Python

В Python самым стандартным и мощным модулем для копирования, перемещения, переименования и удаления файлов являетсяshutil(для операций высокого уровня) иos(для основных операций пути).

1. Операция копирования файла (Copy)

Операция копирования имеет разные функции в зависимости от того, необходимо ли сохранять метаданные (например, время создания, разрешения):

Shutil.copy(источник, пункт назначения):Скопируйте содержимое файла и разрешения. Местом назначения может быть каталог.
Shutil.copy2(источник, пункт назначения):Самый рекомендуемый вариант — максимально полно сохранить все метаданные архива (метки времени и т. д.).
Shutil.copytree (исходная папка, папка назначения):Рекурсивно копирует весь каталог и все его содержимое.

импортировать Shutil

# Копируем один файл
Shutil.copy2('source.txt', 'destination.txt')

# Скопируйте всю папку (папка назначения не должна существовать)
Shutil.copytree('my_folder', 'backup_folder')

2. Перемещение и переименование файлов (Переместить/Переименовать)

Основная логика перемещения и переименования очень похожа. использоватьshutil.moveМожет выполняться на дисках, в то время какos.renameЕго часто используют для переименования одного и того же диска.

Функция	Общие команды	иллюстрировать
Переместить файлы или каталоги	`shutil.move(src, dst)`	Перемещайте файлы или целые каталоги по новым путям, поддерживая перекрестные разделы.
Переименовать файл	`os.rename(old, new)`	Измените имя файла или каталога.

импортировать Shutil
импортировать ОС

# Переместить файлы
Shutil.move('test.txt', 'архив/test.txt')

# Переименование
os.rename('старое_имя.txt', 'новое_имя.txt')

3. Операция удаления файла (Remove)

Операции удаления следует использовать с осторожностью, поскольку эти команды обычно не попадают в корзину, а напрямую удаляют их без возможности восстановления.

os.remove(путь):Удалить один файл. Если путь является каталогом, будет сообщено об ошибке.
os.rmdir(путь):Удалить пустые каталоги.
Shutil.rmtree(путь):Принудительно удалите все дерево каталогов (включая все файлы и подкаталоги внутри).

# Удалить один файл
если os.path.exists('temp.txt'):
    os.remove('temp.txt')

# Принудительно удалить всю папку
Shutil.rmtree('old_data_folder')

4. Проверка пути и статуса

Прежде чем выполнять копирование или перемещение, проверьте, существует ли путь, чтобы избежать сбоя программы:

os.path.exists(path)：Проверьте, существует ли путь.
os.path.isfile(path)：Проверьте, является ли это файлом.
os.path.isdir(path)：Проверьте, является ли это каталогом.

5. Примечания и предложения

Обработка пути:Рекомендуетсяos.path.join()илиpathlibМодуль для объединения путей для обеспечения работы программы между Windows (обратная косая черта) и Linux (косая черта).
Обработка исключений:Операции с файлами могут легко завершиться сбоем из-за недостаточных разрешений или занятости файлов. Рекомендуется использоватьtry...exceptпакет.
Переопределить поведение: shutil.copyиshutil.moveЕсли файл с таким же именем уже существует в пути назначения, он обычно перезаписывается напрямую. Перед выполнением следует подтвердить, нужно ли его переименовывать, чтобы избежать этого.

пакет регистрации

ПитонloggingПакет представляет собой мощный встроенный набор для эффективного управления журналами в приложениях. Независимо от того, регистрируете ли вы отладочную информацию, отслеживаете ошибки или контролируете производительность,loggingКаждый пакет может предоставлять многоуровневые и многоформатные методы журналирования.

Основные понятия

Logger: Регистратор, отвечающий за создание и управление сообщениями журнала.
Handler: процессор, используемый для определения места вывода журнала, например консоль, файл, сеть и т. д.
Formatter:Formatter определяет формат вывода сообщений журнала.
Level:Level, установите уровень серьезности журнала, напримерDEBUG、INFO、WARNING、ERRORиCRITICAL。

Пример кода

Вот базовыйloggingПример конфигурации комплекта:

журнал импорта

# Установить регистратор
logger = logging.getLogger('my_logger')
logger.setLevel(logging.DEBUG)

# Установить обработчик
console_handler = logging.StreamHandler()
file_handler = logging.FileHandler('app.log')

# Установить форматтер
formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
console_handler.setFormatter(форматтер)
file_handler.setFormatter(форматтер)

# Добавляем обработчик в регистратор
logger.addHandler(console_handler)
logger.addHandler(file_handler)

# Тестируйте разные уровни журналов
logger.debug('Это отладочное сообщение')
logger.info('Это информационное сообщение')
logger.warning('Это предупреждающее сообщение')
logger.error('Это сообщение об ошибке')
logger.critical('Это серьезное сообщение')

Уровень журнала

loggingПоддерживаются следующие уровни журнала:

DEBUG: Самый низкий уровень, используемый для отладочной информации.
INFO: Общая информация, например, рабочее состояние системы.
WARNING: предупреждающая информация, но не приведет к остановке программы.
ERROR: Информация об ошибке, которая обычно вызывает проблемы из-за ошибок.
CRITICAL: Самая серьезная ошибка, которая может привести к завершению работы программы.

Пользовательский формат вывода

Можно использоватьFormatterКласс, определяющий формат вывода журнала. Например:

formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')

Этот формат выведет что-то похожее на следующее:

2024-10-25 10:00:00 - my_logger - ИНФО - Это информационное сообщение

краткое содержание

loggingПакет предоставляет различные варианты управления журналами, позволяя разработчикам настраивать уровни журналов, форматы вывода и места назначения в соответствии с потребностями, улучшая удобство обслуживания и эффективность отладки приложений.

Logging Handler

на Pythonloggingв комплекте,HandlerЭто ключевой компонент, отвечающий за определение места вывода журнала. Разные процессоры могут выводить журналы в разные места назначения, включая консоль, файл, сеть и даже электронную почту.StreamHandlerОдин из наиболее часто используемых процессоров, он отвечает за вывод логов на консоль.

Главный процессор (обработчик)

существоватьlogging, некоторые общиеHandlerвключать:

StreamHandler: Вывод журнала вstdoutилиstderr(обычно консоль).
FileHandler: Вывод журналов в файл.
NullHandler: Игнорировать вывод журнала, подходит для ситуаций, когда отображение не требуется.
SMTPHandler: отправлять журналы по электронной почте.

Связь между StreamHandler и выводом консоли

StreamHandler— наиболее часто используемый процессор для вывода на консоль, он обычно отправляет сообщения журнала в стандартную ошибку (stderr). через настройкиStreamHandler, что позволяет отображать журналы непосредственно на консоли, что подходит для мониторинга состояния системы в реальном времени.

Если вы не хотите, чтобы логи отображались на консоли, вы можете удалить их из Logger.StreamHandlerили используйте вместо негоNullHandlerчтобы избежать вывода.

Пример кода: удаление вывода консоли

В следующем примере показано, как настроитьloggingи удалите вывод консолиStreamHandler：

журнал импорта

# Установить регистратор
logger = logging.getLogger('my_logger')
logger.setLevel(logging.DEBUG)

# Добавляем StreamHandler для вывода на консоль
console_handler = logging.StreamHandler()
logger.addHandler(console_handler)

# Тестовый вывод
logger.info("Это сообщение будет отображено на консоли")

# Удалить вывод консоли
logger.removeHandler(console_handler)
logger.info("Это сообщение не будет отображаться на консоли")

Как использовать NullHandler, чтобы избежать вывода на консоль

Можно использоватьNullHandlerЧтобы отключить весь вывод журнала:

журнал импорта

# Настраиваем Logger и добавляем NullHandler
logger = logging.getLogger('my_logger')
logger.addHandler(logging.NullHandler())

# Это сообщение не будет отображаться в консоли
logger.info("Это сообщение не будет отображаться")

краткое содержание

HandlerдаloggingКомпонент в наборе, определяющий местоположение вывода. черезStreamHandler, сообщения журнала могут отображаться на консоли для мониторинга в режиме реального времени. Если вывод консоли не нужен, его можно удалитьStreamHandlerили используйтеNullHandlerчтобы отключить вывод журнала.

Идентификатор потока журнала Python

Изменить формат журнала

Чтобы включить идентификатор потока в logging.Formatter, вы можете использовать%(thread)dсвойство. При этом отображается уникальный целочисленный идентификатор, присвоенный потоку системой.

журнал импорта

# Добавьте %(thread)d для отображения идентификатора потока
log_formatter = logging.Formatter(
    '%(asctime)s.%(msecs)03d %(thread)d %(levelno)s %(message)s',
    "%Y-%m-%d %H:%M:%S"
)

#Пример вывода:
# 2025-12-20 16:30:45.123 140735612345678 20 Это сообщение журнала.

Часто используемые атрибуты, связанные с потоками

В дополнение к целочисленному идентификатору вы также можете выбрать отображение имени потока в соответствии с вашими потребностями:

%(thread)d: отображает целочисленный идентификатор потока.
%(threadName)s: отображает имя потока (например, MainThread или Thread-1).

Полный пример кода

Этот код показывает, как применить этот формат в многопоточной среде:

журнал импорта
импорт потоков

# 1. Установить форматтер
log_format = '%(asctime)s.%(ms)03d [Thread:%(thread)d] %(levelno)s %(message)s'
date_format = "%Y-%m-%d %H:%M:%S"
форматтер = logging.Formatter(log_format, date_format)

# 2. Установите процессор журнала
обработчик = logging.StreamHandler()
handler.setFormatter(форматтер)

logger = logging.getLogger("ThreadTest")
logger.addHandler(обработчик)
logger.setLevel(logging.INFO)

# 3. Функция тестирования
задача определения():
    logger.info("Подпоток выполняется")

# Начать тестирование
logger.info("Основной поток запущен")
t = threading.Thread(цель=задача)
т.старт()
t.join()

библиотека Python

Часто используемый набор библиотек Python

Реляционная база данных (SQL)

SQLite (встроенный)

Python имеет встроенную поддержку SQLite и подходит для небольших приложений.

import sqlite3

conn = sqlite3.connect("example.db")
cursor = conn.cursor()

cursor.execute("CREATE TABLE IF NOT EXISTS users (id INTEGER PRIMARY KEY, name TEXT)")
cursor.execute("INSERT INTO users (name) VALUES (?)", ("Alice",))
conn.commit()

cursor.execute("SELECT * FROM users")
print(cursor.fetchall())

cursor.close()
conn.close()

MySQL（PyMySQL）

Используется для подключения к базе данных MySQL.

pip install pymysql

import pymysql

conn = pymysql.connect(host="localhost", user="root", password="password", database="test")
cursor = conn.cursor()

cursor.execute("SELECT * FROM users")
print(cursor.fetchall())

cursor.close()
conn.close()

PostgreSQL（psycopg2）

Используется для подключения к PostgreSQL.

pip install psycopg2

import psycopg2

conn = psycopg2.connect(dbname="testdb", user="user", password="password", host="localhost")
cursor = conn.cursor()

cursor.execute("SELECT * FROM users")
print(cursor.fetchall())

cursor.close()
conn.close()

SQL Server（pyodbc）

Используется для подключения к Microsoft SQL Server.

pip install pyodbc

import pyodbc

conn = pyodbc.connect("DRIVER={SQL Server}; SERVER=localhost; DATABASE=test; UID=user; PWD=password")
cursor = conn.cursor()

cursor.execute("SELECT * FROM users")
print(cursor.fetchall())

cursor.close()
conn.close()

Нереляционная база данных (NoSQL)

MongoDB（pymongo）

Подходит для файловых баз данных.

pip install pymongo

import pymongo

client = pymongo.MongoClient("mongodb://localhost:27017/")
db = client["testdb"]
collection = db["users"]

collection.insert_one({"name": "Alice", "age": 25})
print(list(collection.find()))

Redis（redis-py）

Подходит для кэширования и высокопроизводительного доступа по принципу «ключ-значение».

pip install redis

import redis

r = redis.Redis(host="localhost", port=6379, decode_responses=True)

r.set("name", "Alice")
print(r.get("name"))

Elasticsearch（elasticsearch-py）

Подходит для полнотекстового поиска и анализа.

pip install elasticsearch

from elasticsearch import Elasticsearch

es = Elasticsearch("http://localhost:9200")

doc = {"name": "Alice", "age": 25}
es.index(index="users", document=doc)

print(es.search(index="users", query={"match_all": {}}))

ORM-фреймворк

SQLAlchemy

Поддерживает несколько баз данных SQL и предоставляет функции ORM.

pip install sqlalchemy

from sqlalchemy import create_engine, Column, Integer, String
from sqlalchemy.orm import declarative_base, sessionmaker

engine = create_engine("sqlite:///example.db")
Base = declarative_base()

class User(Base):
    __tablename__ = "users"
    id = Column(Integer, primary_key=True)
    name = Column(String)

Base.metadata.create_all(engine)

Session = sessionmaker(bind=engine)
session = Session()

session.add(User(name="Alice"))
session.commit()

print(session.query(User).all())

в заключение

Соответствующая база данных:sqlite3(встроенный),pymysql（MySQL）、psycopg2（PostgreSQL）、pyodbc（SQL Server）。
Нереляционная база данных:pymongo（MongoDB）、redis（Redis）、elasticsearch（Elasticsearch）。
Структура ORM:SQLAlchemy(Поддерживает несколько баз данных SQL).

PyMySQL

Установить PyMySQL

Установите PyMySQL, используя следующие инструкции:

pip install pymysql

Подключиться к базе данных MySQL

Используйте PyMySQL для подключения к серверу MySQL:

импортпимиsql

# Установить соединение
conn = pymysql.connect(
    хост="локальныйхост",
    пользователь="ваш_пользователь",
    пароль="ваш_пароль",
    база данных="ваша_база_данных",
    набор символов="utf8mb4",
    курсоркласс=pymysql.cursors.DictCursor # Возвращает формат словаря
)

#Создаем курсор
курсор = conn.cursor()

# Запросить информацию
курсор.execute("ВЫБРАТЬ * ИЗ вашей_таблицы")
результат = курсор.fetchall()
для строки в результате:
    печать (строка)

# Закрыть соединение
курсор.закрыть()
конн.закрыть()

Выполнить оператор SQL

При выполнении операторов INSERT, UPDATE и DELETE необходимо внести изменения:

попробуйте:
    с conn.cursor() в качестве курсора:
        sql = "ВСТАВИТЬ В пользователей (имя, возраст) ЗНАЧЕНИЯ (%s, %s)"
        курсор.execute(sql, («Алиса», 25))
    conn.commit() # Отправляем изменения
кроме исключения как e:
    conn.rollback() # Откат при возникновении ошибки
    print("Произошла ошибка:", e)

Выполнить хранимую процедуру

Можно использоватьcallprocВызов хранимой процедуры:

with conn.cursor() as cursor:
    cursor.callproc("your_stored_procedure", (param1, param2))
    result = cursor.fetchall()
    print(result)

Вставка данных в пакетном режиме

использоватьexecutemanyЧтобы выполнить массовую вставку:

data = [("Bob", 30), ("Charlie", 28), ("David", 35)]
sql = "INSERT INTO users (name, age) VALUES (%s, %s)"

with conn.cursor() as cursor:
    cursor.executemany(sql, data)
conn.commit()

Предотвратить SQL-инъекцию

Используйте параметризованные запросы для предотвращения атак с использованием SQL-инъекций:

name = "Alice"
sql = "SELECT * FROM users WHERE name = %s"

with conn.cursor() as cursor:
    cursor.execute(sql, (name,))
    result = cursor.fetchall()
    print(result)

Закрыть соединение

Обязательно закройте соединение с базой данных после завершения работы программы:

conn.close()

Использование даты и времени в PyMySQL

1. Вставьте дату и время (Python datetime → MySQL DATETIME)

PyMySQL автоматическиdatetime.datetimeПреобразование в MySQL DATETIME и может быть передано напрямую.

import pymysql
import datetime

conn = pymysql.connect(
    host="localhost",
    user="root",
    password="pwd",
    database="testdb",
    cursorclass=pymysql.cursors.DictCursor
)

with conn:
    with conn.cursor() as cur:
        now = datetime.datetime.now()

        sql = """
            INSERT INTO logs (msg, created_at)
            VALUES (%s, %s)
        """

        cur.execute(sql, ("hello world", now))
        conn.commit()

2. Вставьте дату (дата Python → ДАТА MySQL)

today = datetime.date.today()

sql = "INSERT INTO records (start_date) VALUES (%s)"
cur.execute(sql, (today,))
conn.commit()

3. Запрос даты и времени (MySQL DATETIME → Python datetime)

Найденное поле автоматически станетdatetime.datetimeтип.

sql = "ВЫБРАТЬ идентификатор, созданный_at ИЗ журналов ORDER BY id DESC LIMIT 1"
cur.execute(sql)
строка = cur.fetchone()

dt = строка["create_at"]
печать(дт, тип(дт))
# Например: 2025-07-01 15:22:33

4. Отформатируйте обнаруженную дату и время в строку.

formatted = dt.strftime("%Y-%m-%d %H:%M:%S")
print(formatted)

5. Используйте дату и время в качестве условия запроса

start = datetime.datetime(2025, 1, 1, 0, 0, 0)

sql = """
    SELECT * FROM logs
    WHERE created_at >= %s
"""
cur.execute(sql, (start,))
rows = cur.fetchall()

6. Запрос данных за определенный период времени

begin = datetime.datetime(2025, 1, 1)
end   = datetime.datetime(2025, 1, 31, 23, 59, 59)

sql = """
    SELECT * FROM logs
    WHERE created_at BETWEEN %s AND %s
"""
cur.execute(sql, (begin, end))
rows = cur.fetchall()

7. Если дата и время базы данных хранятся в строках (VARCHAR/CHAR), их необходимо проанализировать вручную.

sql = "SELECT created_at FROM logs_str LIMIT 1"
cur.execute(sql)
row = cur.fetchone()

dt = datetime.datetime.strptime(row["created_at"], "%Y-%m-%d %H:%M:%S")
print(dt)

8. Вставьте дату и время в больших количествах (executemay)

items = [
    ("log1", datetime.datetime.now()),
    ("log2", datetime.datetime.now()),
]

sql = "INSERT INTO logs (msg, created_at) VALUES (%s, %s)"
cur.executemany(sql, items)
conn.commit()

в заключение

PyMySQL автоматически обрабатывает дату и время ↔ MySQL DATETIME, ручное преобразование не требуется.
При вставке данных просто передайте дату и время Python.
Запрос MySQL DATETIME позволит получить объекты datetime.datetime.
Это необходимо только в том случае, если дата и время в MySQL хранятся в виде строки.strptimeРучной разбор.

Получить поле даты и времени из результата запроса pymysql

Основное использование

импортпимиsql
импорт даты и времени

# Устанавливаем соединение с базой данных
conn = pymysql.connect(
    хост = 'локальный хост',
    пользователь = 'корень',
    пароль = 'ваш_пароль',
    база данных = 'ваш_дб',
    курсоркласс=pymysql.cursors.DictCursor # Возвращает поля как словарь
)

с подключением:
    с conn.cursor() в качестве курсора:
        sql = "ВЫБЕРИТЕ идентификатор, созданный_в ИЗ вашей_таблицы LIMIT 1"
        курсор.execute(sql)
        результат = курсор.fetchone()

        dt = result['created_at'] # Предположим, что поле созданного_at имеет тип datetime
        печать (дт)
        печать (тип (дт))

Преобразовать в строку

dt_str = dt.strftime("%Y-%m-%d %H:%M:%S")
print(dt_str)

Если данные представлены в строковом формате

# Если созданный_at хранится в строковом формате (например, CHAR/VARCHAR)
dt = datetime.datetime.strptime(result['created_at'], "%Y-%m-%d %H:%M:%S")
печать (дт)

Дополнение: выбор класса курсора

# Если DictCursor не установлен, данные будут кортежем, а метод значения будет следующим:
курсор = conn.cursor()
курсор.execute("ВЫБЕРИТЕ идентификатор, созданный_в ИЗ вашей_таблицы")
строка = курсор.fetchone()
dt = строка[1]

Получите разницу между датой и временем SQL и текущим временем

Пример программы - Разница в днях с текущим временем

импортпимиsql
импорт даты и времени

# Устанавливаем соединение с базой данных
conn = pymysql.connect(
    хост = 'локальный хост',
    пользователь = 'корень',
    пароль = 'ваш_пароль',
    база данных = 'ваш_дб',
    курсоркласс = pymysql.cursors.DictCursor
)

с подключением:
    с conn.cursor() в качестве курсора:
        sql = "ВЫБЕРИТЕ созданный_at ИЗ ПРЕДЕЛА вашей_таблицы 1"
        курсор.execute(sql)
        результат = курсор.fetchone()

        dt_from_sql = result['created_at'] # тип даты и времени
        сейчас = дата-время.дата-время.сейчас()

        # Рассчитать разницу во времени
        разница = сейчас - dt_from_sql
        print(f"Разница в днях: {diff.days}")

Если сравнивать только даты, не включая время

diff = now.date() - dt_from_sql.date()
print(f"Разница в чистых датах в днях: {diff.days}")

Пример программы - разница во времени с текущим временем

импортпимиsql
импорт даты и времени

# Устанавливаем соединение с базой данных
conn = pymysql.connect(
    хост = 'локальный хост',
    пользователь = 'корень',
    пароль = 'ваш_пароль',
    база данных = 'ваш_дб',
    курсоркласс = pymysql.cursors.DictCursor
)

с подключением:
    с conn.cursor() в качестве курсора:
        sql = "ВЫБЕРИТЕ созданный_at ИЗ ПРЕДЕЛА вашей_таблицы 1"
        курсор.execute(sql)
        результат = курсор.fetchone()

        dt_from_sql = result['created_at'] # тип даты и времени
        сейчас = дата-время.дата-время.сейчас()

        # Рассчитать разницу во времени
        разница = сейчас - dt_from_sql
        часы = diff.total_секунды() / 3600
        print(f"Разница в часах: {hours}")

округлить часы

print(f"Разница равна целому числу часов: {int(hours)}")

Принудительное обновление базы данных

принцип

В InnoDB, механизме хранения данных MySQL по умолчанию, уровень изоляции по умолчанию равенREPEATABLE READ(повторяемое чтение).

Это означает, что после того, как вы выполните первый запрос в той же транзакции (транзакции), MySQL создаст «снимок» транзакции. Даже если данные в базе данных будут изменены другими программами через секунду, пока ваша транзакция не завершится, второй запрос все равно увидит те же данные снимка, что и в первый раз. Это необходимо для обеспечения последовательности «повторяемого чтения».

Как заставить самые последние данные?

Способ 1. Зафиксируйте транзакцию вручную (наиболее рекомендуется).

Это самый стандартный подход. Прежде чем выполнить второй запрос, вызовитеconnection.commit(). Отправка завершит текущую транзакцию, и MySQL создаст новый снимок во время следующего запроса и прочитает последние данные.

# Первый запрос
курсор.execute(sql)
результат1 = курсор.fetchall()

# Принудительное обновление: зафиксировать текущую транзакцию
соединение.коммит()

# Второй запрос будет собирать самую свежую информацию.
курсор.execute(sql)
результат2 = курсор.fetchall()

Способ 2. Включите режим автоматической отправки (Autocommit).

Если вы хотите, чтобы каждая команда SQL вступила в силу немедленно и видели последние результаты, вы можете включить автоматическую отправку после установления соединения. Итак, каждыйexecute()будут рассматриваться как независимые вопросы.

Connection.autocommit = Истина
# Все последующие выполнения (sql) будут напрямую считывать последний статус базы данных

Способ 3. Отрегулируйте уровень изоляции.

Вы можете изменить уровень изоляции наREAD COMMITTED(прочитайте содержимое коммита). На этом уровне каждый раз, когда запрос выполняется в рамках одной и той же транзакции, будут считываться последние отправленные данные.

# Устанавливается перед выполнением запроса
курсор.execute("УСТАНОВИТЬ УРОВЕНЬ ИЗОЛЯЦИИ СЕАНСА ТРАНЗАКЦИИ ЧТЕНИЕ ЗАПРЕЩЕНО")

Распространенное заблуждение: не просто проверяйте курсор

Курсоры и соединения: Кэширование обычно происходит вconnection(проводная) область транзакции, а неcursorСам объект. Если вы заново создадите курсор, но используете то же соединение и не зафиксируете, проблема все равно будет существовать.
Кэш запросов: Функция кэширования запросов на стороне сервера была удалена начиная с MySQL 8.0, поэтому современные среды обычно не имеют отношения к кэшированию SQL.

Многопоточное подключение к базе данных

Почему несколько потоков должны быть подключены независимо друг от друга?

В многопоточной среде Python, если несколько потоков используют одно и то же соединение с базой данных, возникнут серьезные конфликты. Это связано с тем, что связанные объекты обычно не являются потокобезопасными. Несколько потоков, одновременно отправляющих команды SQL или считывающих результаты, могут привести к путанице данных, исключениям транзакций или прерываниям соединения. Поэтому рекомендуется использовать пул соединений для выделения независимых соединений каждому потоку.

1. Используйте пул соединений MySQL Connector.

mysql-connector-pythonВстроенная простая функция пула соединений. Вы можете заранее создать пул и «заимствовать» из него соединения, когда потоки в этом нуждаются.

импорт потоков
импортировать mysql.connector
из пула импорта mysql.connector

# 1. Создайте пул соединений (глобальная переменная)
db_config = {
    "хост": "локальный хост",
    "пользователь": "корень",
    "пароль": "пароль",
    "база данных": "test_db"
}

Connection_pool = mysql.connector.pooling.MySQLConnectionPool(
    имя_пула="мой_пул",
    Pool_size=5, # Установите размер пула, который должен быть больше или равен количеству потоков
    **db_config
)

# 2. Выполнение функции задачи потока
защита thread_task (task_id):
    конн = Нет
    попробуйте:
        # Получаем независимое соединение из пула
        conn = Connection_pool.get_connection()
        курсор = conn.cursor()
        
        # Выполняем операции
        курсор.execute("ВЫБРАТЬ СЕЙЧАС()")
        результат = курсор.fetchone()
        print(f"Время чтения потока выполнения {task_id}: {result}")
        
        # Примечание. На этом уровне изоляции не забудьте зафиксировать изменения, если есть какие-либо изменения.
        # conn.commit()

    кроме исключения как e:
        print(f"Произошла ошибка в потоке {task_id}: {e}")
    наконец:
        # Важно: закройте курсор и соединение (здесь закрытие вернет соединение с пулом, а не прервет его)
        если conn и conn.is_connected():
            курсор.закрыть()
            конн.закрыть()

# 3. Запуск нескольких потоков выполнения
темы = []
для меня в диапазоне (3):
    t = threading.Thread(target=thread_task, args=(i,))
    потоки.append(т)
    т.старт()

за т в темах:
    t.join()

2. Используйте пул соединений SQLAlchemy (обычно используемый в отрасли).

Если вы разрабатываете более крупное приложение, SQLAlchemy обеспечивает более мощное и автоматизированное управление соединениями (QueuePool). Он автоматически обрабатывает сбои соединения, перезапуск и распределение потоков.

из импорта sqlalchemy create_engine
из sqlalchemy.orm импортировать создатель сеанса

# Пул соединений будет автоматически включен при создании Engine
двигатель = create_engine(
    "mysql+mysqlconnector://root:password@localhost/test_db",
    размер_пула=10,
    max_overflow=20
)

# Используйте создатель сеансов, чтобы гарантировать, что каждый поток получит независимый сеанс
Сессия = создатель сеанса (привязка = двигатель)

защита sqlalchemy_task():
    сеанс = сеанс()
    попробуйте:
        # Выполняем операции
        # сеанс.execute(...)
        сеанс.коммит()
    наконец:
        session.close() # Возвращаем соединение

Хранимая процедура вызова Python

ИспользоватьMySQL

Чтобы выполнить хранимые процедуры MySQL в Python, вы можете использоватьmysql-connector-pythonилиPyMySQL。

Установочный комплект

pip install mysql-connector-python

Пример: выполнение хранимой процедуры

импортировать mysql.connector

# Подключаемся к базе данных
conn = mysql.connector.connect(
    хост="локальныйхост",
    пользователь="ваш_пользователь",
    пароль="ваш_пароль",
    база данных="ваша_база_данных"
)
курсор = conn.cursor()

# Вызов хранимой процедуры
курсор.callproc("your_stored_procedure", (param1, param2))

# Получите результаты
для результата в курсоре.stored_results():
    печать (результат.fetchall())

# Закрыть соединение
курсор.закрыть()
конн.закрыть()

Использование SQL-сервера

Чтобы выполнить хранимые процедуры SQL Server в Python, вы можете использоватьpyodbc。

Установочный комплект

pip install pyodbc

Пример: выполнение хранимой процедуры

импортировать pyodbc

# Подключаемся к SQL-серверу
conn = pyodbc.connect("DRIVER={SQL Server};"
                      "СЕРВЕР=ваш_сервер;"
                      "БАЗА ДАННЫХ=ваша_база_данных;"
                      "UID=ваш_пользователь;"
                      "PWD=ваш_пароль")
курсор = conn.cursor()

# Выполняем хранимую процедуру
курсор.execute("{CALL your_stored_procedure (?, ?)}", (param1, param2))

# Получите результаты
строки = курсор.fetchall()
для строки в строках:
    печать (строка)

# Закрыть соединение
курсор.закрыть()
конн.закрыть()

Использование PostgreSQL

Чтобы выполнить хранимые процедуры PostgreSQL в Python, вы можете использоватьpsycopg2。

Установочный комплект

pip install psycopg2

Пример: выполнение хранимой процедуры

импорт psycopg2

# Подключаемся к PostgreSQL
conn = psycopg2.connect(
    dbname="ваша_база_данных",
    пользователь="ваш_пользователь",
    пароль="ваш_пароль",
    хост="локальныйхост",
    порт="5432"
)
курсор = conn.cursor()

# Выполняем хранимую процедуру
курсор.callproc("your_stored_procedure", (param1, param2))

# Получите результаты
строки = курсор.fetchall()
для строки в строках:
    печать (строка)

# Закрыть соединение
курсор.закрыть()
конн.закрыть()

На что следует обратить внимание

Убедитесь, что имя хранимой процедуры указано правильно, и при необходимости передайте соответствующие параметры.
Если хранимая процедура имеет возвращаемое значение, используйтеfetchall()илиstored_results()чтобы получить результаты.
Синтаксис вызова в разных базах данных может немного отличаться, пожалуйста, настройте его в соответствии с используемой базой данных.

Сеть Python

Запросы пакета HTTP-запросов

иллюстрировать

requestsЭто наиболее часто используемый набор HTTP-запросов в Python, используемый для доступа к REST API, загрузки веб-страниц, отправки данных формы и т. д. Он лучше, чем встроенныйurllibБолее краткий и простой в использовании.

Способ установки


pip install requests

Основное использование

запросы на импорт

#Отправить GET-запрос
URL = "https://api.pionex.com/api/v1/common/symbols"
ответ = запросы.получить (URL)

# Проверяем, успешно ли
если ответ.код_статуса == 200:
    данные = ответ.json()
    print("Запрос успешен, поле возврата:", list(data.keys()))
еще:
    print("Запрос не выполнен:", response.status_code)

Пример POST-запроса


import requests

url = "https://httpbin.org/post"
payload = {"key": "value", "symbol": "BTC_USDT"}
headers = {"Content-Type": "application/json"}

res = requests.post(url, json=payload, headers=headers)
print(res.json())

Общие методы

метод	использовать
`requests.get()`	Получить информацию (наиболее часто используемый)
`requests.post()`	Отправьте информацию или формы
`requests.put()`	Обновить информацию
`requests.delete()`	Удалить данные
`response.status_code`	Код состояния HTTP
`response.json()`	Разобрать ответ JSON
`response.text`	Получите оригинальный текстовый контент
`response.raise_for_status()`	Автоматически генерировать исключения ошибок HTTP

Пример обработки ошибок

запросы на импорт

попробуйте:
    r = Requests.get("https://api.pionex.com/api/v1/unknown")
    r.raise_for_status()
кроме запросов.исключения.HTTPError как e:
    print("Ошибка HTTP:", e)
кроме запросов.исключения.RequestException как e:
    print("Общая ошибка запроса:", e)

Пополнить

Может использоваться для REST API, автоматических сканеров, вызовов веб-перехватчиков и многого другого.
Поддерживает JSON, формы, загрузку файлов и другие форматы.
иpandasилиasyncioЕго можно использовать для получения больших объемов данных.

Проверьте коды состояния HTTP

иллюстрировать

raise_for_status()даrequestsВ модулеResponseМетод объекта, используемый для проверки того, является ли код состояния ответа HTTP ошибкой (например, 4xx или 5xx).

Если код состояния показывает, что запрос не выполнен, он автоматически выдастrequests.exceptions.HTTPErrorИсключения используются для облегчения отладки или остановки выполнения.

пример

запросы на импорт

URL = "https://api.pionex.com/api/v1/common/symbols"
ответ = запросы.получить (URL)

# Проверьте, успешен ли код состояния HTTP (200~299).
ответ.raise_for_status()

# В случае успеха JSON можно безопасно проанализировать
данные = ответ.json()
print("Запрос выполнен успешно, получено количество торговых пар:", len(data.get("data", [])))

Результат выполнения

Запрос прошел успешно, получено количество торговых пар: 248.

Пример обработки ошибок

запросы на импорт

попробуйте:
    r = Requests.get("https://api.pionex.com/api/v1/invalid_endpoint")
    r.raise_for_status()
кроме запросов.исключения.HTTPError как e:
    print("Ошибка HTTP:", e)
кроме запросов.исключения.RequestException как e:
    print("Исключение запроса:", e)

Пополнить

В статусе успеха (200~299) ошибок не будет.
Если API реагирует на статус ошибки, например 404 или 500, он будет автоматически выдан.HTTPError。
Это очень полезный механизм проверки безопасности при написании программ REST API.

Python Web API

Используйте модуль запросов для вызова API

запросы на импорт

# Вызов API
URL = "https://api.example.com/data"
ответ = запросы.получить (URL)

# Подтверждаем, что ответ успешен
если ответ.код_статуса == 200:
    print("Данные получены успешно")
еще:
    print(f"Ошибка: {response.status_code}")

Разобрать ответ JSON

# Анализ ответа JSON
данные = ответ.json()

#Доступ к данным JSON
печать(данные["ключ1"])
print(данные["ключ2"]["подключ"])

Пример: вызов и анализ

запросы на импорт

# URL-адрес API
URL = "https://jsonplaceholder.typicode.com/posts"

# Отправить запрос
ответ = запросы.получить (URL)

# Проверить статус ответа и проанализировать
если ответ.код_статуса == 200:
    данные = ответ.json()
    # Перечислите названия каждой статьи
    для публикации в данных:
        print(f"Идентификатор сообщения: {post['id']}, заголовок: {post['title']}")
еще:
    print(f"Ошибка вызова API, код состояния: {response.status_code}")

Обработка исключений JSON

попробуйте:
    данные = ответ.json()
    распечатать (данные)
кроме ValueError:
    print("Ответ не в допустимом формате JSON")

На что следует обратить внимание

Подвести итог

JSON cache

иллюстрировать

Python предоставляетjsonМодуль конвертации (сериализации) данных в формат JSON, И его можно сохранить как файл (дамп) или перезагрузить (загрузить) для достижения эффекта кэширования.

Часто используемые функции

json.dump(obj, file): записать объект Python в файл (формат JSON).
json.dumps(obj): преобразовать объект в строку JSON.
json.load(file): прочитать JSON из файла и преобразовать его обратно в объект Python.
json.loads(str): преобразовать строку JSON обратно в объект Python.

Пример: кэшировать данные в файл, а затем прочитать их.

импортировать JSON
импортировать ОС

файл_кэша = "кэш_данных.json"

# Источник данных моделирования
данные = {
    "имя": "Алиса",
    «возраст»: 30,
    "хобби": ["чтение", "музыка", "программирование"]
}

#Запись данных в файл JSON (дамп)
с open(cache_file, "w",coding="utf-8") как f:
    json.dump(данные, f, обеспечения_ascii=False, отступ=2)

print("Данные в файле кэшированы.")

# Чтение данных JSON из файла (загрузка)
если os.path.exists(cache_file):
    с open(cache_file, "r",coding="utf-8") как f:
        загруженные_данные = json.load(f)
    print("Загруженные данные:", loading_data)

Вывод результатов

Данные были кэшированы в файле.
Загруженные данные: {'имя': 'Алиса', 'возраст': 30, 'хобби': ['чтение', 'музыка', 'программирование']}

иллюстрировать

ensure_ascii=False: Убедитесь, что китайские символы не преобразуются в кодировку Unicode.
indent=2: сделать файл JSON более читабельным.
json.load()Автоматически восстановит JSON до соответствующих типов, таких как dict, list, int, str и т. д.

Пример. Кэширование результатов вычислений с использованием JSON.

импортировать JSON, ОС

CACHE_PATH = "result_cache.json"

защита дорогой_расчет():
    print("Выполнение сложной операции...")
    вернуть [x**2 для x в диапазоне (5)]

защита get_cached_result():
    #Загружаем кэш, если он существует
    если os.path.exists(CACHE_PATH):
        с open(CACHE_PATH, "r") как f:
            вернуть json.load(f)
    # В противном случае запись в кеш после расчета
    результат = дорогой_расчет()
    с open(CACHE_PATH, "w") как f:
        json.dump(результат, е)
    вернуть результат

данные = get_cached_result()
print("Получить данные:", данные)

Результаты вывода (первое выполнение)

Выполнение сложных операций...
Получить данные: [0, 1, 4, 9, 16]

Результаты вывода (второе выполнение)

Получить данные: [0, 1, 4, 9, 16]

Подвести итог

json.dump(): Запись в файл JSON.
json.load(): Чтение из файла JSON.
Его можно использовать для кэширования результатов вычислений и сокращения повторных операций.
При необходимости доступно экспресс-тестирование.dumps()иloads()Обработка строк.

Преобразование данных базы данных в список JSON

В Python используйте встроенныйjsonМодули — лучший способ сериализовать структуры данных Python, такие как списки и словари, в формат JSON. Ваша целевая структура соответствует в Python списку, содержащему словари.

1. Результаты запроса к базе данных

Предположим, что данные, которые вы получаете в результате запроса к базе данных, уже представляют собой список, каждый элемент которого является словарем, а имена ключей соответствуют нужным вам именам полей JSON.

db_data = [
    {'время': 1759028400000, 'открытие': '109398.3', 'закрытие': '109364.8', 'высокая': '109489.2', 'низкая': '109364.8', 'объем': '518.7594'},
    {'время': 1759024800000, 'открытие': '109305.6', 'закрытие': '109398.3', 'высокая': '109496.4', 'низкая': '109296.0', 'объем': '757.0290'},
    # ... дополнительные данные
]

2. Этапы преобразования: используйте`json.dumps()`

Вам просто нужно импортироватьjsonмодуль и использоватьjson.dumps()Функция преобразует объект списка Python в строку в формате JSON.

импортировать JSON

# Предположим, что db_data готова

# Используйте json.dumps() для сериализации списков Python в строки JSON
# indent=4 используется для украшения вывода и облегчения чтения.
json_output_string = json.dumps(db_data, indent=4)

печать (json_output_string)

3. Результаты вывода (строка формата JSON)

Это создаст строку JSON, соответствующую вашей цели:

[
    {
        "time": 1759028400000,
        "open": "109398.3",
        "close": "109364.8",
        "high": "109489.2",
        "low": "109364.8",
        "volume": "518.7594"
    },
    {
        "time": 1759024800000,
        "open": "109305.6",
        "close": "109398.3",
        "high": "109496.4",
        "low": "109296.0",
        "volume": "757.0290"
    }
]

4. Общая обработка исходных результатов запроса к базе данных в списки.

Если ваш драйвер базы данных возвращает список кортежей (например:[(1759028400000, '109398.3', ...), ...]), вам необходимо преобразовать его в список словарей, прежде чем выполнять описанную выше сериализацию.

# Предположим, что имя поля следующее
field_names = ['время', 'открытие', 'закрытие', 'высокий', 'низкий', 'объем']
кортеж_данные = [
    (1759028400000, '109398.3', '109364.8', '109489.2', '109364.8', '518.7594'),
    #...
]

# Понимание списка
список_диктов = [
    dict(zip(field_names, row))
    для строки в tuple_data
]

# Теперь list_of_dicts можно передавать непосредственно в json.dumps() для сериализации.

Вывод JSON веб-API Python

В Python способ реализации веб-API и вывода JSON зависит от используемой вами платформы. Наиболее непосредственно соответствует PHPecho json_encode()Логика встроена с использованием PythonjsonМодули, но в веб-среде заголовки обычно автоматически обрабатываются с помощью инструментов, предоставляемых платформой.

1. Используйте FastAPI (на данный момент наиболее рекомендуемый)

FastAPI — лучший выбор для современной разработки Python, он автоматически преобразует файлы Pythondict(словарь) илиlist(список) в JSON и установите правильныйContent-Type。

из fastapi импортировать FastAPI

приложение = ФастAPI()

@app.get("/api/stocks")
защита get_stocks():
    # Непосредственно возвращаем словарь Python, FastAPI автоматически обрабатывает json_encode
    data = ["AAPL", "TSLA", "NVDA", "GOOGL"]
    вернуть {"акции": данные}

2. Используйте Flask (самый классический)

В Flask официально представленоjsonifyФункция, помимо преобразования данных, также поможет вам установить заголовок ответа наapplication/json。

из фляги импорта Flask, jsonify

приложение = Колба(__name__)

@app.route('/api/stocks')
защита get_stocks():
    data = ["AAPL", "TSLA", "NVDA", "GOOGL"]
    # Эквивалент PHP echo json_encode($data) и добавления заголовка
    вернуть jsonify (данные)

3. Использование Django Ninja/REST Framework

Если вы используете большой фреймворк Django, вы обычно будете использоватьJsonResponseобъект.

from django.http import JsonResponse

def stock_api(request):
    data = {"stocks": ["AAPL", "TSLA"]}
    return JsonResponse(data)

4. Собственный Python (не веб-среда)

Если вы просто хотите просто получить строку JSON (например, записать в файл или настроить вывод), вы можете использоватьjson.dumps()。

импортировать JSON

data = {"name": "Близнецы", "возраст": 18}
# Это наиболее близкая к низкоуровневой реализации PHP json_encode()
json_string = json.dumps(данные)
печать (json_string)

Сравнительная таблица соответствия

Функция	PHP (Vanilla)	Python (FastAPI / Flask)
Установить заголовки JSON	`header('Content-Type: application/json')`	Автоматическая обработка кадров (с использованием`return dict`или`jsonify`)
Объект в строку JSON	`json_encode($data)`	`json.dumps(data)`
Выход и конец	`echo ...; exit;`	`return ...`

Предложения по развитию

автоматизация:Фреймворки Python часто умнее, чем родной PHP, вам просто нужноreturnСловарь, и они сделают за вас все преобразования форматов.
эффективность:Если вы создаете высокопроизводительный API, рекомендуется выбратьFastAPI, основанный на асинхронном режиме (async/await) и почти такой же быстрый, как Node.js.

Google API

основной рабочий механизм

Google API — это в основном сервис, предоставляемый через Google Cloud Platform (GCP), позволяющий разработчикам получать доступ к различным функциям Google (таким как поиск, карты, облачные диски и т. д.). Большинство API Google следуют архитектуре RESTful и используют формат JSON для обмена данными.

1. Контроль прав доступа (Аутентификация)

Прежде чем использовать какой-либо API Google, необходимо сначала создать проект в Google Cloud Console и настроить метод аутентификации. В основном делится на два типа:

API Key: Подходит для доступа к общедоступным данным (таким как общедоступная информация о видео YouTube, Карты Google). Уровень безопасности ниже и ограничивает только источник.
OAuth 2.0: подходит для доступа к личным данным пользователя (например, чтения почты Gmail пользователя, изменения файлов на облачном диске). Требуется авторизация пользователя.
Сервисный аккаунт: Подходит для связи между серверами, для авторизации не требуется ручное вмешательство.

2. Часто используемые библиотеки и инструменты.

В Python для упрощения разработки официально рекомендуются следующие библиотеки:

google-api-python-client: Универсальный API-клиент для большинства служб Discovery.
google-auth: Специально обрабатывает аутентификацию и управление токенами.
google-cloud-storage / google-cloud-vision: Клиентская библиотека, оптимизированная для конкретных облачных сервисов.

3. Используйте этапы процесса

Включить API: Найдите и запустите необходимую службу (например, YouTube Data API v3) в библиотеке «API и службы» консоли GCP.
Создать учетные данные: Загрузите закрытый ключ (служебный аккаунт) в формате JSON или получите ключ API.
Установить SDK:использоватьpip install google-api-python-client google-auth-httplib2 google-auth-oauthlib。
Написать код: Инициализируйте объект Service и вызовитеexecute()。

4. Важные ограничения и квоты (Квоты)

API Google не являются полностью бесплатными и неограниченными. Каждый API имеет свой собственный метод выставления счетов по квоте:

Единицы: Например, API YouTube имеет базовую квоту в 10 000 баллов в день, простое чтение потребляет 1 балл, а загрузка видео может потреблять 1600 баллов.
Ограничения ставок: Ограничить количество запросов в секунду или в минуту. В случае превышения будет возвращена ошибка 429 Too Many Requests.

5. Таблица общих категорий API

категория	Представитель API	Основная цель
Автоматизация работы	Google Sheets / Calendar / Gmail	Автоматизируйте формы, планируйте и отправляйте электронные письма.
Данные и хранение	Cloud Storage / BigQuery	Храните большие файлы и выполняйте анализ больших данных.
ИИ	Vision / Translation / Natural Language	Распознавание изображений, перевод текста и анализ настроений.
мультимедиа	YouTube Data API	Ищите видео и управляйте содержимым канала.

Google API Service

основные понятия

Используйте API Google (например, YouTube, Drive, Gmail и т. д.) в Python, обычно черезgoogle-api-python-clientв библиотекеbuildфункция для создания объекта службы. Этот объект инкапсулирует все методы API и является вашим основным каналом связи с серверами Google.

1. Основной метод инициализации

Чтобы создать объект службы, вам потребуются имя API, версия и ключ аутентификации (ключ API) или учетные данные (OAuth2).

из сборки импорта googleapiclient.discovery

# Инициализируем API данных YouTube v3
ютуб = сборка(
    'ютуб',
    'v3',
    DeveloperKey = 'ВАШ_API_KEY'
)

# Пример вызова API
запрос = youtube.videos().list(part="snippet", id="dQw4w9WgXcQ")
ответ = запрос.выполнить()

2. Ручка безопасности резьбы (Thread Safety)

Это основная причина, по которой вы столкнулись с аварией раньше.build()Сгенерированный объект Service и его внутренниеhttpобъект транспортного уровняНе потокобезопасноиз. В многопоточной среде обязательно следуйте следующим рекомендациям:

Не делитесь глобально: запретить нескольким потокам выполнения вызывать один и тот жеyoutube.execute()。
Ленивая инициализация: в каждой темеrun()Выполняется в методеbuild()。
Использовать ограниченную службу: Убедитесь, что каждый поток выполнения имеет независимыйgoogleapiclient.discovery.ResourceПример.

3. Оптимизация производительности соединения.

звоните частоbuild()Производительность будет снижена из-за повторной загрузки «Документа обнаружения» (дополнительная задержка примерно 1-2 секунды). Вы можете оптимизировать:

# Отключите загрузку файлов исследования (если вы установили предварительно скомпилированные библиотеки или хотите ускорить работу)
# Примечание. Для этого необходимо, чтобы в вашей среде уже были соответствующие определения.
youtube = build('youtube', 'v3', DeveloperKey='KEY', static_discovery=True)

4. Обработка ошибок и управление квотами

Наиболее распространенная ошибка, возникающая при вызове методов службы:HttpError. Вы должны поймать его, чтобы справиться с исчерпанием квоты или проблемами с разрешениями.

из googleapiclient.errors импортировать HttpError

попробуйте:
    ответ = youtube.channels().list(part="statistics", mine=True).execute()
кроме HttpError как e:
    если e.resp.status == 403:
        print("Квота API исчерпана или недостаточно разрешений")
    элиф e.resp.status == 401:
        print("Аутентификация недействительна")
    еще:
        print(f"Ошибка HTTP: {e}")

5. Общий список услуг

API-функции	параметр имени	параметры версии
YouTube Data	'youtube'	'v3'
Google Drive	'drive'	'v3'
Google Sheets	'sheets'	'v4'
Gmail API	'gmail'	'v1'

YouTube API в многопоточном режиме

попробуй... но не поймаешь?

Если вы используете один и тот же объект службы Google API в нескольких потоках (например,YoutubeApi.youtube), вы можете столкнуться с проблемами потокобезопасности. нижнийhttplib2илиurllib3Транспортный уровень генерирует состояние гонки (Race Condition), когда несколько потоков одновременно обращаются к одному и тому же объекту соединения, что приводит к сбою программы непосредственно на базовом сетевом уровне. Иногда это даже вызывает ошибку на уровне языка C, приводящую к непосредственному закрытию интерпретатора Python. Вот почемуtry...exceptПричина, по которой его нельзя перехватить.

Решение 1. Создайте отдельный объект службы для каждого потока выполнения (наиболее рекомендуется).

Не создавайте глобальный домен в основном потокеyoutubeОбъекты доступны каждому. Каждый поток должен создать свой собственный экземпляр службы API при запуске. Таким образом, каждый поток имеет собственное сетевое соединение и кэш, не мешая друг другу.

импорт потоков
из сборки импорта googleapiclient.discovery

защита get_youtube_service():
    # Вызовите эту функцию внутри каждого потока для создания независимых объектов
    return build('youtube', 'v3', DeveloperKey='YOUR_API_KEY')

защита thread_task (video_id):
    попробуйте:
        # Создайте выделенный сервис в потоке выполнения
        local_youtube = get_youtube_service()
        запрос = local_youtube.videos().list(
            part="фрагмент,статистика",
            id=video_id
        )
        ответ = запрос.выполнить()
        print(f"Успешно получено: {video_id}")
    кроме исключения как e:
        print(f"Ошибка потока: {e}")

# Запускаем несколько потоков
t1 = threading.Thread(target=thread_task, args=("vid1",))
t2 = threading.Thread(target=thread_task, args=("vid2",))
t1.start()
t2.start()

Решение 2. Используйте фиксатор резьбы (Lock)

Если вы не хотите создавать объекты повторно, вы можете использоватьthreading.LockУбедитесь, что одновременно может выполняться только один потокexecute(). Хотя это приведет к тому, что вызов API будет помещен в очередь (теряя эффект ускорения параллелизма), это гарантирует, что он не выйдет из строя.

импорт потоков

# Создаем глобальную блокировку
api_lock = резьба.Lock()

защита thread_task_with_lock(video_id):
    # Используйте с, чтобы обеспечить автоматическое снятие блокировки
    с API_lock:
        попробуйте:
            запрос = YoutubeApi.youtube.videos().list(
                часть="фрагмент",
                id=video_id
            )
            vlist = запрос.выполнить()
        кроме исключения как e:
            print(f"Ошибка: {e}")

Решение 3. Отключите проверку потоков HttpLib2 (дополнительно)

Если вы используете более старую версию клиентской библиотеки, вы можете указать ее явно при создании службы.httpобъект и сделать его непотокобезопасным или использоватьhttplib2.Http()независимый экземпляр. Но это обычно сложнее, поэтому рекомендуется отдать предпочтение варианту 1.

Сводные предложения

Вариант 1Это лучшая практика: она позволяет поддерживать скорость одновременной работы нескольких потоков и полностью избегать сбоев, вызванных совместным использованием ресурсов.
Проверьте квоты API: Многопоточные одновременные вызовы могут очень быстро потреблять 10 000 ежедневных квот, обязательно отслеживайте ошибки 403.
настройка тайм-аута: Рекомендуется добавлять при создании Сервисаsocket.setdefaulttimeout(10), чтобы предотвратить постоянное занятие ресурсов определенным потоком выполнения из-за зависания сети.

Python отправить электронное письмо

Установите необходимые пакеты

pip install smtplib email

Эти два модуля обычно встроены в Python и не требуют дополнительной установки.

Базовый пример кода

импортировать смтплиб
из email.mime.text импортировать MIMEText
из email.mime.multipart импорт MIMEMultipart

# Установите отправителя, получателя, тему и содержание
отправитель = 'ваш_адрес@example.com'
получатель = '[email protected]'
subject = 'тестовое письмо'
body = 'Это тестовое письмо, отправленное Python. '

# Создать контент электронной почты
сообщение = MIMEMultipart()
сообщение['От'] = отправитель
msg['Кому'] = получатель
msg['Тема'] = тема
msg.attach(MIMEText(тело, 'простой'))

#Отправить с помощью Gmail SMTP
smtp_server = 'smtp.gmail.com'
smtp_port=587
имя пользователя = 'ваш_адрес@example.com'
пароль = 'your_app_password' # Рекомендуется использовать пароль приложения вместо общего пароля

с smtplib.SMTP(smtp_server, smtp_port) в качестве сервера:
    сервер.starttls()
    server.login(имя пользователя, пароль)
    server.send_message(мсг)

print('Письмо было отправлено')

На что следует обратить внимание

Gmail требует включения «пароля для конкретного приложения» для нормального входа в систему.
Outlook, Yahoo и т. д. также предоставляют SMTP-серверы и порты. Настройки необходимо устанавливать в соответствии с инструкциями каждой компании.
Обязательно сохраняйте пароль своей учетной записи правильно, чтобы избежать его утечки.

Получите пароль для приложения Gmail

Предварительные условия

Для вашего аккаунта Google включена двухэтапная проверка.

Пошаговые инструкции

Откройте браузер и перейдите наАккаунт Google
Нажмите «Безопасность» в левом меню.
Найдите раздел «Войти через Google» и убедитесь, что «двухэтапная аутентификация» включена.
После включения появится опция «Пароль приложения», нажмите ее.
Введите свой пароль для входа в Google, чтобы подтвердить еще раз.
Выберите «Почта» в «Выбор приложения» и «Другое (произвольное имя)» в «Выбор устройства».
Введите имя, например «Python Script», и нажмите «Создать».
Система сгенерирует 16-значный пароль приложения, скопируйте его
Замените исходный пароль Gmail этим паролем в программе Python.

Советы по безопасности

Не сообщайте пароли приложений другим
В случае утечки пароля его можно немедленно удалить и создать заново.

Настройте правила Gmail

Подготовка

Нужно включитьGmail API。
приезжатьGoogle Cloud ConsoleСоздайте проект и включите Gmail API.
Загрузите учетные данные OAuth 2.0 (credentials.json).
Установите необходимые пакеты:pip install google-api-python-client google-auth-httplib2 google-auth-oauthlib

Создание правил Gmail (Фильтр)

Фильтры можно создавать через API Gmail, например, когда отправителем является определенный почтовый ящик, метка автоматически добавляется.

из сборки импорта googleapiclient.discovery
из google_auth_oauthlib.flow импортировать InstalledAppFlow
из google.auth.transport.requests Запрос на импорт
импортировать ОС
импортный маринованный огурец

# Требуемая область авторизации
ОБЛАСТИ = ['https://www.googleapis.com/auth/gmail.settings.basic',
          'https://www.googleapis.com/auth/gmail.modify']

защита gmail_service():
    учетные данные = нет
    если os.path.exists("token.pickle"):
        с open("token.pickle", "rb") в качестве токена:
            creds = Pickle.load(токен)

    если не creds или не creds.valid:
        если creds и creds.expired и creds.refresh_token:
            creds.refresh(Запрос())
        еще:
            поток = InstalledAppFlow.from_client_secrets_file("credentials.json", ОБЛАСТИ)
            creds = flow.run_local_server(порт=0)

        с open("token.pickle", "wb") в качестве токена:
            Pickle.dump(кредиты, токен)

    return build("gmail", "v1", учётные данные=creds)

# Создать фильтр Gmail
защита create_filter():
    service = gmail_service()

    filter_config = {
        "критерии": {
            "from": "[email protected]" # Условие: отправитель
        },
        "действие": {
            "addLabelIds": ["Label_123456"], # внутренний идентификатор ярлыка Gmail
            "removeLabelIds": ["INBOX"] # Необязательно: удалить папку "Входящие"
        }
    }

    результат = service.users().settings().filters().create(
        идентификатор пользователя="я",
        тело = filter_config
    ).execute()

    print("Создано успешно, идентификатор фильтра:", result["id"])

если __name__ == "__main__":
    create_filter()

На что следует обратить внимание

Label_123456– это идентификатор ярлыка Gmail, доступный черезusers().labels().list()получать.
При первом запуске появится всплывающее окно браузера с просьбой войти в систему с учетной записью Google и авторизовать ее.
Как только правило будет создано, вы увидите его в настройках Gmail → Фильтры и заблокированные адреса.

Обеспечьте соблюдение правил Gmail

Предварительные условия

Gmail API включен и проверка OAuth завершена.
Сначала необходимо создать правила (фильтр), и Gmail автоматически применит правила к новым электронным письмам.
Чтобы применить правило к существующим сообщениям, вам необходимо выполнить поиск через API Gmail и вручную отредактировать метку.

Автоматически применять правила

Правила (фильтр), созданные API Gmail, будут автоматически активироваться при поступлении новых писем, и никаких дополнительных «выполнений» не требуется.

Применить правила к существующим сообщениям

Используйте API Gmail для поиска совпадающих сообщений, а затем помечайте их или перемещайте в пакетном режиме.

из сборки импорта googleapiclient.discovery
из google_auth_oauthlib.flow импортировать InstalledAppFlow
из google.auth.transport.requests Запрос на импорт
импортировать ОС
импортный маринованный огурец

ОБЛАСТИ = ['https://www.googleapis.com/auth/gmail.modify']

защита gmail_service():
    учетные данные = нет
    если os.path.exists("token.pickle"):
        с open("token.pickle", "rb") в качестве токена:
            creds = Pickle.load(токен)

    если не creds или не creds.valid:
        если creds и creds.expired и creds.refresh_token:
            creds.refresh(Запрос())
        еще:
            поток = InstalledAppFlow.from_client_secrets_file("credentials.json", ОБЛАСТИ)
            creds = flow.run_local_server(порт=0)

        с open("token.pickle", "wb") в качестве токена:
            Pickle.dump(кредиты, токен)

    return build("gmail", "v1", учётные данные=creds)

#Применить правила Gmail к существующим электронным письмам
защита run_rule():
    сервис = gmail_service()

    # Критерии поиска, например from:[email protected]
    запрос = "от:[email protected]"
    результаты = service.users().messages().list(userId="me", q=query).execute()
    messages = results.get("сообщения", [])

    если нет сообщений:
        print("Нет писем, соответствующих критериям")
        возвращение

    для сообщений в сообщениях:
        service.users().messages().modify(
            идентификатор пользователя="я",
            id=msg["id"],
            тело={
                "addLabelIds": ["Label_123456"], # Добавить новый ярлык
                "removeLabelIds": ["INBOX"] # Удалить входящие
            }
        ).execute()

    print(f"{len(messages)} сообщений обработано")

если __name__ == "__main__":
    run_rule()

На что следует обратить внимание

Фильтр API Gmail может автоматически активироваться только для новых писем.
Если вы хотите «Применить правила к старым письмам», вам нужно выполнить поиск самостоятельно.qУсловия и модификации партий.
Доступен синтаксис поиска Gmail, например.from:, subject:, has:attachment。

HTTP-API-сервер Python

Самый распространенный и рекомендуемый способ создания сервера HTTP API на Python — использовать эффективную и многофункциональную веб-инфраструктуру. Ниже представлены три основные концепции и их характеристики:

1. Используйте FastAPI (рекомендуется: высокопроизводительный, современный)

FastAPI — это современная и быстрая (на базе Starlette и Pydantic) веб-инфраструктура для создания API. Он изначально поддерживает асинхронные операции (async/await) и автоматически генерирует файлы OpenAPI (Swagger UI).

Функции

Чрезвычайно быстрый, с производительностью, сравнимой с Go.
Проверка и сериализация данных на основе подсказок типов Python.
Автоматически генерировать документацию по API (Swagger UI/ReDoc).

базовый пример

# Установка: pip install fastapi uvicorn
из fastapi импортировать FastAPI

приложение = ФастAPI()

# Определить корневой маршрут (GET-запрос)
@app.get("/")
защита read_root():
    return {"Привет": "Мир"}

# Определить маршрут с параметрами
@app.get("/items/{item_id}")
Защиту read_item (item_id: int, q: str = Нет):
    вернуть {"item_id": item_id, "q": q}

# Сервер выполнения (при условии, что имя файла — main.py)
# Выполнить в терминале: uvicorn main:app --reload

2. Используйте Flask (легкий, очень гибкий)

Flask — это микрофреймворк, который упрощает ядро и позволяет разработчикам свободно выбирать такие компоненты, как базы данных и библиотеки проверки. Он подходит для небольших проектов или приложений, требующих высокой степени настройки.

Функции

Легкость обучения и низкие стартовые затраты.
Очень мало встроенных компонентов и очень гибкий.
Зрелый и имеет огромную поддержку сообщества.

базовый пример

# Установка: pip install flask
из колбы импортировать Flask, jsonify, запрос

приложение = Колба(__name__)

#Определяем маршрут API
@app.route("/data", методы=['GET'])
защита get_data():
    return jsonify({"message": "Это данные Flask API"})

#Определяем POST-маршрут
@app.route("/submit", методы=['POST'])
защита post_data():
    данные = request.get_json()
    return jsonify({"получено": данные}), 201

#Выполнить сервер
# if __name__ == '__main__':
# app.run(debug=True)

3. Используйте Django Rest Framework (DRF) (большие проекты).

DRF — это мощный инструмент для быстрого создания RESTful API на основе полнофункциональной веб-инфраструктуры Django. Он предоставляет все функции, необходимые для крупных API, таких как сериализаторы, наборы представлений модели, аутентификация и контроль разрешений.

Функции

Подходит для глубокой интеграции с Django ORM и функциями базы данных.
Предоставляет мощный автоматизированный интерфейс управления и веб-интерфейс API.
Полнофункциональный для приложений корпоративного уровня.

Примечание. Пример кода DRF длиннее и требует сначала создания проекта и приложения Django, поэтому он здесь опущен, но это лучший вариант для больших проектов.

Резюме и предложения

Если вам нужна высочайшая производительность и современные асинхронные функции, а ваш проект среднего размера, выберите **FastAPI**.
Если вам нужно быстро создать простой сервис или изучить основы веб-разработки, выберите **Flask**.
Если ваш API является частью большого приложения и требует сложного ORM, управления разрешениями и т. д., используйте **Django + DRF**.

Django

Основные особенности

ORM (реляционное сопоставление объектов): позволяет разработчикам использовать код Python для управления базой данных без написания собственных команд SQL.
Интерфейс администратора: автоматически создаваемый интерфейс управления для облегчения добавления, удаления, изменения и проверки содержимого данных.
Безопасность: встроенная защита от межсайтового сценария (XSS), подделки межсайтовых запросов (CSRF) и SQL-инъекций.
Высокая масштабируемость: он использует конструкцию со слабой связью и подходит для расширения от небольших проектов до крупных приложений уровня предприятия.

Архитектурные элементы МВТ

Модель: определяет структуру данных и схему базы данных и отвечает за логику уровня данных.
Просмотр: обрабатывает бизнес-логику и HTTP-запросы и решает, какие данные отправлять обратно пользователю.
Шаблон: отвечает за рендеринг интерфейса и встраивание данных в HTML для отображения.

Основные компоненты системы

Диспетчер URL-адресов: система маршрутизации на основе регулярных выражений, которая сопоставляет URL-адреса с конкретными функциями просмотра.
Система аутентификации: Полная система аутентификации и авторизации пользователей, включая группы разрешений и хеширование паролей.
Промежуточное программное обеспечение: система перехватчиков для обработки запросов и ответов, которую можно использовать для ведения журналов, сжатия Gzip и т. д.
Миграции: система миграции базы данных, которая отслеживает изменения модели и синхронизирует их со структурой базы данных.
Формы: предоставляет мощные функции обработки и проверки форм, упрощающие взаимодействие между HTML-формами и обработкой данных.

Django REST

Основные особенности

API для веб-браузера: встроенный визуальный веб-интерфейс позволяет разработчикам тестировать конечные точки API непосредственно в браузере.
Сериализация: поддерживает преобразование сложных структур данных (таких как наборы запросов или экземпляры моделей) в JSON, XML или другие типы контента.
Система аутентификации и разрешений: включает несколько встроенных схем аутентификации, таких как OAuth1, OAuth2, сеанс и токен.
Широкие возможности настройки: от логики представления до методов сериализации — для расширения предоставляется множество функций-перехватчиков.

Основные компоненты

Сериализаторы: отвечают за двунаправленное преобразование данных, обработку сериализации из модели базы данных в JSON, а также проверку и десериализацию из данных запроса в модель.
Наборы представлений: инкапсулируйте логику нескольких связанных представлений в одной категории (например, «Список», «Создание», «Извлечение», «Обновление», «Уничтожение»).
Маршрутизаторы: автоматически обрабатывают конфигурацию URL-адресов ViewSets, сокращая рабочую нагрузку по написанию маршрутов вручную.
APIView: базовый класс представлений DRF, который обеспечивает более мощный механизм обработки запросов и ответов, чем собственный вид Django.
Разрешения: определяет, есть ли у пользователя разрешение на выполнение определенного действия, например IsAuthenticated или IsAdminUser.
Регулирование: Ограничьте частоту запросов API, чтобы предотвратить злонамеренную атаку или перегрузку системы.
Парсеры и средства рендеринга: отвечают за анализ содержимого входящего запроса (например, данных JSON или формы) и определение выходного формата.

Расширенные функции

Общие представления: предоставляет часто используемые предопределенные представления для быстрого создания стандартных интерфейсов CRUD.
Фильтрация и поиск: интегрируйте сторонние пакеты или встроенные механизмы, чтобы легко реализовать фильтрацию, сортировку и полнотекстовый поиск данных.
Разбивка на страницы: встроенные методы разбивки по страницам (такие как PageNumber, LimitOffset, Cursor) для повышения производительности обработки больших данных.
Управление версиями: поддерживает несколько стратегий управления версиями API для обеспечения обратной совместимости во время обновлений серверной части.

Django Ninja

Основные преимущества

Высокая производительность: на основе Pydantic для проверки и сериализации данных, а также глубокая оптимизация скорости выполнения.
Асинхронная поддержка: встроенная поддержка операций async/await, которая может эффективно улучшить возможности обработки в сценариях с высоким уровнем параллелизма.
Автоматизированное документирование: встроенный пользовательский интерфейс Swagger и ReDoc. Вам нужно только определить маршруты и типы для автоматического создания интерактивных документов API.
Безопасность типов: полностью использует подсказки типов Python 3.6+ для обеспечения мощного завершения редактирования и статической проверки.
Простота интеграции: легко интегрируется с Django ORM и системой аутентификации, подходит для быстрой разработки RESTful API.

Основные компоненты

NinjaAPI: основной экземпляр платформы, используемый для регистрации маршрутов, установки путей к файлам и управления глобальной обработкой исключений.
Схема: на основе структуры данных, определенной Pydantic, она отвечает за проверку параметров запроса и сериализацию данных ответа.
Маршрутизатор: используется для разделения логики API на различные модули для облегчения управления структурой маршрутизации в крупных проектах.
ModelSchema: схема, разработанная специально для моделей Django, которая может автоматически генерировать соответствующие определения полей из моделей базы данных.
Аутентификация: предоставляет несколько встроенных механизмов аутентификации, таких как APIKey, HttpBasic, HttpBearer и аутентификация сеанса.
Анализаторы запросов/ответов: автоматически обрабатывают анализ JSON, данных формы, параметров пути и строк запроса.

Функции

Внедрение зависимостей: предоставляет простой механизм внедрения зависимостей для облегчения совместного использования логики (например, подключения или конфигурации базы данных) в различных операциях.
Обработка файлов: упрощает процесс загрузки и скачивания файлов и интегрируется с системой хранения Django.
Обработка ошибок: позволяет настраиваемым обработчикам исключений преобразовывать сообщения об ошибках в стандартный формат JSON и отправлять их обратно клиенту.
Управление версиями: поддерживает запуск нескольких версий API в одном проекте Django, разделенных разными префиксами пути.

Реализация маршрутизации FastAPI по категориям

Хотя идиоматический подход к FastAPI заключается в использовании декораторов@app.get()Украшайте функции напрямую, но для лучшей организации и структурирования больших приложений (особенно при использовании внедрения зависимостей или модульности маршрутов) вы можете инкапсулировать обработчики маршрутов в классы, часто называемые шаблоном «APIRouter» или «представлениями на основе классов».

Для этого необходимо использовать **fastapi.APIRouter** и **декораторы методов** для достижения этой цели.

1. Структура файла и определение категории.

мы будем использоватьAPIRouterчтобы определить маршрут, а затем зарегистрировать метод класса в качестве обработчика.

# Установка: pip install fastapi uvicorn
из импорта fastapi APIRouter, FastAPI, зависит
от ввода импорта с аннотациями

# Шаг 1. Создайте экземпляр APIRouter
маршрутизатор = APIRouter(
    prefix="/api/v1", # Установите префикс для этой группы маршрутизации
    tags=["items"] # Используется для классификации файлов.
)

# Шаг 2: Определите категории, содержащие логику маршрутизации
класс ItemService:
    """Обрабатывать всю бизнес-логику, связанную с объектами, и обработку маршрутизации"""
    
    def __init__(self, db_dependenty: str):
        # Имитация внедрения зависимостей (Dependency Injection)
        self.db_connection = зависимость_дб

    # Используйте @router.get для оформления методов класса
    @router.get("/")
    защита read_root (сам):
        # Реализовать логику read_root
        return {"message": "Hello World из класса ItemService!", "db_status": self.db_connection}

    # Реализуем логику read_item
    # Параметр {item_id} берется из URL-пути
    @router.get("/{item_id}")
    def read_item(self, item_id: int, q: str | None = None):
        вернуть {
            "item_id": item_id,
            «запрос»: q,
            "status": "Обработка завершена"
        }

#Вспомогательная функция: имитация внедрения зависимостей (Dependency)
защита get_db():
    # На практике это вернет соединение с базой данных
    вернуть «База данных успешно подключена»

# Шаг 3. Создайте фабричную функцию для экземпляров классов и внедрите зависимости.
# Annotated[str, Depends(get_db)] указывает, что db_connection предоставляется get_db
def get_item_service(db_connection: Annotated[str, Depends(get_db)]):
    # Возвращаем экземпляр ItemService
    вернуть ItemService (db_connection)

# Шаг 4. Создайте субъект приложения FastAPI
приложение = ФастAPI()

# Шаг 5: Ядро! Используйте Depends для монтирования методов класса ItemService в приложение.
# Здесь используются зависимости, чтобы FastAPI знал, как получить экземпляр ItemService
app.include_router(
    маршрутизатор,
    зависимости = [Зависит (get_item_service)]
)

2. Эксплуатация и тестирование

Сохраните приведенный выше код какmain.pyи запустите сервер Uvicorn:

uvicorn main:app --reload

Доступ к `/api/v1/` запуститItemService.read_rootметод.
Доступ к `/api/v1/123?q=test` запуститItemService.read_itemметод.

3. Резюме

Ключом к этому шаблону является:

использоватьAPIRouterопределять маршруты.
Использовать метод категории@router.get/@router.postи другие декораторы.
Используйте **Внедрение зависимостей (зависит)**, чтобы получить экземпляр класса и включить его вapp.include_routerизdependenciesпараметры.

Преимущество этого в том, что бизнес-логика (вItemService(внутренний) отделен от определения маршрутизации, что улучшает модульность и тестируемость программного кода.

Остановка сервера Flask

1. Ручная остановка в среде разработки (чаще всего используется)

Если вы запускаете приложение Flask в терминале и запускаете его с помощью app.run(), самый простой способ — использовать сигнал прерывания клавиатуры.

Используйте: Ctrl + C.
Действие: Нажмите эту комбинацию клавиш в окне терминала, на котором запущен сервер Flask.
Как это работает: это отправляет SIGINT (сигнал прерывания) программе Python, позволяя ей полностью завершить работу сервера и выйти.

2. Автоматическая остановка в программе (тестовый или специальный сценарий)

При модульном тестировании или сценариях, когда вам необходимо автоматически завершить работу сервера после выполнения определенной операции, вам необходимо отправить команду остановки через код.

A. Используйте метод завершения работы werkzeug.serving (рекомендуется)

Встроенный сервер разработки Flask фактически использует библиотеку Werkzeug. Вы можете отправить на сервер определенный HTTP-запрос, чтобы он отключился. Для этого необходимо определить специальный маршрут в вашем приложении.

из колбы импорт колбы, запрос

приложение = Колба(__name__)

# Определить секретный маршрут выключения
@app.route('/shutdown', методы=['POST'])
защита Shutdown_server():
    # Убедитесь, что только авторизованные пользователи могут звонить в эту конечную точку
    
    func = request.environ.get('werkzeug.server.shutdown')
    если функция равна Нет:
        поднять RuntimeError('Не работает на сервере разработки Werkzeug')
    
    func() # Вызов закрывающей функции
    return 'Сервер отключается...'

# ... другие маршруты ...

# Отправьте POST-запрос по адресу http://127.0.0.1:5000/shutdown в другой программе или скрипте, чтобы выключить сервер.

Б. Запуск в отдельном потоке или процессе (неблокирующий)

По умолчанию app.run() блокируется. Чтобы продолжить выполнение другой логики в основном коде, оставляя сервер работающим в фоновом режиме, вам необходимо использоватьthreadingилиmultiprocessingМоды.

импорт потоков
время импорта
из колбы импорта колбы

приложение = Колба(__name__)
# ...ваш маршрут...

защита run_server():
    # Примечание: debug=True не следует использовать в производственных средах.
    app.run(порт=5000)

# Запускаем сервер в новом потоке
поток = threading.Thread(target=run_server)
поток.start()

print("Сервер Flask запущен в фоновом режиме...")

# Даем серверу поработать некоторое время
время.сон(5)

# (Завершение работы программы) В этом режиме потока нет встроенной простой функции завершения работы.
# Вы должны использовать указанный выше маршрут /shutdown или завершить поток напрямую (не рекомендуется, может быть нечисто).

# Пример: дождитесь завершения потока сервера (после остановки Ctrl+C)
# поток.join()

3. Остановка производства (с использованием Gunicorn, uWSGI и т.п.)

В производственной среде вы не будете использовать app.run(). Вы будете использовать сервер WSGI (например, Gunicorn или uWSGI). Чтобы остановить эти серверы:

Использование: Отправьте сигнал SIGTERM или SIGKILL в основную программу Gunicorn или uWSGI.
Действие: Обычно с помощью команды операционной системы (например, `kill` Или используйте управление службами systemd/supervisor) для завершения.

Определите текущую серверную среду Flask

Когда приложение Flask не работает на сервере разработки Werkzeug по умолчанию (например, в производственной среде, использующей Gunicorn, uWSGI или другие серверы ASGI), наиболее надежный способ определить текущую среду — проверить **переменные среды WSGI/ASGI** (т.request.environилиrequest.scope）。

1. Используйте`request.environ`(Применяется к серверам WSGI, таким как Gunicorn)

В функции маршрута Flask вы можете получить доступrequest.environСловарь, который проверяет определенные ключи, установленные сервером WSGI, для определения типа сервера.

Примеры реализации Python

из фляги импорт колбы, запрос, jsonify

приложение = Колба(__name__)

@app.route('/server_info')
защита get_server_info():
    
    # По умолчанию: предполагается, что сервер разработки Werkzeug
    server_name = "Werkzeug (Сервер разработки)"
    
    # Проверьте общие идентификаторы серверов WSGI
    
    # Проверьте Ганикорн
    если «gunicorn.version» в request.environ:
        имя_сервера = f"Gunicorn (версия: {request.environ.get('gunicorn.version')})"
    
    # Проверьте uWSGI
    elif 'uwsgi.version' в request.environ:
        # uWSGI обычно не имеет стандартного ключа версии, но имеет определенные переменные среды
        имя_сервера = "uWSGI"
    
    # Проверка официантки (обычный производственный WSGI-сервер)
    elif 'waitress.version' в request.environ:
        имя_сервера = f"Официантка (версия: {request.environ.get('waitress.version')})"

    # Проверьте общие идентификаторы других серверов WSGI
    elif 'SERVER_SOFTWARE' в request.environ:
        # Многие серверы устанавливают этот стандартный ключ WSGI
        имя_сервера = request.environ.get('SERVER_SOFTWARE')
        
    # Если werkzeug.server.shutdown существует, то это почти наверняка Werkzeug
    elif 'werkzeug.server.shutdown' в request.environ:
        server_name = "Werkzeug (сервер разработки, возможно завершение работы)"
        
    вернуть jsonify({
        "текущий_сервер": имя_сервера,
        "is_dev_server": (имя_сервера.startswith("Werkzeug"))
    })

# Запускаем приложение
# if __name__ == '__main__':
# app.run(debug=True)

2. Основная логика суждения

В логике завершения работы вашего сервера вы можете использовать эту проверку напрямую, чтобы решить, следует ли выполнять `shutdown_func`:

из запроса на импорт колбы, jsonify

@app.route('/shutdown', методы=['POST'])
защита Shutdown_server():
    Shutdown_func = request.environ.get('werkzeug.server.shutdown')

    если параметр «shutdown_func» равен «Нет»:
        # Среда, не относящаяся к Werkzeug (обычно производственная среда)
        вернуть jsonify({
            "error": "Эта конечная точка предназначена только для сред разработки. Используйте команды операционной системы, чтобы остановить сервер."
        }), 400
    
    #WerkzeugEnvironment
    Shutdown_func()
    return jsonify({"message": "Сервер отключается..."}), 200

3. Почему мы не можем просто посмотреть SERVER_SOFTWARE?

Хотя `SERVER_SOFTWARE` является стандартной переменной среды WSGI, она не обязательно задается всеми серверами, или формат настройки не обязательно является стандартным. Проверка уникального ключа для конкретной конфигурации сервера (например, «gunicorn.version») — наиболее надежный способ.

Flask получает входящие параметры API

В Flask он используется для обработки параметров строки запроса в URL-адресах (например,/my_api?abc=3&def=xyвabcиdef) основные инструменты взяты изflaskМодульныйrequestобъект. Вы можете использоватьrequest.argsСловарь для доступа к этим параметрам.

1. Используйте`request.args`словарь

request.args— объект, похожий на словарь, который содержит вопросительные знаки (?) после всех пар ключ-значение.

Примеры реализации Python

из фляги импорт колбы, запрос, jsonify

приложение = Колба(__name__)

@app.route('/my_api', методы=['GET'])
защита get_query_parameters():
    
    #Доступ ко всему словарю параметров запроса
    all_params = request.args
    print(f"Все параметры: {all_params}")
    
    # --- Метод получения определенных параметров ---
    
    # 1. Используйте .get() для получения параметров (рекомендуется: безопасно и предоставляет значения по умолчанию).
    # Получите параметр «abc», по умолчанию «Нет», если он не существует.
    abc_value = request.args.get('abc')
    
    # Получите параметр «def», если он не существует, по умолчанию будет установлено значение «default_value».
    def_value = request.args.get('def', 'default_value')
    
    # 2. Для доступа напрямую используйте [] (не рекомендуется: KeyError будет выдан, если параметр не существует)
    # попробуйте:
    # требуемый_парам = request.args['требуется']
    # кроме KeyError:
    # требуемый_парам = "Отсутствует"

    # --- Обработка многозначных параметров ---
    # Если URL-адрес /my_api?item=apple&item=banana
    item_list = request.args.getlist('item') # Возврат ['apple', 'banana']
    
    вернуть jsonify({
        "статус": "успех",
        «abc»: abc_value,
        "def": def_value,
        "item_list": item_list
    })

если __name__ == '__main__':
    # Тестовый URL 1: http://127.0.0.1:5000/my_api?abc=3&def=xy&item=A&item=B
    # Тестовый URL 2: http://127.0.0.1:5000/my_api
    app.run(отладка=Истина)

2. Описание основных методов

метод	использовать	Поведение	пример
`request.args.get('key')`	Безопасное получение одного параметра	Если параметр не существует, верните`None`, ошибка не возникнет.	`request.args.get('user')`
`request.args.get('key', 'default')`	Получить параметры и указать значения по умолчанию	Если параметр не существует, возвращает указанное вами значение по умолчанию.	`request.args.get('page', 1)`
`request.args['key']`	Прямой доступ к параметрам	Если параметр не существует, он выдаст`KeyError`ошибка, приводящая к ошибке сервера 500.	`request.args['id']`
`request.args.getlist('key')`	Получить несколько параметров с одинаковым именем	Возвращает список, содержащий все значения.	`request.args.getlist('filter')`

3. Обработка преобразования типа

отrequest.argsВсе полученные значения являются строками. Если аргумент должен быть числом или логическим значением, вам необходимо выполнить преобразование типа вручную:

# Получить параметры (строку)
num_str = request.args.get('num', '0')

#Преобразовать в целое число
попробуйте:
    num_int = int(num_str)
кроме ValueError:
    num_int = 0 # Обработать ошибку преобразования

# Преобразование в логическое значение (обратите внимание: все непустые строки имеют значение True в Python)
bool_str = request.args.get('is_admin', 'false').lower()
is_admin = bool_str == 'истина'

Динамически генерировать имена маршрутов Flask

В Flask ключом к различению маршрута является конечная точка, а не имя функции, которое вы определяете в своем коде Python. Вы можете использовать циклы и функции закрытия (Closure) Python для динамического определения и регистрации маршрутов, а также назначения им уникальных конечных точек.

1. Решение: используйте параметры и замыкания конечной точки (рекомендуется).

Мы будем использовать фабричную функцию для создания каждого процессора маршрута и указывать уникальное имя «конечной точки» при его регистрации.

Примеры реализации Python

из фляги импорта Flask, jsonify
импортировать ОС

приложение = Колба(__name__)

# Предполагая, что это ваш источник данных
динамический_апис = {
    "user_info": {"метод": "GET", "обработчик": лямбда: {"данные": "Информация пользователя получена"}},
    "product_list": {"метод": "GET", "обработчик": лямбда: {"данные": "Товары в списке"}},
    "submit_form": {"method": "POST", "handler": лямбда: {"data": "Форма отправлена"}, "methods": ['POST']},
}

filename_base = "db_agent"

# --- Основная логика: функция фабрики маршрутизации ---

Защиту create_dynamic_route (funstr, handler_func, методы):
    """
    Создайте и верните функцию обработчика маршрута (закрытие).
    Эта функция фиксирует значения funstr и handler_func.
    """
    защита Dynamic_route_handler():
        # Имя функции фиксировано, но доступ к funstr возможен во время выполнения
        print(f"Обработка запроса: {funstr}")
        
        # Выполняем реальную бизнес-логику
        результат = handler_func()
        
        вернуть jsonify (результат)
    
    # Возвращаем созданную функцию
    вернуть динамический_route_handler

# --- Цикл динамической регистрации ---

для funstr, api_info в Dynamic_apis.items():
    
    # 1. Создайте URL-путь
    url_path = f"/{filename_base}/{funstr}"
    
    # 2. Определите имя конечной точки (используйте funstr для обеспечения уникальности)
    endpoint_name = f"{filename_base}_{funstr}_api"
    
    # 3. Получить HTTP-метод
    методы = api_info.get("methods", ['GET']) # По умолчанию — GET
    
    # 4. Создать функцию обработки маршрутизации
    handler_func = create_dynamic_route(funstr, api_info["handler"], методы)

    # 5. Зарегистрировать маршрут
    # Используйте параметр endpoint=, чтобы указать уникальное имя вместо имени функции
    app.add_url_rule(
        URL_путь,
        конечная точка=имя_конечной_точки,
        view_func=handler_func,
        методы = методы
    )
    
    print(f"Зарегистрированный маршрут: {url_path} (Конечная точка: {endpoint_name})")"


если __name__ == '__main__':
    # Тестовая конечная точка, например: http://127.0.0.1:5000/db_agent/user_info
    app.run(отладка=Истина)

2. Анализ ключевых моментов

Использование `app.add_url_rule()`: это предпочтительный способ программной регистрации маршрутов, заменяющий синтаксис декоратора.
Конечная точка: в app.add_url_rule() мы должны использовать параметр endpoint, чтобы указать уникальное имя (например, db_agent_user_info_api). Это имя является ключом, используемым внутри Flask для управления маршрутами и ссылки на них (например, в `url_for()`).
Закрытие: ключевой функцией является функция create_dynamic_route. Он возвращает внутреннюю функцию «dynamic_route_handler», которая «закрывает» (фиксирует и запоминает) текущие значения переменных «funstr» и «handler_func» в цикле, гарантируя, что каждый обработчик маршрута может правильно выполнить соответствующую логику.
Имя функции (`get_???`): поскольку мы используем параметр `endpoint`, Python не нужно указывать уникальное имя для каждой динамически создаваемой функции. Мы можем напрямую использовать общее имя handler_func.

Gradio

Gradio— это библиотека Python с открытым исходным кодом, предназначенная для того, чтобы сделать модели машинного обучения более доступными и интерактивными. С помощью простого кода вы можете быстро создать веб-интерфейс для своей модели машинного обучения, чтобы другие могли его протестировать и использовать.

Основные возможности Градио

Простота в использовании: создавайте интерактивные интерфейсы с помощью всего нескольких строк кода.
Мгновенный предварительный просмотр: возможность просмотра результатов сразу после запуска локально или в облаке, что упрощает тестирование и настройку моделей.
Поддерживает различные типы ввода и вывода: включая текст, изображения, аудио, изображения и т. д., подходящие для различных сценариев применения.
Совместимость с платформами машинного обучения: Gradio совместим с TensorFlow, PyTorch, Scikit-learn и другими платформами и может напрямую использоваться в моделях, обученных этими платформами.
Простота обмена: созданным веб-интерфейсом можно делиться с помощью ссылок, и другие пользователи могут получить к нему доступ без установки специального программного обеспечения.

Как использовать Градио

Использовать Gradio очень просто. Ниже приведен базовый пример, показывающий, как создать простой интерфейс ввода и вывода текста:

импортградиоасгр

#Определяем функции для обработки входных данных
защита приветствие(имя):
    вернуть «Привет» + имя + «!»

# Создать интерфейс Gradio
iface = gr.Interface(fn=greet, inputs="text", outputs="text")

# Стартовый интерфейс
iface.launch()

Приведенный выше код создаст простой веб-интерфейс, который позволит пользователям вводить имя, а затем отображать персонализированное приветствие.

Сценарии применения Gradio

Отображение модели машинного обучения:Быстро преобразуйте модели машинного обучения в интерактивные веб-приложения, которые другие смогут протестировать и испытать.
Визуализация данных:Его можно использовать для визуализации результатов обработки данных для удобства представления и обмена.
Инструменты пользовательского тестирования:Разработчики могут быстро создавать инструменты тестирования, позволяющие пользователям опробовать приложения искусственного интеллекта или другие функции.

в заключение

Gradio предоставляет разработчикам простой и мощный инструмент, который может быстро преобразовывать модели машинного обучения в веб-приложения, позволяя более широкому кругу пользователей легко тестировать и испытывать результаты ИИ. Независимо от того, используется ли Gradio для личных проектов или командной работы, он идеально подходит для продвижения и демонстрации моделей.

Вывод градиента перенаправляется на страницу HTTP-сервера

Если вы хотите перенаправить вывод интерфейса Gradio на страницу HTTP-сервера Apache (например, `/results`), вы можете использовать PythonrequestsМодуль для конвертации Gradio Результаты отправляются на сервер. Вот основные шаги по интеграции Gradio и Apache:

Шаг 1. Настройте HTTP-сервер

Во-первых, убедитесь, что ваш HTTP-сервер Apache работает и имеет настроенную конечную точку, которая может обрабатывать данные (например,/results). Этой конечной точкой может быть PHP, Python или другой серверный язык для обработки входящих данных.

Шаг 2. Создайте приложение Gradio.

Вот пример кода для написания приложения Gradio и перенаправления его вывода на HTTP-сервер:

импортградиоасгр
запросы на импорт

# Обработка ввода Gradio и перенаправление на HTTP-сервер
Защиту процесса_and_redirect (входные_данные):
    # Обрабатываем входные данные
    result = f"Обработано: {input_data}"
    
    #Отправляем запрос HTTP POST на HTTP-сервер Apache и передаем обработанные данные.
    url = 'http://your-apache-server-address/results' # Замените адресом вашего сервера
    полезная нагрузка = {'результат': результат}
    
    попробуйте:
        ответ = запросы.пост (url, данные = полезная нагрузка)
        если ответ.код_статуса == 200:
            return f"Успешно перенаправлено на {url}."
        еще:
            return f «Перенаправление не удалось. Код состояния: {response.status_code}»
    кроме исключения как e:
        return f"Произошла ошибка: {str(e)}"

# Создать интерфейс Gradio
iface = gr.Interface(
    fn=process_and_redirect,
    входы="текст",
    выходы="текст",
    title="Перенаправление Gradio на HTTP-сервер"
)

iface.launch()

Шаг 3. Обработка на стороне сервера

На вашем сервере Apache должна быть настроена конечная точка для обработки запросов POST, например простой PHP-скрипт для получения данных Gradio:

<?php
// Обработка POST-запросов от Gradio
if ($_SERVER["REQUEST_METHOD"] == "POST") {
    $result = $_POST['результат']; // Получаем параметр result из POST-запроса
    echo "Данные, полученные от Gradio: " . htmlspecialchars ($ результат);
}
?>

На что следует обратить внимание

безопасность: Если вы передаете конфиденциальные данные, рекомендуется использовать HTTPS для защиты передачи и рассмотреть возможность добавления аутентификации.
Обработка ошибок: Убедитесь, что в приложение Gradio и на сервер добавлены соответствующие механизмы обработки ошибок, чтобы избежать сбоя сервера или сбоя запроса.

Подвести итог

Это позволяет вам использовать приложение Gradio для перенаправления вывода на HTTP-сервер Apache и обработки данных на стороне сервера. Такая интеграция позволяет более широко использовать интерактивные функции Gradio в веб-средах.

Отображение содержимого Gradio на веб-сервере

Способ 1. Используйте iframe для встраивания страницы Gradio.

Самый простой способ встроить интерфейс Gradio в страницу Apache — использоватьiframeЭтикетка. настраиватьsrcАтрибут представляет собой URL-адрес сервера Gradio.

Пример кода

<!DOCTYPE html>
<html lang="zh">
<голова>
    <мета-кодировка="UTF-8">
    <title>Встроенный интерфейс Apache Gradio</title>
</голова>
<тело>
    <h1>Встроенный интерфейс Gradio</h1>
    <iframe src="http://your-gradio-server-address:7860" width="100%" height="800px"frameborder="0"></iframe>
</тело>
</html>

Способ 2. Используйте обратный прокси-сервер для интеграции интерфейса Gradio в URL-адрес Apache.

Если вы хотите напрямую получить доступ к интерфейсу Gradio через URL-адрес Apache, вы можете настроить обратный прокси-сервер. Это устраняет необходимость отображать исходный URL-адрес Gradio.

шаг

Включить Apachemod_proxyиmod_proxy_httpМоды. Выполните следующие инструкции:

sudo a2enmod proxy
sudo a2enmod proxy_http

Или отмените комментарий:

#LoadModule proxy_module modules/mod_proxy.so
#LoadModule proxy_http_module modules/mod_proxy_http.so

В файле конфигурации Apache добавьте следующие параметры обратного прокси-сервера, чтобы выполнить обратный прокси-сервер интерфейса Gradio по определенному пути в Apache (например:/gradio)。

<Location "/gradio">
    ProxyPass "http://localhost:7860/"
    ProxyPassReverse "http://localhost:7860/"
</Location>

Сохраните конфигурацию и перезапустите службу Apache:

sudo systemctl restart apache2

После завершения вы можете использоватьhttp://your-apache-server-address/gradioОтображение содержимого интерфейса Gradio на страницах Apache.

Статические ресурсы Gradio через прокси-сервер Apache

Шаг 1. Включите прокси-сервер и HTTP-модуль прокси.

В Apache убедитесь, что он включенproxyиproxy_httpМоды. Если он еще не включен, вы можете выполнить следующую команду:

sudo a2enmod proxy
sudo a2enmod proxy_http

Шаг 2. Обновите конфигурацию виртуального хоста Apache.

В файле конфигурации Apache приложения Gradio (например,/etc/apache2/sites-available/yourdomain.conf), добавьте следующие настройки для настройки ProxyPass и ПроксиПассРеверс:

<VirtualHost *:80>
    Имя серверавашдомен.com

    # Укажите корневой каталог Gradio на сервер Gradio
    ProxyPass/http://localhost:7860/
    ProxyPassReverse/http://localhost:7860/

    # Убедитесь, что статические ресурсы могут быть проксированы нормально
    ProxyPass /static/ http://localhost:7860/static/
    ProxyPassReverse /static/ http://localhost:7860/static/
</VirtualHost>

Шаг 3. Перезапустите Apache.

После завершения настройки перезапустите Apache, чтобы изменения вступили в силу:

sudo systemctl restart apache2

Такая конфигурация может явно обрабатывать запросы к статическим ресурсам Gradio, таким какtheme.css) должно решить проблему с отсутствующим стилем. Если статический путь к файлу Gradio не/static/, пожалуйста, измените путь в соответствии с реальной ситуацией.

Список компонентов пользовательского интерфейса Gradio

Входные компоненты

Текстовое поле: принимает одну или несколько строк ввода текста.
Число: принимает числовой ввод.
Ползунок: принимает числовой ввод в пределах диапазона и выбирает путем перетаскивания.
Флажок: принимает ввод логического значения (True/False).
Радио: принимает один из нескольких вариантов.
Раскрывающийся список: принимает один из нескольких вариантов отображения в виде раскрывающегося меню.
CheckboxGroup: принимает ноль или более вариантов выбора из нескольких вариантов.
Изображение: принимает ввод изображения и поддерживает загрузку или рисование.
Видео: принимает видеовход.
Аудио: принимает аудиовход и поддерживает загрузку или запись.
Файл: принять загрузку файлов.
ColorPicker: принять выбор цвета.
Альбом для рисования: позволяет пользователям рисовать на холсте в качестве входного изображения.
Dataframe: принимает ввод фрейма данных (таблицы), поддерживает ручное редактирование или загрузку CSV/JSON.

Выходные компоненты

Метка: отображает результаты классификации или текстовые метки, обычно используемые для результатов прогнозирования моделей машинного обучения.
Текстовое поле: отображение текстового вывода.
Изображение: отображение вывода изображения.
Видео: отображение видеовыхода.
Аудио: отображение аудиовыхода.
HTML: отображение содержимого HTML.
JSON: отображает данные в формате JSON.
Markdown: отображение текста в формате Markdown.
Dataframe: Отображение вывода кадра данных (таблицы).
HighlightedText: отображает текст с определенной отметкой или выделенной областью.
График: отображает различные графики (например, Matplotlib, Plotly и т. д.).
Галерея: галерея, в которой отображается несколько изображений.

Компоненты функциональности и компоновки

Кнопка: кликабельная кнопка, используемая для запуска событий или функций.
Вкладка: вкладка, используемая для организации нескольких разделов интерфейса.
Строка/столбец: используется для управления расположением компонентов (горизонтальное или вертикальное расположение).
Группа: используется для группировки нескольких компонентов и установки общей границы или стиля.
Состояние: используется для хранения и передачи состояния между различными вызовами функций в приложениях Gradio.
Набор данных: используется для отображения и выбора образцов входных наборов данных.
Чат-бот: компонент, специально используемый для создания интерфейсов чат-бота.
Блоки: основа декларативного API Gradio, обеспечивающая более точную компоновку и контроль.

Компонент DataFrame в Gradio

Доступно в Градиоgr.DataFrameвиджет для отображения или редактирования табличных данных, таких как Pandas DataFrame или другой табличный формат. Здесь мы объясним, как использовать Gradio Компонент DataFrame используется в приложениях для создания интерактивных таблиц данных.

1. Установите Градио

Если Gradio еще не установлен, вы можете установить его с помощью следующей команды:

pip install gradio

2. Используйте`gr.DataFrame`вывести данные таблицы

Вот как использовать Gradio для отображения DataFrame. Допустим, у нас есть DataFrame Pandas, который необходимо отобразить в приложении Gradio:


    import gradio as gr

    import pandas as pd

#Создаем образец DataFrame
data = {'Имя': ['Алиса', 'Боб', 'Чарли'], 'Возраст': [25, 30, 35], 'Профессия': ['Инженер', 'Дизайнер', 'Доктор']}

    df = pd.DataFrame(data)

# Определить функцию для возврата DataFrame

    def show_dataframe():

            return df

#Создаем интерфейс Gradio
интерфейс = gr.Interface(fn=show_dataframe, выходы=gr.DataFrame(), title="Таблица данных персонала")

    interface.launch()

иллюстрировать

import gradio as gr: Представляем пакет Gradio.
data: словарь, используемый для создания образцов данных, содержащий три столбца: имя, возраст и род занятий.
show_dataframe: Определите функцию для возврата кадра данных Pandas для отображения.
gr.DataFrame(): Создайте компонент DataFrame для отображения таблицы в интерфейсе Gradio.
interface.launch(): Запустите приложение Градио.

3. Используйте`gr.DataFrame`Вносите интерактивные изменения

Если вы хотите разрешить пользователям редактировать таблицу, вы можетеgr.DataFrameСредние настройкиeditable=True, позволяя пользователям изменять данные таблицы:

интерфейс = gr.Interface(fn=show_dataframe, выходы=gr.DataFrame(editable=True), title="Редактируемая таблица данных персонала")

результат

Запущенное приложение отобразит редактируемую таблицу, и пользователи смогут изменять данные прямо на веб-странице.

Принудительно завершить работу сервера Gradio

Шаг 1. Найдите PID программы Gradio.

Можно использоватьpsutilмодуль для поиска PID программы Gradio. Сначала убедитесь, что вы установилиpsutil：

pip install psutil

Затем вы можете использовать следующий код, чтобы найти PID программы, связанной с Gradio.

импортировать psutil

# Поиск программ, содержащих «градио»
для процесса в psutil.process_iter(['pid', 'name', 'cmdline']):
    if 'gradio' в ' '.join(process.info['cmdline']):
        print("Найдено PID программы Gradio:",process.info['pid'])

Шаг 2. Принудительно завершите программу Gradio

Как только PID найден, вы можете использоватьterminate()илиkill()метод завершения программы. Например:

для процесса в psutil.process_iter(['pid', 'name', 'cmdline']):
    if 'gradio' в ' '.join(process.info['cmdline']):
        process.kill() # Принудительно завершить программу
        print(f"PID программы Gradio завершен: {process.info['pid']}")

На что следует обратить внимание

использоватьkill()Этот метод немедленно завершит программу, поэтому убедитесь, что в программе не выполняются важные операции. Этот пример кода завершает работу всех соответствующих программ Gradio.

Принудительно завершить работу сервера Gradio, используя порт прослушивания.

Шаг 1. Найдите программу, прослушивающую определенный порт.

Можно использоватьpsutilМодуль для поиска программ, прослушивающих определенный порт. Сначала убедитесь, что вы установилиpsutil：

pip install psutil

Затем вы можете использовать следующий код, чтобы найти монитор7860Программный PID порта.

импортировать psutil

#Указываем номер порта для поиска
целевой_порт = 7860
pid_to_kill = Нет

# Поиск программ, слушающих указанный порт
для подключения в psutil.net_connections(kind='inet'):
    если conn.laddr.port == target_port и conn.status == psutil.CONN_LISTEN:
        pid_to_kill = conn.pid
        сломать

если pid_to_kill:
    print("Найден PID программы прослушивающего порта 7860:", pid_to_kill)
еще:
    print("Программа для прослушивания порта 7860 не найдена")

Шаг 2. Принудительное завершение найденных программ

Как только PID найден, вы можете использоватьpsutil.Processизkill()Метод принудительного завершения программы:

если pid_to_kill:
    процесс = psutil.Process(pid_to_kill)
    process.kill() # Принудительно завершить программу
    print(f"Программа PID прослушивающего порта 7860 была прекращена: {pid_to_kill}")
еще:
    print("Невозможно завершить программу, поскольку PID не найден")

На что следует обратить внимание

Этот код принудительно завершит любую программу, прослушивающую указанный порт. Пожалуйста, подтвердите, что порт действительно используется Gradio, чтобы избежать случайного прекращения работы других служб.

Добавьте сервер HTTP API в Gradio

Gradio в первую очередь предназначен для создания быстрых и простых в использовании веб-интерфейсов для отображения моделей машинного обучения. Сам он уже работает на веб-сервере, но его основная цель — предоставить интерфейс взаимодействия человека с компьютером, а не традиционную конечную точку RESTful API.

Если вы хотите использовать функциональность RESTful API в своем приложении Gradio, наиболее рекомендуемым методом является встраивание приложения Gradio в более мощную веб-инфраструктуру, например **FastAPI** или **Flask**. Это позволяет вам использовать основную платформу для определения конечных точек API при подключении пользовательского интерфейса Gradio к подпути.

1. Рекомендуемое решение: встроить приложение Gradio в FastAPI (предпочтительно).

FastAPI работает быстро и опирается на платформу Starlette вместе с Gradio, что делает процесс внедрения очень простым.

Шаг А: Установите необходимые пакеты

# Установите FastAPI, Uvicorn (сервер) и Gradio.
pip install fastapi uvicorn градиент

Шаг Б. Реализуйте код

Вы будете использовать Gradio.to_app()метод преобразует интерфейс Gradio в приложение ASGI, а затем использует FastAPI.mountфункция для монтирования ее в основное приложение.

из fastapi импортировать FastAPI
из fastapi.responses импортировать JSONResponse
импортградиоасгр

# 1. Определить логику приложения Gradio
защита приветствие(имя):
    return f"Привет, {имя}!"

gr_interface = gr.Interface(fn=greet, inputs="text", outputs="text")

# 2. Преобразование интерфейса Gradio в приложение ASGI.
gradio_app = gr_interface.to_app()

# 3. Создайте основное приложение FastAPI.
приложение = FastAPI(
    title="Gradio + Сервер FastAPI",
    описание="Предоставляет как конечные точки API, так и пользовательский интерфейс Gradio"
)

# 4. (API SVR) Определите конечные точки RESTful API.
@app.get("/api/v1/status")
защита api_status():
    return JSONResponse(content={"status": "API работает"})

@app.get("/api/v1/model_inference")
Защиту api_inference (данные: ул):
    # Здесь вы можете вызвать логику вашей модели
    result = f"Обработанные данные: {data.upper()}"
    return JSONResponse(content={"result": result})

# 5. (Gradio SVR) Смонтируйте приложение Gradio по пути /gradio.
# Функция mount() позволяет вам смонтировать другое приложение ASGI по указанному пути.
app.mount("/gradio",gradient_app)

# Сервер выполнения (при условии, что имя файла — main.py)
# Выполните в терминале: uvicorn main:app --host 0.0.0.0 --port 8000 --reload

Метод доступа

Сервер HTTP API: доступ через `http://127.0.0.1:8000/api/v1/status`.
Интерфейс Gradio UI: доступ через `http://127.0.0.1:8000/gradio`.

2. Альтернатива: предоставить API внутри Gradio.

Сам Gradio также предоставляет экспериментальную функцию, которая позволяет напрямую вызывать базовые функции интерфейса Gradio через параметры URL-адреса без необходимости использования дополнительной веб-инфраструктуры. Это не стандартный RESTful API, но он обеспечивает простой программный доступ.

Когда приложение Gradio запущено, его внутренние функции доступны через определенные пути API.
Вы можете использовать запрос POST для `/api/predict` или `/run/<函式名稱>` Конечная точка отправляет входные данные в формате JSON и получает результаты в формате JSON.
Конкретный путь и формат API можно найти на странице «Файл API» пользовательского интерфейса Gradio (обычно по пути `/api`).

Однако встраивание Gradio с помощью FastAPI/Flask — это более стандартный и гибкий подход, который обеспечивает более стандартизированный дизайн API, документацию и сертификацию.

Поисковый робот Python

Requests + BeautifulSoup

Это наиболее распространенная комбинация сканеров, подходящая для новичков и используемая для анализа статических веб-страниц.

pip install requests beautifulsoup4

Пример использования:

import requests
from bs4 import BeautifulSoup

url = "https://example.com"
response = requests.get(url)
soup = BeautifulSoup(response.text, "html.parser")
print(soup.title.string)

Scrapy

Мощная платформа сканеров, подходящая для крупных проектов сканеров, поддерживающая многопоточные и распределенные сканеры.

pip install scrapy

Пример использования:

scrapy startproject myproject

Создайте в проекте модуль искателя и запустите команду сканирования.

Selenium

Подходит для динамического сканирования веб-страниц, при котором необходимо имитировать операции пользователя, например обработку контента, отображаемого с помощью JavaScript.

pip install selenium

Пример использования:

from selenium import webdriver

driver = webdriver.Chrome()
driver.get("https://example.com")
print(driver.title)
driver.quit()

Playwright

Еще один инструмент для обработки динамических веб-страниц. Он имеет более высокую производительность, чем Selenium, и поддерживает несколько браузеров.

pip install playwright
playwright install

Пример использования:

from playwright.sync_api import sync_playwright

with sync_playwright() as p:
    browser = p.chromium.launch()
    page = browser.new_page()
    page.goto("https://example.com")
    print(page.title())
    browser.close()

Pyppeteer

Основанный на версии Puppeteer для Python, он специально разработан для сканирования динамических веб-страниц.

pip install pyppeteer

Пример использования:

from pyppeteer import launch

async def main():
    browser = await launch()
    page = await browser.newPage()
    await page.goto("https://example.com")
    print(await page.title())
    await browser.close()

import asyncio
asyncio.get_event_loop().run_until_complete(main())

HTTPX

Эффективный инструмент для отправки HTTP-запросов, поддерживающий асинхронные операции.

pip install httpx

Пример использования:

import httpx

async def fetch():
    async with httpx.AsyncClient() as client:
        response = await client.get("https://example.com")
        print(response.text)

import asyncio
asyncio.run(fetch())

Поисковый робот Python BeautifulSoup

To create a simple web scraper in Python, you can use the requests library to get the page content, and BeautifulSoup to parse the HTML.

Here's an example of a basic web scraper:


        import requests

        from bs4 import BeautifulSoup



        # URL to scrape

        url = "https://example.com"



        # Send a GET request

        response = requests.get(url)

        response.raise_for_status()  # Check for errors



        # Parse the HTML content

        soup = BeautifulSoup(response.content, "html.parser")



        # Extract specific data (e.g., all the headings)

        headings = soup.find_all("h1")



        # Print the headings

        for heading in headings:

            print(heading.text)

Note: You may need to install the libraries with the following commands:


        pip install requests

        pip install beautifulsoup4

BeautifulSoup находит текст в определенных тегах и категориях.

Пример сценария

` Буквальное значение категории `xxxclass` в теге:



    Текст, который нужно извлечь
    другой текст

Найдите и извлеките текст с помощью BeautifulSoup

Вот код Python, использующий BeautifulSoup:

из bs4 импорт BeautifulSoup

#HTML-файл
html_content = """

    Текст, который нужно извлечь
    другой текст

"""

# Разбор HTML
суп = BeautifulSoup(html_content, 'html.parser')

# Найдите определенные теги и категории
span_tag = суп.find('span', class_='xxxclass')

#Извлекаем текстовое значение
если span_tag:
    print(span_tag.text) #Вывод: текст, который нужно извлечь
еще:
    print("Соответствующий тег не найден")

Описание метода

1. `найти(тег, класс_=...)`: - `tag`: укажите HTML-тег для поиска, например `span`. - `class_`: укажите имя класса, например `xxxclass`. Следует отметить, что `class_` подчеркнут, чтобы избежать конфликта с зарезервированным словом Python `class`. 2. `.text`: извлеките текстовое содержимое тега.

Найти несколько совпадений

Если вам нужно извлечь несколько тегов, вы можете использовать find_all:

# Найти все совпаденияэтикетка
span_tags = суп.find_all('span', class_='xxxclass')

#Извлекаем текст каждой метки
для тега в span_tags:
    печать(тег.текст)

Другие фильтры

1. **Фильтр по нескольким атрибутам**:

   span_tag = soup.find('span', {'class': 'xxxclass', 'id': 'specific-id'})

2. **Используйте регулярные выражения для сопоставления категорий**:

   import re
   span_tag = soup.find('span', class_=re.compile(r'^xxx'))

На что следует обратить внимание

1. **Формат HTML**. Убедитесь, что HTML-код действителен, в противном случае могут возникнуть проблемы с анализом. 2. **Обработка пустого результата**: `None` возвращается, если результат не найден. Вам следует проверить, является ли результат пустым, чтобы избежать ошибок.

Подвести итог

Текстовое содержимое в определенных тегах и категориях можно легко извлечь с помощью методов find или find_all в BeautifulSoup. Гибкое использование условий фильтра и сопоставления атрибутов позволяет обрабатывать более сложные сценарии.

Selenium

Что такое селен?

Selenium — это инструмент с открытым исходным кодом, который в основном используется для автоматизации операций веб-браузера. Он поддерживает несколько браузеров, включая Chrome, Firefox, Safari и т. д., и может использоваться для тестирования веб-приложений или очистки веб-данных.

Основные функции

Автоматизация браузера: имитируйте действия пользователя, такие как нажатие, ввод текста, отправка форм и т. д.
Кроссбраузерное тестирование: поддерживает автоматическое тестирование нескольких браузеров и операционных систем.
Поддерживает несколько языков программирования: включая Python, Java, C#, Ruby и т. д.
Сильная расширяемость: может быть интегрирована с платформами тестирования (такими как pytest, JUnit) и инструментами CI/CD (такими как Jenkins).

Основные компоненты

Selenium WebDriver：Основные инструменты для взаимодействия с браузером.
Selenium IDE：Простой инструмент записи и воспроизведения для начинающих.
Selenium Grid：Используется для распределенного тестирования, поддерживая параллельное тестирование в нескольких браузерах и в нескольких средах.

Сценарии применения

Функциональное тестирование: убедитесь, что функциональность веб-приложения работает правильно.
Регрессионное тестирование: быстро определите, влияют ли новые функции на существующие функции.
Сбор данных: автоматическое извлечение общедоступных данных на веб-страницах.
Непрерывная интеграция: автоматизированное тестирование в рамках процесса CI/CD.

Установка и базовое использование

Ниже приведены шаги по установке Selenium и простой пример использования Python:

# Установите Селен
pip установить селен

#Пример кода
из веб-драйвера импорта селена
из selenium.webdriver.common.by импортировать

# Запуск вебдрайвера
драйвер = вебдрайвер.Chrome()
driver.get("https://www.example.com")

# Находим элементы и выполняем операции
элемент = driver.find_element(By.TAG_NAME, "h1")
печать(element.text)

# Закрыть браузер
драйвер.выйти()

Преимущества и проблемы

преимущество:Поддерживает несколько браузеров, несколько языков и имеет широкий спектр приложений.
испытание:Обработка динамических веб-страниц требует дополнительных приемов, таких как ожидание загрузки элементов.

Selenium Chrome использует конкретных пользователей

Установите необходимые пакеты

Убедитесь, что установлены Selenium и ChromeDriver:

pip install selenium

Загрузите и установите соответствующую версию Chrome.ChromeDriver。

Настройка пользовательских папок

Пользовательская папка Chrome содержит личные данные, такие как закладки, история, файлы cookie и т. д. Вы можете указать конкретную папку, которая будет использоваться для запуска браузера.

Пример кода

из веб-драйвера импорта селена
из службы импорта selenium.webdriver.chrome.service
из параметров импорта selenium.webdriver.chrome.options

#Укажите путь к ChromeDriver
chromedriver_path = "/путь/к/chromedriver"

#Указываем папку пользователя
user_data_dir = "/путь/к/вашим/пользователям/данным"

# Установите параметры Chrome
chrome_options = Параметры()
chrome_options.add_argument(f"--user-data-dir={user_data_dir}")
chrome_options.add_argument("--profile-directory=Default") # или другое имя подпапки

# Запустить браузер
сервис = Сервис (chromedriver_path)
драйвер = webdriver.Chrome(service=service, options=chrome_options)

# Открыть веб-страницу
driver.get("https://example.com")

# Завершить программу
драйвер.выйти()

На что следует обратить внимание

Обязательно укажитеuser_data_dirПуть является действительным и доступным для записи каталогом.
Если папка уже занята другими процессами Chrome, она может не запуститься.
Путь к папке пользователя можно узнать через страницу настроек браузера:

Введите в Chromechrome://version。
Просмотрите путь к профилю.

Сценарии применения

Требует использования определенных файлов cookie, закладок или других данных для персонализации.
При тестировании сайтов, требующих входа в систему, используйте сохраненную информацию для входа.
Имитируйте поведение конкретной пользовательской среды.

Получить все user_data_dir

1. Установите необходимые библиотеки.

Убедитесь, что он установленseleniumиpsutil：

pip install selenium psutil

2. Используйте все user_data_dir Chrome.

Следующий код просканирует все запущенные Chrome и извлечетuser-data-dirпараметр:

import psutil
import re

def get_all_user_data_dirs():
    user_data_dirs = set()
    for proc in psutil.process_iter(attrs=['pid', 'name', 'cmdline']):
        try:
            if proc.info['name'] and 'chrome' in proc.info['name'].lower():
                cmdline = ' '.join(proc.info['cmdline'])
                match = re.search(r'--user-data-dir=([^\s]+)', cmdline)
                if match:
                    user_data_dirs.add(match.group(1))
        except (psutil.NoSuchProcess, psutil.AccessDenied):
            continue
    return list(user_data_dirs)

print(get_all_user_data_dirs())

3. Используйте определенный user_data_dir в Selenium.

найти цельuser_data_dirНаконец, его можно использовать с Selenium:

from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options

chrome_user_data_dir = "C:\\Users\\YourUser\\AppData\\Local\\Google\\Chrome\\User Data"

options = Options()
options.add_argument(f"--user-data-dir={chrome_user_data_dir}")

service = Service("chromedriver.exe")
driver = webdriver.Chrome(service=service, options=options)
driver.get("https://www.google.com")

4. Заключение

черезpsutilПроанализируйте запущенный процесс Chrome, чтобы получить всеuser-data-dirи использовать специальныеuser_data_dirЗапустите браузер.

Получить имя пользователя из каталога данных Chrome

Постановка задачи

Чтобы получить имя пользователя из каталога пользовательских данных Chrome, вам необходимо получить доступ к файлу в этом каталоге, обычно по следующему пути:

C:\Users\[Username]\AppData\Local\Google\Chrome\User Data\（Windows）
/Users/[Username]/Library/Application Support/Google/Chrome/（macOS）
/home/[Username]/.config/google-chrome/（Linux）

Эти папки содержат множество файлов, которые вы можете прочитатьLocal Stateфайл для получения основной информации о пользователе.

Шаг: прочитать`Local State`файл

ХромLocal StateФайл содержит некоторые основные настройки пользователя, из которых можно получить информацию о пользователе.

импортировать JSON
импортировать ОС

защита get_chrome_user_name(user_data_dir):
    local_state_path = os.path.join(user_data_dir, «Локальное состояние»)
    
    #Проверяем, существует ли файл
    если нет os.path.exists(local_state_path):
        вернуть «Файл локального состояния не найден»

    с open(local_state_path, 'r',coding='utf-8') в качестве файла:
        local_state = json.load(файл)

    # Получить информацию о пользователе из локального состояния
    user_name = local_state.get('profile', {}).get('name', 'Неизвестный пользователь')
    
    вернуть имя_пользователя

# Пример: путь к каталогу пользовательских данных Chrome
user_data_dir = r'C:\Users\YourUserName\AppData\Local\Google\Chrome\User Data'

печать (get_chrome_user_name (user_data_dir))

Анализ локального состояния

когда ты читаешьLocal StateКогда вы анализируете файл в формате JSON, вы можете получить из него много информации, например:

profile: Содержит информацию о конфигурации пользователя, такую как имя, изображение и т. д.
last_version: показывает последнюю версию Chrome.
is_logged_in: Показывает, вошел ли пользователь в систему.

В большинстве случаев имя пользователя будет расположеноprofile, и может быть извлечен вышеуказанным методом.

На что следует обратить внимание

Local StateФайл обновляется при каждом запуске Chrome, поэтому содержимое файла может со временем меняться.

Этот метод основан на данных профиля Chrome, и структура файла может отличаться, если пользователь использует другую учетную запись Google.

в заключение

Путем анализаLocal StateВы можете легко получить имя пользователя Chrome из данных JSON в файле.

Получить всех пользователей из файла локального состояния

Постановка задачи

ХромLocal StateФайлы хранят много базовой информации о пользователях. Если вы хотите извлечь из него все имена пользователей, вы можете прочитать файл и проанализировать его содержимое JSON. Вот шаги, как этого добиться.

Шаг: прочитать`Local State`Архивировать и анализировать

Вы можете прочитатьLocal Stateфайл, а затем анализирует его содержимое в формате JSON для извлечения всех пользовательских данных.

импортировать JSON
импортировать ОС

защита get_all_users (user_data_dir):
    local_state_path = os.path.join(user_data_dir, «Локальное состояние»)
    
    #Проверяем, существует ли файл
    если нет os.path.exists(local_state_path):
        вернуть «Файл локального состояния не найден»

    с open(local_state_path, 'r',coding='utf-8') в качестве файла:
        local_state = json.load(файл)

    # Получить все пользовательские данные из локального состояния
    Profiles = local_state.get('profile', {}).get('info_cache', {})
    
    # Получить все имена пользователей
    user_names = [profile.get('name', 'Unknown User') для профиля в Profiles.values()]
    
    вернуть имена_пользователей

# Пример: путь к каталогу пользовательских данных Chrome
user_data_dir = r'C:\Users\YourUserName\AppData\Local\Google\Chrome\User Data'

печать (get_all_users (user_data_dir))

Анализ пользовательских данных в локальном состоянии

в ChromeLocal StateВ файлах пользовательские данные обычно хранятся вprofileвнизinfo_cache, который представляет собой словарь, в котором профиль каждого пользователя соответствует имени его конфигурации.

демонстрация:`Local State`Структура файла

Ниже приводитсяLocal StateПример структуры в архиве:


{
    "profile": {
        "info_cache": {
            "profile1": {
                "name": "User1",
                "avatar": "path/to/avatar1.jpg"
            },
            "profile2": {
                "name": "User2",
                "avatar": "path/to/avatar2.jpg"
            }
        }
    }
}

На что следует обратить внимание

Этот метод предполагает, что у вас уже есть доступ для чтения к каталогу пользовательских данных Chrome.
Некоторые пользовательские данные могут существовать в разных файловых структурах в зависимости от версии или настроек Chrome.
Если соответствующего профиля нет, в качестве имени по умолчанию будет возвращено «Неизвестный пользователь».

в заключение

Путем анализаLocal Stateфайле вы можете получить имена всех пользователей Chrome. Это позволяет легко составить список всех учетных записей.

Пользовательские данные в файле локального состояния

Постановка задачи

в ChromeLocal Stateфайл, данные каждого пользователя содержатся вinfo_cacheсередина. Оттуда вы можете извлечь имя пользователя и соответствующий подкаталог конфигурации.

Шаг: прочитать`Local State`Архивировать и анализировать

Вот как это сделать из ChromeLocal StateМетод для получения имен и соответствующих подкаталогов всех пользователей в файле.

импортировать JSON
импортировать ОС

защита get_users_and_profiles (user_data_dir):
    local_state_path = os.path.join(user_data_dir, «Локальное состояние»)
    
    #Проверяем, существует ли файл
    если нет os.path.exists(local_state_path):
        вернуть «Файл локального состояния не найден»

    с open(local_state_path, 'r',coding='utf-8') в качестве файла:
        local_state = json.load(файл)

    # Получить все пользовательские данные из локального состояния
    Profiles = local_state.get('profile', {}).get('info_cache', {})
    
    # Получить все имена пользователей и соответствующие им подкаталоги
    пользователь_информация = {}
    для Profile_key, Profile_data в Profiles.items():
        user_name = Profile_data.get('имя', 'Неизвестный пользователь')
        Profile_sub_dir = os.path.join(user_data_dir, 'Профиль' + Profile_key)
        user_info[имя_пользователя] = Profile_sub_dir
    
    вернуть user_info

# Пример: путь к каталогу пользовательских данных Chrome
user_data_dir = r'C:\Users\YourUserName\AppData\Local\Google\Chrome\User Data'

users_and_profiles = get_users_and_profiles(user_data_dir)
для user_name, Profile_dir в user_and_profiles.items():
    print(f"Имя пользователя: {user_name}, подкаталог: {profile_dir}")

Разобрать структуру данных в Local State

существоватьLocal Stateфайл, все пользовательские данные находятся вprofileвнизinfo_cache. У каждого пользователя есть соответствующий ключ конфигурации (например,profile1, profile2ждать). Каждый настроенный профиль содержит имя пользователя (name) и другую соответствующую информацию.

демонстрация:`Local State`Структура файла

Ниже приводитсяLocal StateПример структуры в архиве:


{
    "profile": {
        "info_cache": {
            "Profile 1": {
                "name": "User1",
                "avatar": "path/to/avatar1.jpg"
            },
            "Profile 2": {
                "name": "User2",
                "avatar": "path/to/avatar2.jpg"
            }
        }
    }
}

На что следует обратить внимание

Подкаталог конфигурации каждого пользователя обычно заканчивается наProfileначало, за которым следует номер (например,Profile 1, Profile 2ждать).
Этот метод возвращает имя каждого пользователя и соответствующий путь к подкаталогу конфигурации.
Если данные для некоторых пользователей отсутствуют, в качестве имени по умолчанию будет возвращено «Неизвестный пользователь».

в заключение

Путем анализаLocal Stateфайле вы можете получить имена всех пользователей и соответствующие им подкаталоги конфигурации. Это позволяет вам легко найти расположение данных конфигурации каждого пользователя.

Gmail для пользователей Chrome

Постановка задачи

Чтобы получить учетную запись Gmail из каталога пользовательских данных Chrome, вам необходимо извлечь соответствующую информацию из данных конфигурации Chrome. Обычно это достигается путем анализа файлов пользовательских данных Chrome, в частности данных учетной записи Google.

Шаги: Прочтите файл профиля и проанализируйте его.

Данные каждого пользователя Chrome будут храниться в отдельной папке, обычно вUser Dataв каталогеProfileвнутри каталога. Если пользователь вошел в учетную запись Google, соответствующую информацию об учетной записи Gmail можно найти в данных конфигурации.

импортировать ОС
импортировать JSON

def get_gmail_from_profile(user_data_dir, имя_профиля):
    каталог_профиля = os.path.join(каталог_данных_пользователя, имя_профиля)
    accounts_file = os.path.join(profile_dir, 'Веб-данные')

    #Проверяем, существует ли файл
    если нет os.path.exists(accounts_file):
        вернуть «Файл веб-данных не найден»

    # Попробуйте прочитать файл веб-данных
    попробуйте:
        с open(accounts_file, 'r',coding='utf-8') в качестве файла:
            web_data = json.load(файл)

        # Извлечь учетную запись Gmail из данных
        для строки в web_data.get('accounts', []):
            если 'gmail' в row.get('email', ''):
                вернуть row.get('электронная почта')
        
        вернуть «Учетная запись Gmail не найдена»
    кроме исключения как e:
        return f «Ошибка чтения файла веб-данных: {e}»

# Пример: путь к каталогу пользовательских данных Chrome
user_data_dir = r'C:\Users\YourUserName\AppData\Local\Google\Chrome\User Data'

# Предположим, вы используете профиль 1
имя_профиля = 'Профиль 1'
print(get_gmail_from_profile(user_data_dir, имя_профиля))

Разбирать архивы веб-данных

Файлы веб-данных содержат различные данные для входа в Chrome, включая имена учетных записей, пароли и другую соответствующую информацию. В этом примере мы ищемemailполе и проверьте, содержит ли оно почтовый ящик Gmail.

Демонстрация: Структура файла веб-данных

Ниже приведен пример частичной структуры файла веб-данных:


{
    "accounts": [
        {
            "email": "[email protected]",
            "password": "encrypted_password_1"
        },
        {
            "email": "[email protected]",
            "password": "encrypted_password_2"
        }
    ]
}

На что следует обратить внимание

Файлы веб-данных хранятся в зашифрованном виде, поэтому при непосредственном анализе данных может быть непросто получить пароль пользователя, но учетные записи Gmail (email) обычно можно извлечь.
В зависимости от версии Chrome структура и содержимое архивов веб-данных могут различаться.
Если пользователь не вошел в учетную запись Google, учетная запись Gmail не будет найдена в веб-данных.

в заключение

Путем анализа профиля пользователя ChromeWeb Dataфайл, вы можете легко получить учетную запись Gmail пользователя. Если пользователь вошел в учетную запись Gmail, в данных появится соответствующий адрес электронной почты.

Имитация действий пользователя по просмотру страниц веб-сайта.

Шаг 1. Используйте инструменты веб-автоматизации

Распространенные инструменты веб-автоматизации включают Selenium и Playwright. Эти инструменты могут имитировать нажатие, ввод текста и другие действия пользователя.

Шаг 2. Получите все ссылки.

Используйте такой инструмент, как BeautifulSoup или Playwright, чтобы получить все гиперссылки на вашем веб-сайте (<a href>), чтобы создать список страниц для просмотра.

Шаг 3. Настройте эмуляцию браузера

Откройте браузер с помощью Selenium или Playwright и смоделируйте действия пользователя, такие как нажатие кнопок, прокрутка и даже запуск динамического контента.

Шаг 4. Обработка динамического содержимого JavaScript

Современные веб-сайты часто содержат много динамически генерируемого контента, и вы можете использовать Playwright или Selenium для выполнения JavaScript, чтобы обеспечить правильную загрузку страницы.

Шаг 5. Рекурсивно посетите все страницы.

На основе просканированных ссылок рекурсивно посетите все страницы веб-сайта и запишите посещенные страницы, чтобы избежать дублирования.

Шаг 6. Запись действий пользователя

При просмотре каждой страницы моделируйте обычное поведение пользователя, например заполнение форм, отправку информации и запись результатов операций.

Шаг седьмой: Пример приложения

из веб-драйвера импорта селена
из selenium.webdriver.common.by импортировать

#Инициализируем браузер
драйвер = вебдрайвер.Chrome()

# Начать просмотр веб-сайта
driver.get("https://example.com")

# Захватить все ссылки
ссылки = driver.find_elements(By.TAG_NAME, "a")
по ссылке в ссылках:
    href = link.get_attribute("href")
    print(f"Найдена ссылка: {href}")

# Имитировать щелчок
если ссылки:
    ссылки[0].клик()

# Закрыть браузер
драйвер.выйти()

На что следует обратить внимание

При просмотре и моделировании веб-сайтов соблюдайте условия использования соответствующего веб-сайта, чтобы не создавать чрезмерную нагрузку на сервер и не нарушать закон.

Пройдите тестирование с помощью WebDriver

Обзор

При тестировании с помощью WebDriver, такого как Selenium WebDriver, вы можете разработать пошаговое выполнение для устранения проблем или моделирования действий пользователя. Вот некоторые распространенные подходы к проектированию.

Способ 1: используйте явное ожидание

Явно ожидая, вы можете гарантировать, что каждый шаг будет завершен, прежде чем переходить к следующему шагу:

из веб-драйвера импорта селена
из selenium.webdriver.common.by импортировать
из selenium.webdriver.support.ui импортировать WebDriverWait
из selenium.webdriver.support импортируйте ожидаемые_условия как EC

#Инициализировать веб-драйвер
драйвер = вебдрайвер.Chrome()

#Открываем целевой сайт
driver.get("https://example.com")

# Подождите, пока появится кнопка, и нажмите
ожидание = WebDriverWait (драйвер, 10)
button = wait.until(EC.element_to_be_clickable((By.ID, "button_id")))
кнопка.клик()

# Подождем, пока загрузятся другие элементы
text_field = wait.until(EC.visibility_of_element_located((By.NAME, "text_field_name")))
text_field.send_keys("Тестовые данные")

# Закрыть браузер
драйвер.выйти()

Способ 2. Вставьте паузу вручную.

Приостановите процесс тестирования с помощью time.sleep(), чтобы наблюдать эффект выполнения каждого шага:

время импорта
из веб-драйвера импорта селена

#Инициализация веб-драйвера
драйвер = вебдрайвер.Chrome()

#Открываем целевой сайт
driver.get("https://example.com")
time.sleep(3) # Пауза на 3 секунды

# Имитировать нажатие кнопки
кнопка = driver.find_element(By.ID, "button_id")
кнопка.клик()
время.сон(3)

# Закрыть браузер
драйвер.выйти()

**Примечание**: `time.sleep` не рекомендуется использовать для формального тестирования, а только в целях отладки.

Метод 3. Пошаговое выполнение и разработка точек останова.

Добавляя в код условные точки останова или подсказки по вводу, вы можете выполнять отладку шаг за шагом:

из веб-драйвера импорта селена

#Инициализация веб-драйвера
драйвер = вебдрайвер.Chrome()

#Открываем целевой сайт
driver.get("https://example.com")

# Продолжить после подтверждения вручную
input("Нажмите Enter, чтобы перейти к следующему шагу...")
кнопка = driver.find_element(By.ID, "button_id")
кнопка.клик()

# Продолжаем выполнять другие тесты
input("Нажмите Enter, чтобы перейти к следующему шагу...")
драйвер.выйти()

Метод 4. Используйте среду тестирования для разработки контролируемого выполнения.

С помощью фреймворка тестирования, такого как pytest или unittest, вы можете более гибко контролировать выполнение тестов:

импортировать модульный тест
из веб-драйвера импорта селена

класс TestExample(unittest.TestCase):
    защита setUp(self):
        self.driver = веб-драйвер.Chrome()

    защита test_step_by_step(self):
        водитель = сам.драйвер
        driver.get("https://example.com")
        input("Проверьте страницу, нажмите Enter, чтобы продолжить...") # Ручная точка останова

        кнопка = driver.find_element(By.ID, "button_id")
        кнопка.клик()
        input("Проверьте результаты операции, нажмите Enter, чтобы продолжить...") # Ручная точка останова

    защита TearDown (сам):
        self.driver.quit()

если __name__ == "__main__":
    unittest.main()

На что следует обратить внимание

1. **Настройки времени ожидания**: используйте явное ожидание вместо фиксированных пауз, чтобы повысить эффективность и стабильность. 2. **Для отладки используется пошаговое тестирование**: Схема пошагового выполнения подходит для процесса отладки и не подходит для длительного автоматизированного тестирования. 3. **Гибкость фреймворков тестирования**. С помощью фреймворков можно лучше организовать тестовые примеры и этапы тестирования.

Подвести итог

Благодаря явному ожиданию, ручным точкам останова, времени паузы или в сочетании со средой тестирования можно эффективно разработать пошаговый процесс тестирования для облегчения операций отладки и оптимизации.

Selenium ищет текст, начинающийся с определенной строки, и извлекает данные.

Пример кода

из веб-драйвера импорта селена
из selenium.webdriver.common.by импортировать

# Инициализируем селен
драйвер = вебдрайвер.Chrome()
driver.get("URL-адрес вашей целевой веб-страницы")

# Поиск текста, начинающегося с определенной строки
target_text = "Начальный текст цели"
rows = driver.find_elements(By.CSS_SELECTOR, "таблица tr")

# Сохранить результаты
результат_данные = []

для строки в строках:
    ячейки = row.find_elements(By.TAG_NAME, "td")
    если ячейки и ячейки[0].text.startswith(target_text):
        # Получите информацию об узле
        result_data.append([cell.text для ячейки в ячейках])

драйвер.выйти()

# Конвертируем результат в HTML
html_output = "<h2>Результаты поиска</h2>\n"
для i, row_data в перечислении (result_data, start = 1):
    html_output += f"<h3>Line {i}</h3>\n<ul>\n"
    для данных в row_data:
        html_output += f" <li>{данные}</li>\n"
    html_output += "</ul>\n"

# показать результаты
печать (html_output)

Пример результата выполнения


Результаты поиска
Линия 1

  Целевой начальный текст 1
  Другая информация1
  Другая информация 2

Линия 2

  Целевой вступительный текст 2
  Другая информация1
  Другая информация 2

На что следует обратить внимание

Текст в начале определенной строки: используйтеstartswithМетод определения соответствия текста условиям.
Структура заголовка HTML: используйте по мере необходимости<h2>и<h3>, и в виде неупорядоченного списка<ul>Организуйте информацию.
Незачем<head>и<body>: Создавайте только необходимые HTML-теги для удобного встраивания в другие страницы.

find_elements By.XPATH

Обзор

В Селене,find_elements(By.XPATH, xpath)Используется для поиска всех элементов, соответствующих критериям, на основе селектора XPath и возврата списка. это связано сfind_element(By.XPATH, xpath)В отличие от последнего, последний возвращает только первый соответствующий элемент.

базовая грамматика

из веб-драйвера импорта селена
из selenium.webdriver.common.by импортировать

# Запустить браузер
драйвер = вебдрайвер.Chrome()

# Открыть веб-страницу
driver.get("https://example.com")

# Используйте XPath, чтобы найти все элементы, соответствующие критериям
elements = driver.find_elements(By.XPATH, "//div[@class='example-class']")

# Обходим найденные элементы и выводим содержимое
для элемента в элементах:
    печать(element.text)

# Закрыть браузер
драйвер.выйти()

Общие выражения XPath

XPath-выражение	описывать
`//tagname`	Выбирает все элементы с указанным тегом, например`//div`представлять все`div`элемент
`//tagname[@attribute='value']`	Выбирайте элементы на основе значений атрибутов, например.`//input[@type='text']`
`//tagname[contains(@attribute, 'value')]`	Атрибуты, содержащие определенный текст, например`//div[contains(@class, 'header')]`
`//tagname[text()='text']`	Выберите элементы, которые точно соответствуют тексту, например`//button[text()='Отправить']`
`//tagname[contains(text(), 'text')]`	Выберите элементы, содержащие определенный текст, например`//p[содержит(текст(), 'Добро пожаловать')]`
`//*[@id='some-id']`	Выберите элемент с определенным идентификатором
`(//tagname)[index]`	Выберите`index`совпадающие элементы, например`(//div)[1]`Выберите первый div

Пример: найти несколько элементов

Предположим следующую структуру HTML:

<div class="product">Продукт А</div>
<div class="product">Продукт Б</div>
<div class="product">Продукт C</div>

Мы можем использовать следующий код Selenium, чтобы получить всеproductКатегорияdivэлемент:

elements = driver.find_elements(By.XPATH, "//div[@class='product']")
for element in elements:
    print(element.text)

На что следует обратить внимание

find_elements()Возвращается список, даже если найден только один элемент.
Если элементы не найдены, возвращается пустой список без выдачи ошибки.
Если вы уверены, что нужен только один элемент, вам следует использоватьfind_element(),в противном случаеfind_elements()。

в заключение

find_elements(By.XPATH, xpath)Это мощный и гибкий метод поиска в Selenium, который можно использовать для поиска нескольких элементов на веб-странице и подходит для сканеров и автоматического тестирования.

By.LINK_TEXT

Обзор

В Селене,By.LINK_TEXTиBy.PARTIAL_LINK_TEXTИспользуется для поиска элементов по текстовому содержимому гиперссылки:

By.LINK_TEXT: точное совпадение на основе полного текста ссылки.
By.PARTIAL_LINK_TEXT: выполнить нечеткое сопоставление на основе части текста ссылки.

базовая грамматика

из веб-драйвера импорта селена
из selenium.webdriver.common.by импортировать

# Запустить браузер
драйвер = вебдрайвер.Chrome()

# Открыть веб-страницу
driver.get("https://example.com")

# Используйте LINK_TEXT для поиска гиперссылок.
element = driver.find_element(By.LINK_TEXT, «Полный текст ссылки»)
print(element.get_attribute("href"))

# Используйте PARTIAL_LINK_TEXT для поиска гиперссылок
element_partial = driver.find_element(By.PARTIAL_LINK_TEXT, "Частичный текст")
print(element_partial.get_attribute("href"))

# Закрыть браузер
драйвер.выйти()

Пример HTML

<a href="https://example.com/page1">Полный текст ссылки</a>
<a href="https://example.com/page2">Нажмите здесь, чтобы узнать больше</a>

Используйте LINK_TEXT

Предположим, вы хотите нажать<a>Полный текст ссылки</a>, вы можете использовать:

driver.find_element(By.LINK_TEXT, «Полный текст ссылки»).click()

Используйте PARTIAL_LINK_TEXT

Если гиперссылка «Нажмите здесь, чтобы узнать больше», но мы знаем только «Нажмите здесь», вы можете использовать:

driver.find_element(By.PARTIAL_LINK_TEXT, «Нажмите здесь»).click()

Общие сценарии применения

Может использоваться, когда текст гиперссылки длинный и динамически изменяется.By.PARTIAL_LINK_TEXT。
Чтобы убедиться, что текст ссылки уникален, используйтеBy.LINK_TEXTдля точного совпадения.

На что следует обратить внимание

Эти методы работают только с<a>Ссылка на ярлык.
Если веб-страница использует JavaScript для создания ссылки, Selenium, возможно, не сможет найти ее немедленно, и ему придется дождаться ее загрузки.
Если на странице есть несколько похожих ссылок,find_elements()вернет список, аfind_element()Возвращается только первый соответствующий элемент.

в заключение

By.LINK_TEXTПолезно для точного поиска полных ссылок, в то время какBy.PARTIAL_LINK_TEXTБолее гибкий и может использоваться для сопоставления части текста ссылки.

Selenium обрабатывает недостающие элементы

Используйте явное ожидание WebDriverWait

из веб-драйвера импорта селена
из selenium.webdriver.common.by импортировать
из selenium.webdriver.support.ui импортировать WebDriverWait
из selenium.webdriver.support импортируйте ожидаемые_условия как EC

драйвер = вебдрайвер.Chrome()

попробуйте:
    elems = WebDriverWait(драйвер, 10).until(
        EC.presence_of_all_elements_located((By.CSS_SELECTOR, ".item"))
    )
    print("Элемент найден:", len(elems))
кроме:
    print("Элемент не найден в течение 10 секунд")

Использование find_elements само по себе не вызовет исключения и может напрямую определить длину.

элементы = driver.find_elements(By.CSS_SELECTOR, ".item")

если не элементы:
    print("Элемент не найден")
еще:
    print("Количество найденных элементов:", len(elems))

Обрабатывающий элемент еще не появился (частая причина)

DOM еще не загружен → используйте WebDriverWait
Элемент находится в iframe → сначала необходимо переключить iframe
Элемент находится в Shadow DOM → find_elements невозможно найти напрямую
Неверное позиционирование → необходимо перепроверить селектор CSS/Xpath.
При загрузке страницы присутствует динамический JS → нужно дождаться завершения динамического рендеринга

Найти элемент после переключения iframe

# Переключитесь на iframe и повторите поиск
iframe = driver.find_element(By.TAG_NAME, "iframe")
driver.switch_to.frame(iframe)

элементы = driver.find_elements(By.CSS_SELECTOR, ".item")
print("Найдено:", len(elems))

Shadow DOM требует, чтобы JS вошел в ShadowRoot

shadow_host = driver.find_element(By.CSS_SELECTOR, "#shadowHost")
shadow_root = driver.execute_script("return arguments[0].shadowRoot", shadow_host)
elem = shadow_root.find_element(By.CSS_SELECTOR, ".target")

Самая полная и безопасная функция поиска (многоразовая)

def Safe_find_elements (драйвер, по, селектор, тайм-аут = 10):
    попробуйте:
        return WebDriverWait(драйвер, тайм-аут).until(
            EC.presence_of_all_elements_located((по, селектор))
        )
    кроме:
        return [] # Невозможно найти возвращенный пустой список

elements = Safe_find_elements(драйвер, By.CSS_SELECTOR, ".item")

если элементы:
    print("Найдено:", len(elems))
еще:
    print("Элемент не найден")

Selenium обрабатывает окна предупреждений

тип

Простое окно оповещения- Только кнопка «ОК».
Подтвердить окно оповещения- Есть кнопки «ОК» и «Отмена».
Окно с предупреждением- Имеется поле ввода с кнопками «ОК» и «Отмена».

Обработка простых окон предупреждений

из веб-драйвера импорта селена
из selenium.webdriver.common.alert Предупреждение об импорте

драйвер = вебдрайвер.Chrome()
driver.get("URL")

alert = Оповещение (водитель)
print(alert.text) # Получаем предупреждающее сообщение
alert.accept() # Нажмите ОК

драйвер.выйти()

Окно оповещения о подтверждении обработки

alert = Оповещение (водитель)
печать(предупреждение.текст)

alert.accept() # Нажмите ОК
# alert.dismiss() # Нажмите, чтобы отменить

Окно запроса и предупреждения об обработке

alert = Оповещение (водитель)
печать(предупреждение.текст)

alert.send_keys("Тестовый ввод") #Ввод содержимого
alert.accept() # Нажмите ОК

лучшие практики

использоватьdriver.switch_to.alertПереключиться на окно оповещений.
использоватьtry-exceptОбрабатывайте исключения, чтобы избежать сбоев теста.

Используйте явное ожидание, чтобы убедиться в появлении окна предупреждения:


from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

WebDriverWait(driver, 10).until(EC.alert_is_present())

Поле предупреждения о проверке селена

Проверьте, есть ли окно с предупреждением

В Selenium вы можете использоватьWebDriverWaitчтобы проверить, существует ли окно с предупреждением, чтобы избежать ошибок, вызванных отсутствием окна с предупреждением.

из веб-драйвера импорта селена
из selenium.webdriver.common.alert Предупреждение об импорте
из selenium.webdriver.support.ui импортировать WebDriverWait
из selenium.webdriver.support импортируйте ожидаемые_условия как EC

драйвер = вебдрайвер.Chrome()
driver.get("URL")

попробуйте:
    # Подождите 5 секунд, чтобы проверить, есть ли окно с предупреждением
    WebDriverWait(драйвер, 5).до(EC.alert_is_present())
    alert = Оповещение (водитель)
    print("Содержимое окна оповещения:", alert.text)
    alert.accept() # Нажмите ОК
кроме:
    print("Предупреждение не найдено")

драйвер.выйти()

лучшие практики

использоватьWebDriverWaitПеред переключением убедитесь, что окно с предупреждением появляется, чтобы избежатьNoAlertPresentException。
использоватьtry-exceptЧтобы предотвратить сбой теста из-за отсутствия окна с предупреждением.

Обработка окна системного оповещения

вопрос

использоватьWebDriverWait(driver, 5).until(EC.alert_is_present())Он может обнаруживать только окна предупреждений, созданные с помощью JavaScript, но не может обнаруживать окна предупреждений на уровне системы Chrome, такие как «Сохранить пароли», «Уведомления веб-сайта» и т. д.

решение

использоватьChromeOptionsОтключите окна предупреждений на уровне системы.
Если появится окно системного предупреждения, возможно, вам придется использоватьpyautoguiилиWin32 APIдля имитации операций с клавиатурой или мышью.

Способ 1: отключить системное оповещение Chrome

Вы можете запустить Chrome,ChromeOptionsзакрывать уведомления и другие общесистемные всплывающие окна.

из веб-драйвера импорта селена

параметры = веб-драйвер.ChromeOptions()
options.add_argument("--disable-notifications") # Отключить уведомления
options.add_argument("--disable-save-password-bubble") # Отключить сохранение запросов на ввод пароля

драйвер = webdriver.Chrome(опции=опции)
driver.get("URL")

Способ 2. Используйте pyautogui для обработки окон системных предупреждений.

Если появилось окно с предупреждением, вы можете использоватьpyautoguiдля имитации ключевых операций, таких как нажатиеEnterилиEscзакрыть.

импортпиавтогуи
время импорта

time.sleep(3) # Дождитесь появления окна с предупреждением
pyautogui.press("enter") # Имитируем нажатие клавиши Enter

Способ 3. Используйте Win32 API (для Windows)

Если вы находитесь в среде Windows, вы можете использоватьpygetwindowиpywinautoдля обнаружения и закрытия всплывающих окон на системном уровне.

импортировать pygetwindow как gw
импортпивинавто

windows = gw.getWindowsWithTitle("Google Chrome") # Получаем окно Chrome
для победы в windows:
    if «системное предупреждение» в win.title.lower(): # Проверьте, содержит ли заголовок «системное предупреждение»
        win.close() # Закрываем окно

лучшие практики

При запуске браузера используйтеChromeOptionsдля предотвращения появления предупреждений.
Если появилось окно системного предупреждения, рассмотрите возможность использованияpyautoguiилиWin32 APIдля имитации операций с клавиатурой или окном.

Shadow DOM

Что такое теневой DOM?

Shadow DOM является частью веб-компонентов и используется для инкапсуляции HTML, CSS и JavaScript, чтобы детали внутренней реализации компонентов не мешали внешнему миру.

Проще говоря, это структура DOM, которая «изолирует область действия».

---

Схема структуры теневого DOM

<пользовательский-элемент>
  #shadow-root (открыть)
    <button>Нажмите на меня</button>
</custom-element>

buttonНа самом деле он существует в теневой DOM и не может использоваться с традиционнымиdocument.querySelector("button")оказаться.

---

Открытый и закрытый режим

open: Доступно с помощью JavaScriptelement.shadowRoot
closed：element.shadowRootВозвращает ноль, недоступен

---

Создать Shadow DOM (открытый режим)

const shadowHost = document.querySelector('#host');
const shadowRoot = shadowHost.attachShadow({ mode: 'open' });
shadowRoot.innerHTML = '<p>Hello from Shadow DOM</p>';

---

Использовать слот-слот

// внутри теневого DOM
<div><slot name="title">Заголовок по умолчанию</slot></div>

// внешнее использование
<пользовательский-элемент>
  <span slot="title">Пользовательский заголовок</span>
</custom-element>

---

Управление теневым DOM в Selenium

js = """
const host = document.querySelector('custom-element');
const shadow = host.shadowRoot;
return shadow.querySelector('button');
"""
button = driver.execute_script(js)
button.click()

---

преимущество

Инкапсуляция: CSS/JS не просачивается и не подвергается влиянию посторонних.
Компонентизация: повторно используемые элементы пользовательского интерфейса.
Безопасность: разрешите разработчикам выполнять внутренние операции только через назначенные API.

---

предел

Элементы в тени нельзя выбрать напрямую с помощью XPath или общего селектора CSS.
Требуется JavaScript для полученияshadowRootИскать позже

Selenium с браузером Tor

Основные понятия

Браузер Tor по сути представляет собой Firefox ESR плюс настройки сети Tor и расширенные настройки конфиденциальности. Selenium не может «управлять графическим интерфейсом браузера Tor» напрямую, но можетFirefox + Tor SOCKS Proxyспособ добиться того же эффекта анонимности, что и в Tor Browser.

необходимые условия

Установлен браузер Tor (или, по крайней мере, пакет Tor Expert Bundle).
Пакет Python: селен
Firefox и соответствующая версия geckodriver

Как запустить Тор

Сначала убедитесь, что Tor запущен на локальном компьютере. Прокси-сервер SOCKS по умолчанию:

127.0.0.1:9050

Если вы используете Tor Browser, после запуска обычно происходит следующее:

127.0.0.1:9150

Настройте прокси-сервер Tor с помощью Selenium

from selenium import webdriver
from selenium.webdriver.firefox.options import Options
from selenium.webdriver.firefox.service import Service

options = Options()
options.set_preference("network.proxy.type", 1)
options.set_preference("network.proxy.socks", "127.0.0.1")
options.set_preference("network.proxy.socks_port", 9150)
options.set_preference("network.proxy.socks_remote_dns", True)

service = Service("geckodriver.exe")
driver = webdriver.Firefox(service=service, options=options)

driver.get("https://check.torproject.org")

Проверьте, успешно ли используется Tor

Введите следующий URL-адрес, и на странице будет показано, что использование Tor означает успех:

https://check.torproject.org

Бинарный файл Firefox для конкретного браузера Tor

Если вы хотите использовать Firefox, встроенный в браузер Tor:

options.binary_location = r"C:\Tor Browser\Browser\firefox.exe"

Полный пример (Windows)

from selenium import webdriver
from selenium.webdriver.firefox.options import Options
from selenium.webdriver.firefox.service import Service

options = Options()
options.binary_location = r"C:\Tor Browser\Browser\firefox.exe"

options.set_preference("network.proxy.type", 1)
options.set_preference("network.proxy.socks", "127.0.0.1")
options.set_preference("network.proxy.socks_port", 9150)
options.set_preference("network.proxy.socks_remote_dns", True)

service = Service("geckodriver.exe")
driver = webdriver.Firefox(service=service, options=options)

driver.get("https://check.torproject.org")

На что следует обратить внимание

Tor + Selenium легко распознается веб-сайтами как автоматизированное поведение.
Безопасность Tor Browser может быть ослаблена настройками Selenium
Пожалуйста, не входите в свою реальную учетную запись, чтобы избежать утечки информации.
Скорость сети Tor низкая, необходимо увеличить настройку тайм-аута Selenium.

Распространенные ошибки

Невозможно подключиться: Tor не запущен или ошибка порта SOCKS.
Firefox не может запуститься: драйвер geckodriver несовместим с версией Firefox
IP не изменился: socks_remote_dns не установлен

Подвести итог

Selenium не может напрямую управлять пользовательским интерфейсом браузера Tor
Правильный путь — Firefox + Tor SOCKS Proxy.
Настройка «socks_remote_dns» — ключ к анонимности

Python извлекает важные электронные письма Thunderbird

Шаг 1: Подготовьте среду

Чтобы извлечь электронные письма из Thunderbird, вы можете использовать библиотеку протокола Python IMAP, например.imaplibили сторонняя библиотекаimapclient. Во-первых, убедитесь, В Thunderbird включен протокол IMAP, и он позволяет внешним приложениям подключаться.

Шаг 2. Установите необходимые библиотеки Python.

Используйте pip для установки связанных библиотек:

pip install imapclient pyzmail36

Шаг 3. Подключитесь к почтовому серверу.

Используйте следующий код для подключения к почтовому серверу и извлечения важных писем:

импортировать imapclient
из pyzmail импортировать PyzMessage

# Настройте почтовый сервер и данные для входа.
IMAP_SERVER = 'imap.example.com' # Замените адресом вашего IMAP-сервера.
EMAIL = 'ваш_адрес@example.com'
ПАРОЛЬ = 'ваш_пароль'

# Подключаемся к IMAP-серверу
с imapclient.IMAPClient(IMAP_SERVER) в качестве клиента:
    client.login(EMAIL, ПАРОЛЬ)
    client.select_folder('ВХОДЯЩИЕ')

    # Поиск сообщений, отмеченных как важные
    messages = client.search(['FLAGGED'])
    для uid в сообщениях:
        raw_message = client.fetch([uid], ['BODY[]'])[uid][b'BODY[]']
        сообщение = PyzMessage.factory(raw_message)
        
        # Отображение информации об электронной почте
        print(f"Тема: {message.get_subject()}")
        print(f"От: {message.get_address('from')}")
        print(f"Дата: {message.get_decoded_header('date')}")

Шаг 4. На что следует обратить внимание

Убедитесь, что адрес сервера IMAP верен и что протокол IMAP включен в вашей учетной записи.
В зависимости от настроек вашего сервера вам может потребоваться создать пароль для конкретного приложения или включить безопасные соединения (SSL).
Никогда не храните пароли непосредственно в коде, рекомендуется использовать переменные среды или инструменты управления паролями.

Шаг 5. Тестирование и отладка

Выполните приведенный выше код, чтобы проверить, сможете ли вы успешно извлечь электронные письма, помеченные как важные. Если у вас возникли проблемы с подключением, вы можете проверить настройки сервера или выполнить более детальную отладку на уровне протокола IMAP.

Таким образом, вы можете успешно извлекать важные электронные письма из Thunderbird с помощью Python.

PyAutoGUI

Установить PyAutoGUI

Установите PyAutoGUI, используя следующие инструкции:

pip install pyautogui

Основные функции

PyAutoGUI — это инструмент автоматизации, который позволяет моделировать операции с мышью и клавиатурой, подходящий для автоматического тестирования графического интерфейса или повторяющейся работы.

Управление мышью

Управляйте положением мыши и действиями:

импортпиавтогуи

# Получить разрешение экрана
screen_width, screen_height = pyautogui.size()
print(f"Разрешение экрана: {screen_width}x{screen_height}")

# Перемещаем курсор мыши по указанным координатам
pyautogui.moveTo(100, 100, продолжительность = 1)

# Перемещаем мышь из текущей позиции
pyautogui.move(50, 50, длительность=1)

# Имитируем щелчок мышью
pyautogui.click(200, 200)

# Имитируем щелчок правой кнопкой мыши
pyautogui.rightClick()

# Имитировать операцию перетаскивания
pyautogui.dragTo(400, 400, длительность=1)

Работа с клавиатурой

Имитировать ввод клавиш клавиатуры:

импортпиавтогуи

# Введите текст
pyautogui.write("Привет, PyAutoGUI!", интервал=0,1)

# Имитируем нажатие определенной клавиши
pyautogui.press("введите")

# Нажмите несколько клавиш одновременно
pyautogui.hotkey("ctrl", "c") # Копировать текст

Скриншоты и распознавание изображений

Сделайте скриншот или найдите конкретное изображение:

импортпиавтогуи

# Захват всего экрана
скриншот = pyautogui.screenshot()
скриншот.сохранить("скриншот.png")

# Найдите изображение на экране
location = pyautogui.locateOnScreen("image.png")
если местоположение:
    print(f"Местоположение изображения: {location}")
еще:
    print("Изображение не найдено")

Предупреждение и безопасность

Чтобы предотвратить бесконечное выполнение программы, вы можете использоватьpyautogui.FAILSAFE：

pyautogui.FAILSAFE = True # Значение по умолчанию — True
# Подведите указатель мыши к верхнему левому углу экрана (0, 0), чтобы немедленно остановить программу

Общие приложения

Автоматизируйте повторяющиеся действия, такие как заполнение форм или нажатие кнопок.
Снимок экрана, позволяющий определить, существуют ли определенные элементы пользовательского интерфейса.
Имитируйте операции с клавиатурой и мышью для простого тестирования.

Управление Surfshark VPN

Подготовка

Если Surfshark VPN не предоставляет инструменты командной строки, такие какsurfshark-cli), вам необходимо использовать инструменты автоматизации графического интерфейса (например,pyautogui) имитирует ручное управление.

Установлено настольное приложение Surfshark VPN.
Питон установленpyautoguiмодуль (доступен черезpip install pyautoguiУстановить).
Убедитесь, что сценарий Python имеет достаточные разрешения.

логика программы

черезpyautoguiАвтоматизируйте нажатие кнопки в графическом интерфейсе Surfshark для подключения или отключения от VPN.

Пример кода

В следующем примере предполагается, что Surfshark VPN имеет фиксированное положение кнопки и используетpyautoguiЧтобы сделать:

импортпиавтогуи
время импорта

защита Connect_VPN():
    # Убедитесь, что Surfshark включен
    print("Попробуйте подключиться к VPN...")
    # Имитируем нажатие кнопки «Подключиться» и корректируем координаты в соответствии с фактическим местоположением
    pyautogui.click(x=500, y=300) # Заменить позицией кнопки «Подключиться»
    time.sleep(5) # Дождитесь завершения соединения
    print("VPN подключен")

защита отключение_vpn():
    # Убедитесь, что Surfshark включен
    print("Попробуйте отключиться от VPN...")
    # Имитируем нажатие кнопки «Отключить» и корректируем координаты в соответствии с фактическим положением
    pyautogui.click(x=500, y=350) # Заменить позицией кнопки «Отключить»
    time.sleep(5) # Дождитесь завершения отключения
    print("VPN отключен")

# тест
Connect_VPN()
отключить_vpn()

Меры предосторожности при реальной эксплуатации

Координаты кнопок: необходимо настроить в соответствии с разрешением экрана и интерфейсом Surfshark VPN.xиyкоординаты.
Запустите приложение: убедитесь, что Surfshark VPN запущен, в противном случае оно будет работать.subprocessОткройте приложение, например.subprocess.run("start surfshark.exe", shell=True)。
Разрешения на автоматизацию: может потребоваться разрешить ввод олицетворения в настройках Windows.

Альтернативный метод

Если метод координат нестабилен, вы можете использовать распознавание изображений (например,pyautogui.locateOnScreen()), чтобы найти положение кнопки и повысить гибкость.

Kivy - Python GUI

Kivy — это платформа Python с открытым исходным кодом для быстрой разработки мультисенсорных приложений. Он разработан с учетом кроссплатформенной поддержки, что позволяет разработчикам работать на Windows, macOS, Linux, iOS и Android. Подождите, пока один и тот же код запустится на нескольких платформах. Kivy особенно подходит для создания приложений с графическим интерфейсом для мобильных телефонов, планшетов и настольных устройств и имеет хорошую поддержку мультитач.

Основные особенности Киви

Кроссплатформенная поддержка: Kivy поддерживает основные операционные системы, включая Windows, macOS, Linux, а также мобильные платформы, такие как Android и iOS.
мультитач: Встроенная поддержка мультитач-событий, подходящая для разработки приложений для мобильных телефонов и планшетов.
Эффективный дизайн интерфейса: Kivy предоставляет богатые возможности управления пользовательским интерфейсом и может использовать Kivy Language (KV) для быстрого проектирования и макетирования интерфейса.
Аппаратное ускорение: Kivy использует OpenGL ES 2 для рендеринга графики, обеспечивая плавность и производительность приложений.

Как использовать Киви

Приложения Kivy состоят из нескольких виджетов, которые можно разместить с помощью кода или KV-файлов собственного языка Kivy. Ниже приведен простой пример приложения, в котором отображается кнопка, меняющая цвет при нажатии.

базовый пример

из приложения импорта kivy.app
из kivy.uix.button Кнопка импорта

класс MyApp(Приложение):
    защита сборки (сам):
        return Button(text='Привет, Киви!',
                      background_color=(0, 1, 0, 1)) # Зеленая кнопка

если __name__ == '__main__':
    МоеПриложение().run()

Установить Киви

Kivy можно установить через pip:

pip install kivy

Сценарии применения Kivy

Kivy подходит для различных сценариев применения, включая, помимо прочего:

Мультитач-приложения для мобильных телефонов и планшетов
Кроссплатформенное настольное приложение
разработка игр
Инновационный интерфейс и дизайн взаимодействия

Как удаленно отображать данные в Python Kivy

Kivy — это среда Python для создания кроссплатформенных приложений, но обычно она работает на локальном устройстве. Чтобы удаленно отобразить приложение Kivy, вы можете рассмотреть следующие варианты:

1. Используйте VNC или инструменты удаленного рабочего стола.

Вы можете использовать VNC (виртуальные сетевые вычисления) или другие инструменты удаленного рабочего стола (такие как RDP, TeamViewer и т. д.) для удаленного управления и отображения приложений Kivy.

Установите на сервер VNC-сервер или другое программное обеспечение для удаленного рабочего стола.
Установите соответствующие клиентские инструменты на локальное устройство.
Подключитесь к серверу и удаленно отобразите приложение Kivy.

2. Используйте пересылку X11 (для Linux).

Те, кто использует Linux, могут использовать пересылку X11 для удаленного отображения графического интерфейса:

Убедитесь, что на удаленном сервере установлен X11.
Используйте команды SSH на локальной стороне для пересылки X11:
```
ssh -X username@remote_host
```
Запустите приложение Kivy, и оно появится на вашем локальном устройстве.

3. Используйте Kivy + Flask в качестве дисплея веб-приложения.

Вы можете использовать Flask или другие веб-фреймворки, чтобы предоставлять доступ к частям вашего приложения Kivy удаленным пользователям и отображать их с помощью веб-браузера:

Создайте серверную часть Flask для обработки данных или операций, связанных с Kivy.
Отобразите соответствующий вывод в веб-интерфейсе (Kivy нельзя отобразить непосредственно в Интернете, поэтому этот метод в основном используется для обработки данных или взаимодействия с серверной частью).

4. Docker + Kivy + VNC

Если вы хотите запустить приложение Kivy в контейнерной среде, вы можете настроить его с помощью Docker и VNC:

Упакуйте приложение Kivy в контейнер Docker.
Установите VNC-сервер в контейнер.
Подключитесь к удаленному контейнеру через VNC и просмотрите интерфейс приложения Kivy.

No module named 'kivy.garden.tickmarker'

ModuleNotFoundError: No module named 'kivy.garden.tickmarker'

This error indicates that the tickmarker module from Kivy's Garden is not installed. To fix this issue, follow the steps below:

Steps to Resolve the Issue

Install Kivy Garden
If you don’t already have Garden installed, open your terminal or command prompt and run the following command:
```
pip install kivy-garden
```
Install the Tickmarker Widget
After installing Kivy Garden, install the tickmarker widget by running:
```
garden install tickmarker
```

Once you've done these steps, try running your Kivy application again.

Rio UI

Введение

Rio UI — это инфраструктура пользовательского интерфейса, в основе которой лежит Python, предназначенная для того, чтобы позволить разработчикам писать интерактивные приложения простым и интуитивно понятным способом. Он основан на логике программирования Python и представляет пользовательский интерфейс с помощью современных интерфейсных технологий.

особенность

Вы можете написать пользовательский интерфейс, используя чистый синтаксис Python, что снижает порог обучения, связанный с разделением внешнего и внутреннего интерфейса.
Поддерживает обновления в реальном времени и реактивный интерфейс.
Может сочетаться с веб-технологиями для предоставления кроссплатформенных решений.
Упрощает процесс развертывания и подходит для быстрого прототипирования.

Способ установки

pip install rio-ui

базовый пример


import rio

app = rio.App()

@app.page("/")
def index():
    return rio.Text("Hello, Rio UI with Python!")

if __name__ == "__main__":
    app.run()

Сценарии применения

Быстрая разработка небольших инструментов и внутренних систем
Создавайте интерактивные приложения для визуализации данных.
Прототипы систем образовательного или исследовательского характера

email: [email protected]

T:0000

資訊與搜尋 | 回dev首頁 | 回python首頁
email: Yan Sa [email protected] Line: 阿央

電話: 02-27566655 ,03-5924828

阿央
泱泱科技
捷昱科技泱泱企業

Python

разработка программного обеспечения

Разработка мультимедийного программного обеспечения

Общие ссылки Python

Преимущества Python

Краткий и простой в освоении синтаксис

Богатая стандартная библиотека и сторонние ресурсы.

Кроссплатформенные функции

Широко используется во многих областях

Активная поддержка сообщества

Эффективная скорость разработки

Среда разработки Python

Anaconda

Что такое Анаконда?

Основные функции

Подходит для объектов

Как установить Анаконду?

Часто задаваемые вопросы

Окружающая среда Анаконды

Что такое среда Анаконды

Создать среду

Запуск и переключение сред

Посмотреть среду

Экспорт и восстановление сред

Удалить среду

Jupyter

Что такое Юпитер?

Основные функции

Основные компоненты

Область применения

Как использовать Юпитер?

Преимущества и проблемы

Среда разработки VS Code Python

Установить код Visual Studio

Установите расширение Python

Установить Python

Настройка интерпретатора Python

Выполнить программу Python

Установите необходимые пакеты

Включить автозаполнение и отладку

Часто используемые сочетания клавиш

VS Code

VS Code устанавливает параметры выполнения Python

Изменить файл запуска.json

Установите параметры программы и аргументов

Цель аргументов

Чтение параметров в программе

Пример выполнения

Режим отладки VS Code Python

Включить режим отладки

Настройка launch.json

Установить точку останова

Функция отладки

Проверьте переменные

Использование консоли отладки

VS Code устанавливает путь Python

Шаг 1. Установите Python и VS Code

Шаг 2. Установите расширение Python

Шаг 3. Проверьте путь установки Python.

Шаг 4. Установите путь Python

Шаг 5. Подтвердите настройки.

Дополнительная информация

Переключение среды VS Code Python

1. Шаги по выбору среды Python

2. Как решить использовать Anaconda или другие среды

3. Управление средами и их переключение в Conda.

4. Часто задаваемые вопросы и решения

Запустите Python на своем Chromebook

Способ 1: использование Linux (Кростини)

Способ 2. Используйте онлайн-компилятор.

Способ 3. Установите приложение для Android.

Способ 4: используйте код VS

в заключение

руководство по использованию пипа

1. Что такое пип?

2. Основные операции pip

3. Расширенные функции

4. Часто задаваемые вопросы и решения

5. Лучшие практики для pip

папка pip/cache/http-v2

2. Используйте`len()`функция

3. Используйте эквивалентные сравнения`== []`