Создание датафрейма является одной из основных операций при работе с таблицами. Датафрейм ー это структура данных, представляющая собой таблицу, состоящую из строк и столбцов. В Python для создания и работы с датафреймами используется библиотека pandas.
Операции с таблицами
Операции с таблицами включают в себя добавление, удаление и изменение строк и столбцов, выборку, фильтрацию, сортировку, группировку, агрегацию, преобразования, соединение, слияние и объединение таблиц, а также расчеты и вычисления статистики.
Создание датафрейма
Создать датафрейм можно из различных источников данных, таких как CSV-файлы, базы данных, словари и другие датафреймы. Однако в данной статье мы рассмотрим способы создания датафрейма из уже существующего датафрейма.
Для создания датафрейма из датафрейма можно использовать методы pandas, такие как copy, append, concat и merge.
Метод copy
Метод copy позволяет создать копию существующего датафрейма. Новый датафрейм будет иметь те же данные и структуру, что и исходный.
import pandas as pd
# Создание исходного датафрейма
df1 pd.DataFrame({'A'⁚ [1, 2, 3], 'B'⁚ [4, 5, 6]})
# Создание копии исходного датафрейма
df2 df1.copy
print(df1)
print(df2)
Результат⁚
A B
0 1 4
1 2 5
2 3 6
A B
0 1 4
1 2 5
2 3 6
Метод append
Метод append позволяет добавить данные другого датафрейма к уже существующему. Новый датафрейм будет состоять из строк исходного датафрейма и добавляемого датафрейма.
import pandas as pd
# Создание исходного датафрейма
df1 pd.DataFrame({'A'⁚ [1, 2, 3], 'B'⁚ [4, 5, 6]})
# Создание датафрейма, который будет добавлен к исходному
df2 pd.DataFrame({'A'⁚ [7٫ 8٫ 9]٫ 'B'⁚ [10٫ 11٫ 12]})
# Добавление датафрейма df2 к df1
df3 df1.append(df2)
print(df1)
print(df2)
print(df3)
Результат⁚
A B
0 1 4
1 2 5
2 3 6
A B
0 7 10
1 8 11
2 9 12
A B
0 1 4
1 2 5
2 3 6
0 7 10
1 8 11
2 9 12
Метод concat
Метод concat позволяет объединить два или более датафрейма вдоль определенной оси. Можно указать, какие датафреймы и какие оси объединять.
import pandas as pd
# Создание исходных датафреймов
df1 pd.DataFrame({'A'⁚ [1, 2, 3], 'B'⁚ [4, 5, 6]})
df2 pd.DataFrame({'A'⁚ [7٫ 8٫ 9]٫ 'B'⁚ [10٫ 11٫ 12]})
# Объединение двух датафреймов вдоль оси 0 (строки)
df3 pd.concat([df1, df2], axis0)
# Объединение двух датафреймов вдоль оси 1 (столбцы)
df4 pd.concat([df1, df2], axis1)
print(df1)
print(df2)
print(df3)
print(df4)
Результат⁚
A B
0 1 4
1 2 5
2 3 6
A B
0 7 10
1 8 11
2 9 12
A B
0 1 4
1 2 5
2 3 6
0 7 10
1 8 11 2 9 12
A B A B
0 1 4 7 10
1 2 5 8 11
2 3 6 9 12
Метод merge
Метод merge позволяет соединить два датафрейма по одному или нескольким столбцам. Можно указать, как соединять столбцы, какие столбцы использовать и другие параметры соединения.
import pandas as pd
# Создание исходных датафреймов
df1 pd.DataFrame({'A'⁚ [1٫ 2٫ 3]٫ 'B'⁚ [4٫ 5٫ 6]})
df2 pd.DataFrame({'C'⁚ [3, 4, 5], 'D'⁚ [6, 7, 8]})
# Соединение двух датафреймов по столбцу A датафрейма df1 и столбцу C датафрейма df2
df3 pd.merge(df1٫ df2٫ left_on'A'٫ right_on'C')
print(df1)
print(df2)
print(df3)
Результат⁚
A B
0 1 4
1 2 5
2 3 6
C D
0 3 6
1 4 7
2 5 8
A B C D
0 3 6 3 6
Таким образом, при работе с датафреймами важно уметь создавать новый датафрейм из уже существующего. Методы copy, append, concat и merge позволяют легко выполнять эти операции и создавать более сложные структуры данных для анализа и обработки в Python.