داده های اکسل در پایتون

Man with the glasses. Student in computer science class. Person uses a computer.

این روز ها میشه گفت که تقریباً تمام سازمان ها و شرکت ها نرم افزار مایکروسافت اکسل را به عنوان ابزاری همه منظوره، برای تجزیه و تحلیل داده ها و در مراحل پایه ای برای ثبت داده ها استفاده می کنند.جمع بندی و دسته بندی، مرتب سازی و فیلتر، استفاده از دستورها و توابع از کار های پر اهمیت اکسل هست البته در اکسل میتوانیم ماکرو نویسی کنیم یا با خلاقیت فرمول های ترکیبی بنویسیم.

مهم نیست که داده های شرکت ها و سازمان ها متن یا صوت یا فیلم یا عکس باشد،داده ها ارزشمند ترین دارایی برای یک سازمان یا شرکت به حساب می آید اما به دلیل اینکه بسیاری از سازمان ها و شرکت ها دیتا های خود را در اکسل نگهداری می کنند استفاده این نوع از دیتا اهمیت چندانی پیدا می کند،البته باید بپذیریم که داده علی رغم این که یکی از عناصر مهم و قدرتمند در هر سازمان است ولی متاسفانه به دلیل عدم وجود زیرساخت های لازم و یا مشکلاتی که به مرور زمان ایجاد و انباشته شده اند ، مدیریت آن در جهت تبدیل به یک سرمایه استراتژیک بسیار ضعیف است .

بهترین حالت برای استفاده از دیتا ها ذخیره سازی و مرتب سازی همه دیتا ها در یک دیتابیس واحد هست که معمولا از SQL استفاده می شود اما برای تک دیتا ها بد نیست که این نوع از استفاده دیتا در پایتون را بلد باشیم

پیشنهاد برای مطالعه “داده پرت یعنی چی؟و چرا وجود دارد؟”

Pandas

خب لازم هست اول pandas رو نصب کنیم برای این کار کافیه کد زیر رو داخل cmd بزنیم

pip install pandas

وقتی pandas رو نصب کردیم لازمه که یک فایل از داده ها (فایل اکسل )داشته باشیم که باید آن را در پوشه کد قرار دهیم.

چه کد هایی باید بزنیم؟

خب وقتی فایل داده رو آماده کردید کافیه طبق کد های زیر در jupyter notebook پیش برید.

import pandas as pd
#تعریف کردن یک متغیر و قرار دادن فایل در آن(توجه داشته باشید اگر فرمت فایل چیزی دیگه ای بود باید به جای سی اس وی اسم اونو بنویسید)
file = pd.read_csv("cars.csv")
# چاپ کردن فایل(یک اطلاعات جزئی به ما میده)
print(file)
#پنج داده اول رو به ما نشون میده
print(file.head())
#پنج داده آخر رو به ما نشون میده
print(file.tail())
#می تونیم به این شکل تعداد ردیف موردنظر رو مشاهده کنیم و فقط کافیه به جای پنج یک عدد دیگه بزاریم
print(file[:5])
#ایندکس فایل رو به ما میده یعنی میگه چند داده داریم
print(file.index)

امیرحسین سخائیان
من دانشجوی مهندسی صنایع هستم؛به مباحث برنامه نویسی و هوش مصنوعی علاقمندم،چند سالی هست که در زمینه مارکتینگ و تولید محتوا فعالیت دارم و دوست دارم تا چیز هایی که یاد می گیرم رو با شما به اشتراک بگذارم نوشته های من رو می توانید از وبلاگ رایلرن مشاهده کنید