Python
Python — اسنیپتهای منتخب
جعبهابزار میدانی یه مهندس پایتون که پاش به زمین بنده: برنامههای کوچیک، کامل و مستقل (اغلب فقط با کتابخونهی استاندارد) که یه مسئلهی واقعی رو از اول تا آخر حل میکنن — عیبیابی یه incident تو Ops، تطبیق دوتا خروجی حسابداری، بررسی یه dérive تو اسکیما. هر اسنیپت واقعاً اجرا میشه، خروجیش واقعیه، و تمرکز روی استواریه (حالتهای مرزی، NaN، idempotence) نه روی نحو پایه.
20 اسنیپت منتخب
- groupby + transform: ویژگیهای همتراز با ردیفهاtransform یه سری به اندازهی DataFrame اصلی برمیگردونه: حرف نداره برای اینکه هر ردیف رو نسبت به گروه خودش نرمال کنی.
- کم کردن حافظهی DataFrame (downcast + category)اعداد صحیح و اعشاری رو downcast میکنی و ستونهای متنیِ تکراری رو میبری روی category: مصرف حافظه 5 تا 10 برابر میاد پایین.
- merge_asof: اتصال زمانی بدون نشت آیندههر رویداد رو میچسبونی به آخرین مقدار شناختهشده از یه سری دیگه (جهت backward)، با حداکثر تلورانس مجاز.
- accumulate: منحنی equity و حداکثر drawdownجمعهای تجمعی با itertools.accumulate: جمع جاری برای منحنی سرمایه، بیشینهی جاری برای سقفها، و drawdown از تفاضل این دوتا.
- تحلیل Pareto: value_counts و سهم تجمعیفراوانی، درصد و جمع تجمعی توی سه خط: نشون میده چند تا الگو 80 درصد حجم رو توضیح میدن.
- تحلیلگر لاگ Nginx: گزارش کامل ترافیکیه ابزار کوچیک که access.log رو میپیمایه، ترافیک رو بر حسب ساعت و کلاس کد HTTP تجمیع میکنه و یه گزارش کنسولی با میلههای ASCII و درصد چاپ میکنه.
- بکتست ساده: تقاطع میانگینهای متحرکبکتست برداری استراتژی SMA 20/50 رو کندلهای H1: پوزیشن با یه کندل تأخیر (بدون look-ahead)، منحنی equity، نرخ winrate و حداکثر drawdown.
- مغایرتگیری دو تا خروجی حسابدارییه merge بیرونی با indicator بین خروجی بانک و خروجی حسابداری: اقلامی که یه سمت غایبن، اختلاف مبلغ تا سنت، و یه جدول از ردیفهایی که باید بهشون رسیدگی شه.
- پایش انقضای گواهیهای SSLبه هر دامنهی پارک با TLS وصل میشه، تاریخ notAfter گواهی رو میخونه و فوریت تمدید رو (OK / BIENTOT / URGENT) تو یه جدول وضعیت دستهبندی میکنه.
- گزارش SLA رو خروجی تیکتهای پشتیبانیمدت رفع هر تیکت رو حساب میکنه، با SLA اولویتش (P1=4h … P4=72h) میسنجه و یه جدول نرخ رعایت / میانه به تفکیک اولویت میده، با پرچم رو موارد زیر هدف.
- دستهبندی خودکار صورتحساب بانکیهر هزینهی یه صورتحساب CSV رو با قواعد regex رو شرح تراکنش دستهبندی میکنه، جمع هر دسته رو میبنده و توزیع رو با میلههای متناسب چاپ میکنه.
- تحلیل موجودی: کلاسبندی ABC و کمبودهاارزش خوابیدهی هر کالا رو حساب میکنه، موجودی رو بر اساس سهم تجمعی (80/95/100) تو A/B/C کلاسبندی میکنه و کالاهایی که با نرخ فروش فعلی تا 7 روز دیگه تموم میشن رو فهرست میکنه.
- حذف تکراری فازیِ فیشهای مشتری (SequenceMatcher)همهی جفتهای فیش (نام + شهر) رو با difflib.SequenceMatcher میسنجه و تکراریهای محتملِ بالای 88 درصد شباهت رو فهرست میکنه، با امتیاز تو صدر برای داوری انسانی.
- میز آزمون timeit: 3 پیادهسازی رو در روسه تا روش جمع زدن 100000 عدد صحیح رو با timeit.repeat (کمینه 5 تکرار) میسنجه و بعد کاندیداها رو بر اساس ms/فراخوانی با نسبت و میله رتبهبندی میکنه.
- کنترل مهاجرت: شمارش مبدأ در برابر مقصدحجم جدولبهجدول سیستم قدیم و جدید رو مقایسه میکنه، دلتاهای علامتدار رو نشون میده و برای سوییچ حکم GO / NO-GO صادر میکنه.
- کش دیسکی بهصورت دکوراتور با آمار hit/missدکوراتوری که خروجی توابع رو به JSON روی دیسک ذخیره میکنه (کلید SHA-1 آرگومانها)، برخلاف lru_cache از ریاستارت جون سالم به در میبره و hit/missها رو ثبت میکنه.
- ناشناسساز GDPR: ناممستعارسازی خروجی CSVفیلدهای PII (نام، نام خانوادگی، ایمیل، تلفن) رو با یه هش SHA-256 نمکدار و کوتاهشده جایگزین میکنه — قطعیه، پس joinهای بین فایلها بعد از ناشناسسازی هنوز کار میکنن.
- مینی موتور جستجوی TF-IDF روی مستنداتفایلهای Markdown پوشهی docs/ رو ایندکس میکنه، یه امتیاز TF-IDF دستساز (بدون وابستگی) حساب میکنه و مرتبطترین سندها رو برای یه پرسش آزاد رتبهبندی میکنه.
- آشکارساز رانش اسکیما بین دو استخراجستونها و dtypeهای دو استخراج ماهانه از یه جریان رو میسنجه: ستونهای اضافه/حذفشده، نوعهای تغییرکرده و حکم اینکه برای پایپلاین پاییندست مسدودکننده هست یا نه.
- هماهنگکننده jobهای ترتیبی با ژورنالمراحل یه پایپلاین (extract، transform، load، checks) رو با subprocess پشتسرهم اجرا میکنه، با اولین خطا وایمیسه و ژورنال اجرا رو چاپ میکنه: کد بازگشت، مدت، وضعیت هر مرحله.