git / code.ach.gov.ru / edu / budgetdiff-notebook

commit 2b7fe3e03575a5491ff8a11c6c8b69b6a27df06a

author Иван Бегтин <ibegtin@gmail.com>

date 2019-06-28 09:42:24 +0300

parents 11a6ba61

browse tree at this commit

message

Добавлены комментарии в записной книжке

files

fileadddel
Бюджетные корректировки (файлы CSV).ipynb+69-2
Бюджетные корректировки (через API).ipynb+12-2

patch

diff --git a/Бюджетные корректировки (файлы CSV).ipynb b/Бюджетные корректировки (файлы CSV).ipynb
index a042915a2b44b2b3db341a0f7ebfe855c1453ed1..dcc2c72150331ff7696e3c8caaf322b350b6a066 100644
--- a/Бюджетные корректировки (файлы CSV).ipynb
+++ b/Бюджетные корректировки (файлы CSV).ipynb
@@ -6,7 +6,9 @@    "metadata": {},
    "source": [
     "# Работа с бюджетными корректировками через CSV файлы\n",
     "\n",
-    "На основе данных закешированных, а ранее выкачанных через API к бюджету на ЕПБС (budget.gov.ru)"
+    "На основе данных закешированных, а ранее выкачанных через API к бюджету на ЕПБС (budget.gov.ru)\n",
+    "Чтобы эта записная книжка работала, необходимо вначале запустить скрипт data_collect.py который вытащит из API \n",
+    "и сохранит в файлы CSV в папку \"data/raw\" сводные бюджетные росписи из API."
    ]
   },
   {
@@ -7881,6 +7883,62 @@    ],
    "source": [
     "fulldiff.loc[fulldiff['grbs'] == '388']"
    ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Попробуем получить сводку по национальным проектам. Они отличаются тем что закодированы латинскими буквами в csr_article. Первый знак - это латинская буква и остальные 4 знака это нули"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 189,
+   "metadata": {
+    "scrolled": false
+   },
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "205\n"
+     ]
+    },
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "/usr/local/lib/python3.6/dist-packages/ipykernel_launcher.py:5: UserWarning: Boolean Series key will be reindexed to match DataFrame index.\n",
+      "  \"\"\"\n"
+     ]
+    },
+    {
+     "data": {
+      "text/plain": [
+       "array(['R0000', 'T0000', 'D0000', 'A0000', 'G0000', 'N0000', 'P0000',\n",
+       "       'F0000', 'E0000', 'S0000', 'V0000', 'L0000'], dtype=object)"
+      ]
+     },
+     "execution_count": 189,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "digits = ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']\n",
+    "df_f = get_full_budget_data(datetime.date(2019, 6,1))\n",
+    "#projects = dg_f[full_2019_6_1['csr_article'] != '00000'][full_2019_6_1['vr'].isnull() == True][full_2019_6_1['csr_article'].isnull() == False]\n",
+    "\n",
+    "projects = df_f.loc[df_f['vr'].isnull()].loc[df_f['csr_article'].isnull() == False][df_f['csr_article'].str[1:] == '0000'][df_f['csr_article'].str[0] != '0'][df_f['csr_article'].str[0] != '9']\n",
+    "print(len(projects))\n",
+    "#for index, row in projects.iterrows():\n",
+    "#    if row['csr_article'][0].isdigit():\n",
+    "#        projects.drop(index, inplace=True)\n",
+    "        \n",
+    "projects_codes = projects['csr_article'].unique()\n",
+    "projects_codes"
+   ]
   }
  ],
  "metadata": {
@@ -7900,8 +7958,17 @@    "name": "python",
    "nbconvert_exporter": "python",
    "pygments_lexer": "ipython3",
    "version": "3.6.7"
+  },
+  "pycharm": {
+   "stem_cell": {
+    "cell_type": "raw",
+    "source": [],
+    "metadata": {
+     "collapsed": false
+    }
+   }
   }
  },
  "nbformat": 4,
  "nbformat_minor": 2
-}
+}
\ No newline at end of file
diff --git a/Бюджетные корректировки (через API).ipynb b/Бюджетные корректировки (через API).ipynb
index 12e6233e5ebf6940a5a4783245d9eb516421fc64..fa5f8a82e30914f29fe38b814c823813ea603ac4 100644
--- a/Бюджетные корректировки (через API).ipynb
+++ b/Бюджетные корректировки (через API).ipynb
@@ -6,7 +6,8 @@    "metadata": {},
    "source": [
     "# Бюджетные корректировки с использованием API\n",
     "\n",
-    "На основе API к бюджету на ЕПБС (budget.gov.ru) отслеживание ежедневных изменений"
+    "Эта записная книжка работает на основе API к бюджету на ЕПБС (budget.gov.ru) отслеживание ежедневных изменений\n",
+    "Оно работает не очень быстро, поэтому некоторые функции могут исполняться до полутора минут.\n"
    ]
   },
   {
@@ -4487,8 +4488,17 @@    "name": "python",
    "nbconvert_exporter": "python",
    "pygments_lexer": "ipython3",
    "version": "3.6.7"
+  },
+  "pycharm": {
+   "stem_cell": {
+    "cell_type": "raw",
+    "source": [],
+    "metadata": {
+     "collapsed": false
+    }
+   }
   }
  },
  "nbformat": 4,
  "nbformat_minor": 2
-}
+}
\ No newline at end of file