Головна    Статті    Карта    Зв'язок   

Розрахунок об'єму даних при роботі з Базою Даних



грудень 2014

Коротко основне.

Кожен проект повинен бути спочатку проаналізований. В частині Бази Даних одним з аспектів для аналізу має бути: "- Який ж об'єм даних будуть займати всі зіписи? Один МБайт, сотню чи більше МБайт?... І які вихідні дані необхідні для розрахунку?". Власне розгляну розрахунок об'єму лише безпосередньо самих даних, без врахування програмного забезпечення операційних ситем, драйверів і інших службових програмних продуктів.

1. Вихідні дані для розрахунку об'єму даних при роботі з Базою Даних

дівчина на ресепшині

Спочатку плануємо об'єм робіт, які дані необхідно записувати і як довго, краще звичайно буде це зрозуміти, якщо розраховувати дані для якогось зразку.

Зразок.

Дівчина в приймальній (Reception) готелю на Карібах :) має внести в Базу Даних слідуючу інформацію.
1. Прізвище
2. Номер кімнати
3. Термін перебування

Далі потрібно відмітити, в таблиці з даними створимо ще одну колонку - це індекс, так зазвичай роблять, щоб можна було звернутись до певного рядка таблиці. Такий собі унікальний ключ до кожного запису.

І нехай таблиця буде на 10 000 записів (рядків), вважаю цього буде досить для готелю на найближчий період.

Таблиця з даними

Зразок таблиці з даними

2. Дещо інформації з уроків інформатики

- Яким чином взагалі рахувати об'єм електронних записів? На сьогоднішній день (грудень 2014 року), можливо через декілька років будуть рахувати по іншому, нам допоможе система кодування Unicode. Всі знають що комп'ютерний світ, це одинички та нолики, 1/0; Кожен знак речення це набір одиничок та ноликів. Саме об'єм цих одиничок та ноликів потрібно порахувати.

З курсу інформатики знаємо, що:

Біт (англ. bit, переклад: шматочок) — мінімальна одиниця кількості інформації, яка дорівнює одному двійковому розряду, який може бути рівним одному з двох значень/станів (0 або 1), застосовуваних для представлення даних у двійковій системі числення. Англійською двійковий знак звучить як binary digit. Скорочено виходить bit (біт).

Число бітів пам'яті ЕОМ визначається максимальною кількістю двійкових цифр, які в ній вміщуються. Число бітів даних — це кількість двійкових розрядів, в яких вони записані.

8 бітів дорівнюють одному байту.

Байт (англ. byte) — одиниця виміру обсягу даних. Найменша адресована одиниця пам'яті ЕОМ. Містить 8 бітів.

Детально Unicode розглядати я буду, тема не про це, але в декількох словах відмічу. На нашій планеті досить багато мов, кожна мова має свої писькові значки; зрозуміло в американців свої, в арабів свої, в японців, etc... і щоб комп'ютерний цифровий світ однозначно розумів кожен знак людської мови Unicode вирішили їх закодити в 16 системі кодування.

Переглянути всі значки можете на сайті Unicode-table.com

кодування Unicode

Тобто маємо кожен знак це 16 біт чи 2 Байта!!!

3. Методика розрахунку

Порахувати об'єм даних можна слідуючим чином.


1. Припустимо, що для індексів таблиці необхідно 10 максимум знаків,
2. припустимо для Прізвища необхідно максимум 50 знаків,
3. ... для номеру 5 знаків,
4. ... термін 10 знаків

На один знак в нас витрачається 16 біт (2 байта), тоді...



таблиця розрахунків

4. Заключення

Тобто для зберігання даних згідно зразка необхідно 1 500 000 Байт.

P.S. 1 500 000 Байт не звучить, хочеться перевести в Мб, але 1 500 000 Байт це не 1,5 Мб.

Пригадаємо шкільну інформатику:

Кількість байтів:
1 кілобайт (кб) = 2 10 байт = 1024, а не 1000 байт.
1 мегабайт (Мб) = 2 20 байт = 1048576 байт = 1024 кілобайт, а не 1000.000 байт.
1 гігабайт (Гб) = 2 30 байт,
1 террабайт (Тб) = 2 40 байт і т.д.



- А де ще можна побачити об'єм таблиці Бази Даних?

Досить часто в роботі з Базами Даних застосовують застосунок PhpMyAdmin

PhpMyAdmin

Одна із інформаційних граф по таблицям Баз Даних вказує обєм даних таблиці, на зразок:

таблиця розрахунків