![]() ![]() ![]() ![]() |
|||||
|
|||||
樓主 迷路 ![]()
![]() ![]() |
但是四種資料中有八成的欄位是對應的 目前統整資料分析只需要將四張表分別找到的值做加總即可 請問我應該將資料整合在一張資料表上用一個數值欄位來分辨 還是應該將資料分成四張獨立的資料表? |
1樓
不錯的參考
小魚 ![]() |
都可以吧,
資料量不多的話我會都放同一個表, 不過還是要看實際狀況。
本篇文章回覆於2018-05-29 19:50
== 簽名檔 ==
--未登入的會員無法查看對方簽名檔-- |
2樓
不錯的參考
浩瀚星空 ![]() ![]() |
一般我會將八成的欄位另做一個當主表。
其它數值表就用id連接join的方式。 但如果欄位量不大的。合成一個表也是可以的。
本篇文章回覆於2018-06-05 11:21
== 簽名檔 ==
--未登入的會員無法查看對方簽名檔-- |
3樓
作者回應
迷路 ![]() ![]() |
我印象中之前有看過一個說法是
如果兩張資料表只有極少數欄位不同,應該要整合為一張資料表,將不同欄位設為附表用JOIN的方式取得 但是如果資料量很大,例如我有四張表,每張各100萬筆資料 整合成一張就會有400萬筆資料,就算判別用欄位有加index索引 搜尋400萬筆資料的時間會不會比搜尋100萬筆資料的時間多很多,超過1秒以上?
本篇文章回覆於2018-06-06 09:29
== 簽名檔 ==
--未登入的會員無法查看對方簽名檔-- |
4樓 |
我是有點不太理解為何會有400萬筆資料的計算方式??
雖然各4張表各100萬筆。但就如我所說的,他們4張表其實都是附屬在100萬筆的資料上。 理論上來說,最多就100萬筆的搜尋情況再join過來就好了。 為何會有400萬筆的說法??
本篇文章回覆於2018-06-07 09:26
== 簽名檔 ==
--未登入的會員無法查看對方簽名檔-- |
5樓
作者回應
迷路 ![]() ![]() |
我的意思是
總共有四百萬筆資料,四種不同產生方式的資料各一百萬筆 如果四張表獨立,那就是每張表各一百萬 但是如果整合成一張主表和四張附表,那主表就會有四百萬筆資料
本篇文章回覆於2018-06-07 15:21
== 簽名檔 ==
--未登入的會員無法查看對方簽名檔-- |
6樓
最有價值解答
浩瀚星空 ![]() ![]() |
我先了解一下你的問題。
你上面說「但是四種資料中有八成的欄位是對應的」 其一樣欄位的資料是指,雖然欄位是一樣。各都是各自不同的資料。 所以合併起來會有400萬筆這樣的意思嗎?? 一般來說,的確如果是這樣的話。那倒是不要硬要合併會比較好。 我一直以為你4張表的主資料是有八成相同的。 雖然4張表400萬筆。 但實際的主資料可能約是在100~200萬筆的記錄。 這樣是一定要合併反而比較好。 但如果主資料也是各自為政的話。那就當然是不要合併了。
本篇文章回覆於2018-06-07 16:45
== 簽名檔 ==
--未登入的會員無法查看對方簽名檔-- |
7樓
作者回應
迷路 ![]() ![]() |
是的,只有欄位相同,裡面存的值是不同的
本篇文章回覆於2018-06-12 09:09
== 簽名檔 ==
--未登入的會員無法查看對方簽名檔-- |
回覆 |
如要回應,請先登入. |