paint-brush
ኣውትላይር ምፍላጥ፡ ክትፈልጦ ዘለካ@nataliaogneva
54,605 ንባባት
54,605 ንባባት

ኣውትላይር ምፍላጥ፡ ክትፈልጦ ዘለካ

Natalia Ogneva4m2024/04/23
Read on Terminal Reader
Read this story w/o Javascript

ኣዝዩ ነዊሕ፤ ንምንባብ

ተንተንቲ መብዛሕትኡ ግዜ ኣብ እዋን ስርሖም ኣብ ዳታ ኣውትላይርስ የጋጥሞም። ውሳነታት መብዛሕትኡ ግዜ ኣብቲ ናሙና ማእከላይ ደረጃ ዝተመርኮሰ ኮይኑ፡ እዚ ድማ ንኣውትላይርስ ኣዝዩ ተሃዋሲ እዩ። ቅኑዕ ውሳነ ንምሃብ ኣውትላይርስ ምምሕዳር ወሳኒ እዩ። ብዘይተለምደ ክብርታት ንምስራሕ ሓያሎ ቀለልትን ቅልጡፋትን ኣገባባት ንርአ።

Companies Mentioned

Mention Thumbnail
Mention Thumbnail
featured image - ኣውትላይር ምፍላጥ፡ ክትፈልጦ ዘለካ
Natalia Ogneva HackerNoon profile picture

ተንተንቲ መብዛሕትኡ ግዜ ኣብ እዋን ስርሖም ኣብ ዳታ ኣውትላይርስ የጋጥሞም፣ ከም ኣብ እዋን ትንተና ኤቢ-ፈተና፣ ትንበያዊ ሞዴላት ኣብ ምፍጣር ወይ ድማ ዝንባለታት ምክትታል። ውሳነታት መብዛሕትኡ ግዜ ኣብቲ ናሙና ማእከላይ ደረጃ ዝተመርኮሰ ኮይኑ፡ እዚ ድማ ንኣውትላይርስ ኣዝዩ ተሃዋሲ ኮይኑ፡ ነቲ ዋጋ ብዓቢኡ ክቕይሮ ይኽእል። ስለዚ፡ ቅኑዕ ውሳነ ንምሃብ፡ ኣውትላይርስ ምምሕዳር ወሳኒ እዩ።


ብዘይተለምደ ክብርታት ንምስራሕ ሓያሎ ቀለልትን ቅልጡፋትን ኣገባባት ንርአ።

ምሕንጻጽ ጸገም

ማእከላይ ዋጋ ትእዛዝ ከም ቀዳማይ ሜትሪክ ተጠቒምካ ናይ ፈተነ ትንተና ከተካይድ ከምዘለካ እሞ ሕሰብ። መብዛሕትኡ ግዜ ሜትሪክና ንቡር ዝርገሐ ኣለዎ ንበል። ከምኡ እውን ኣብቲ ናይ ፈተነ ጉጅለ ዘሎ ሜትሪክ ዝርገሐ ካብቲ ኣብቲ ቁፅፅር ዘሎ ዝተፈለየ ምዃኑ ንፈልጥ ኢና። ብኻልእ ኣዘራርባ ኣብ ቁፅፅር ዘሎ ማእኸላይ ምክፍፋል 10፣ ኣብቲ ፈተና ድማ 12. ኣብ ክልቲኡ ጉጅለታት ዘሎ መደበኛ ምዝንባል 3 እዩ።


ይኹን እምበር ክልቲኦም ናሙናታት ነቲ ናሙና ማእኸላይን ንናይ ናሙና ስታንዳርድ ዲቪዥንን ዝጥምዝዙ ኣውትላይር ኣለዎም።

 import numpy as np N = 1000 mean_1 = 10 std_1 = 3 mean_2 = 12 std_2 = 3 x1 = np.concatenate((np.random.normal(mean_1, std_1, N), 10 * np.random.random_sample(50) + 20)) x2 = np.concatenate((np.random.normal(mean_2, std_2, N), 4 * np.random.random_sample(50) + 1))

NB ንሜትሪክ ኣብ ግምት ብምእታው ካብ ክልቲኡ ወገን ኣውትላይርስ ክህልዎ ይኽእል እዩ። ሜትሪክካ ካብ ሓደ ወገን ጥራይ ኣውትላይር ክህልዎ እንተዝኽእል፡ ንዕኡ ዝኸውን ሜላታት ብቐሊሉ ክቕየሩ ይኽእሉ ነይሮም።

ጭራታት ምቑራጽ

እቲ ዝቐለለ ኣገባብ ቅድሚ 5% ፐርሰንታይልን ድሕሪ 95% ፐርሰንታይልን ኩሉ ትዕዝብቲ ምቑራጽ እዩ። ኣብዚ ጉዳይ እዚ ከም ኮን 10% ናይቲ ሓበሬታ ስኢንናዮ። ይኹን እምበር እቶም ምክፍፋላት ዝያዳ ዝተፈጥሩ ይመስሉ፣ እቶም ናሙና ሞመንታት ድማ ናብቶም ናይ ምክፍፋል ሞመንታት ዝቐረቡ እዮም።

 import numpy as np x1_5pct = np.percentile(x1, 5) x1_95pct = np.percentile(x1, 95) x1_cutted = [i for i in x1 if i > x1_5pct and i < x1_95pct] x2_5pct = np.percentile(x2, 5) x2_95pct = np.percentile(x2, 95) x2_cutted = [i for i in x2 if i > x2_5pct and i < x2_95pct]


ካልእ መንገዲ ድማ ካብቲ ፍሉይ ደረጃ ወጻኢ ዝግበር ትዕዝብቲ ምግላል ’ ዩ። እቲ ትሑት ባንድ ማዕረ 25% ፐርሰንታይል ኣጉዲልካ ሓደ ፍርቂ ናይቲ ኢንተርኳርታይል ደረጃ ክኸውን ከሎ፡ እቲ ልዑል ባንድ ድማ ማዕረ 75% ፐርሰንታይል ተወሲኹ ሓደ ፍርቂ ይኸውን። ኣብዚ፡ 0.7% ሓበሬታ ጥራይ ኢና ክንስእን። እቶም ምክፍፋላት ካብቲ ናይ መጀመርታ ዝያዳ ዝተቐረጹ ይመስሉ። እቶም ናሙና ሞመንታት ምስቶም ናይ ምክፍፋል ሞመንት ዝያዳ ማዕረ እዮም።

 import numpy as np low_band_1 = np.percentile(x1, 25) - 1.5 * np.std(x1) high_band_1 = np.percentile(x1, 75) + 1.5 * np.std(x1) x1_cutted = [i for i in x1 if i > low_band_1 and i < high_band_1] low_band_2 = np.percentile(x2, 25) - 1.5 * np.std(x2) high_band_2 = np.percentile(x2, 75) + 1.5 * np.std(x2) x2_cutted = [i for i in x2 if i > low_band_2 and i < high_band_2]

ቡትስትራፕ

ኣብዚ ዝሓሰብናዮ ካልኣይ ኣገባብ ቡትስትራፕ እዩ። ኣብዚ ኣገባብ እዚ እቲ ማእከላይ ከም ማእከላይ ደረጃ ንኡሳን ናሙናታት እዩ ዝህነጽ። ኣብዚ ኣብነትና፡ ኣብቲ ቁጽጽር ጉጅለ ዘሎ ማእከላይ ደረጃ ማዕረ 10.35፡ ኣብቲ ናይ ፈተነ ጉጅለ ድማ 11.78 እዩ። ሕጂ እውን ምስ ተወሳኺ መስርሕ ዳታ ክነጻጸር እንከሎ ዝሓሸ ውጽኢት እዩ።

 import pandas as pd def create_bootstrap_samples( sample_list: np.array, sample_size: int, n_samples: int ): # create a list for sample means sample_means = [] # loop n_samples times for i in range(n_samples): # create a bootstrap sample of sample_size with replacement bootstrap_sample = pd.Series(sample_list).sample(n = sample_size, replace = True) # calculate the bootstrap sample mean sample_mean = bootstrap_sample.mean() # add this sample mean to the sample means list sample_means.append(sample_mean) return pd.Series(sample_means) (create_bootstrap_samples(x1, len(x1), 1000).mean(), create_bootstrap_samples(x2, len(x2), 1000).mean())

መደምደምታ

ንኣውትላይር ምፍላጥን ምምስራሕን ቅኑዕ ውሳነ ንምሃብ ኣገዳሲ እዩ። ሕጂ፡ እንተወሓደ ሰለስተ ቅልጡፋትን ቀጥታውያንን ኣገባባት ቅድሚ ትንተና ነቲ ዳታ ንምፍታሽ ክሕግዙኻ ይኽእሉ እዮም።


ይኹን እምበር፡ ዝተረኽቡ ኣውትላይርስ ዘይተለምዱ ክብርታትን ናይቲ ሓድሽነት ውጽኢት ባህርን ክኾኑ ከም ዝኽእሉ ምዝካር ኣገዳሲ እዩ። ግን ካልእ ዛንታ እዩ :)