字體:小 中 大 | |
|
|
2021/05/10 17:45:07瀏覽117|回應0|推薦0 | |
那些年,被數據霸淩的年輕人
科研機構為了向政府機關拿到續命的研發經費,每年往往被迫杜撰出許多不存在的需求,或者天馬行空的亮點,卻總在交差時被罵得狗血淋頭,狼狽不堪,最終灰頭土臉,草草結案。各部門所承諾的KPI就像是被套上的枷鎖,每年年終被狠狠地戴著它羞辱遊街之後,仍搖尾乞憐地跪求小氣財神明年開恩。
年復一年,機構累積了上千個無人問津的垃圾專利,最後居然要開會討論如何以打包的方式,把專利給埋葬掉,祈禱著不再過著穿國王新衣,當數字奴隸和KPI俘虜的日子。
但形勢永遠比人強,在每個夜深人靜的痛哭失聲之後,當太陽再度升起,大夥又不得不用美麗的數據,來包裝長官交辦的不可能任務了。問題是,早已千瘡百孔的團隊,還辦得到嗎?
D部門空有大數據分析能力卻找不到用武之地,而E部門空有應用場域,卻苦無數據分析支持。兩部門各自揹負老闆的空前壓力,在無數次腦力激盪之後,腦震盪之前,終於共同提出一項專案,希望能說服各中小學校購買這套「霸淩監控系統」,一舉拿下科專亮點。
D部門認為,我們衹要能夠收集到學生的健康資料,學生的成績,以及學生的出席狀況,就有辦法偵測出哪位學生有被霸淩的可能。他們的理論是,如果有學生被霸淩了,那麼成績一定會退步,出席情形以及身體狀況都會變得比較差,這時根據收集的大數據加以分析,就可以對導師預警。而一旦老師們開始解決霸淩問題,這三項數據就會開始轉好。
為了要說服各校長們買單,兩部門開始收集真實資料。但是很不幸的,霸淩的事件沒有找到,找到的數據也多與霸淩沾不上邊。為了要達成KPI,只好開始修改甚至於創造數據,只差沒有創造霸淩,讓真實的霸淩事件恰好和數據吻合。
產品原型和虛擬數據很快地就開發完成,他們迫不及待的邀請各校校長蒞臨指導。在座的校長們在看完過了完美無瑕的展示後,紛紛提出實際發生的問題:
「學生被霸淩之後,成績不一定會退步,也有反而會奮發向上。」
「被霸淩的同學也許會更早來學校或更晚離開,身體也可能會被鍛煉得越來越健康。」
「成績不好可能是因為失戀,身體變差可能衹是單純的得到了流行性感冒。」
「以你們工程師的經驗,這些數據可以拿來作為霸淩的推論嗎?」
象牙塔裡的工程師們經過了一連串真實世界的質疑,研發負責人的回答就不是這麼信心滿滿了。
跨部門合作第一年沒有達標,霸淩偵測系統一套也沒賣出去。但是工程師們並不氣餒,彼此勉勵繼續奮戰,不但持續設法收集資料,第二年要開發更好的演算法。
一年容易,又到了邀請校長們見真章的時刻。這回工程師們信心滿滿,放棄了自行開發的演算法,而採用了機器學習的方式。也就是說讓學校自行標註哪些事件是霸淩,然後根據這些被標註的事件,讓機器自動去比對類似的資料,認定其他那些事件也都是霸淩。沒有主觀的判斷,這樣應該就會更準確了。
「剛開始被標註的資料比較少,所以比較不準,」工程師們向校長解釋:「一旦我們收集了夠多標註過的資料。霸淩的預測就會越來越準了。」
「請問要多少筆資料你們才會預測精準呢,」校長們問。
「至少要上百筆霸淩吧,」工程師們答。
「可是全國中小學每年處理霸淩的事件不到800筆,確認的也祇有200筆。如果真要從我們學校得到100筆確認的資料,」校長甲停頓了一下:「你們可以等到20年之後才拿亮點嗎?」
在一片沉默聲中,平日沉默寡言的校長乙緩緩說道:「學校的資料不好收集,也許換個方向,收集你們自己被長官霸淩的數據,一年之內就可以拿到亮點的了!」
(內容虛構,如有雷同,純屬巧合)
|
|
( 創作|小說 ) |