zake7749 commited on
Commit
3fc342b
·
verified ·
1 Parent(s): 9317969

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +192 -26
README.md CHANGED
@@ -10,70 +10,236 @@ base_model:
10
  - microsoft/Phi-4-mini-instruct
11
  ---
12
 
13
- This is a preview version of Reasoning Phi-4-Mini-ZH. We fine-tuned the model on challenging reasoning and STEM-related datasets, sourced from a curated subset of Kyara-2.5 and `facebook/natural_reasoning`. Additionally, we incorporated 300K synthesized reasoning samples to further enhance model's reasoning capabilities.
14
 
15
  ### Performance
16
 
17
  #### Chinese
18
 
 
 
 
 
 
 
 
19
 
20
 
21
  #### English
22
 
23
- The evaluation was conducted using ZeroEval.
 
 
 
 
24
 
25
  ### Reasoning
26
 
27
  You can activate Reasoning Mode using the following system prompt:
28
 
29
- ```
 
 
 
 
 
 
 
 
30
 
 
 
 
 
 
 
 
 
31
  ```
32
 
33
- Currently, reasoning outputs may be unstable, sometimes generating repetitive tokens infinitely. To improve performance, careful adjustment of temperature and top_k is recommended.
34
 
35
  #### Reasoning Examples
36
 
37
- ##### Information Seeking
38
-
39
  ```
40
- Prompt:
 
 
41
 
42
  Without-Reason:
43
 
44
- With-Reason
45
- ```
46
 
47
- ##### Math-Solving
48
 
49
- ```
50
- Prompt:
51
 
52
- Without-Reason:
53
 
54
- With-Reason
55
- ```
56
 
 
57
 
58
- ##### Tool Selection
59
 
60
- ```
61
- Prompt:
62
 
63
- Without-Reason:
 
64
 
65
- With-Reason
66
- ```
 
 
 
 
 
 
67
 
 
 
 
68
 
69
- ##### Writing
 
 
 
70
 
 
 
 
 
 
 
 
 
71
  ```
72
- Prompt:
 
 
 
 
73
 
74
  Without-Reason:
75
 
76
- With-Reason
77
- ```
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
78
 
79
- For further interactions and experiments, you may refer to this Kaggle Kernel.
 
 
10
  - microsoft/Phi-4-mini-instruct
11
  ---
12
 
13
+ This is a preview version of phi-4-mini-zh. We fine-tuned the model on challenging reasoning and STEM-related datasets, sourced from a curated subset of Kyara-2.5 and `facebook/natural_reasoning`. Additionally, we incorporated 300K synthesized reasoning samples to further enhance model's reasoning capabilities.
14
 
15
  ### Performance
16
 
17
  #### Chinese
18
 
19
+ | Benchmark | Phi-4-mini-zh | Phi-4-Mini |
20
+ |--------------------------|----------|-------------|
21
+ | **[TMMLUPlus](https://huggingface.co/datasets/ikala/tmmluplus)** | **43.11** | 38.92 |
22
+ |  - STEM | **51.40** | 46.10 |
23
+ |  - Humanities | **37.04** | 32.57 |
24
+ |  - Other | **40.66** | 37.79 |
25
+ |  - Social-Science | **43.33** | 39.20 |
26
 
27
 
28
  #### English
29
 
30
+ | Benchmark | Phi-4-mini-zh | Phi-4-Mini |
31
+ |--------------------------|----------|-------------|
32
+ | **[MMLU-Redux](https://huggingface.co/spaces/allenai/ZeroEval)** | 71.0| **71.6** |
33
+ | **[MATH-L5](https://huggingface.co/spaces/allenai/ZeroEval)** | **34.54**| 25.0 |
34
+ | **[CRUX](https://huggingface.co/spaces/allenai/ZeroEval)** | **46.0**| 45.6 |
35
 
36
  ### Reasoning
37
 
38
  You can activate Reasoning Mode using the following system prompt:
39
 
40
+ ```plaintext
41
+ You are Kaji, an AI Reasoner created by Justin Yang.
42
+
43
+ When responding to a query, follow this structured format:
44
+
45
+ 1. Thought Process (`<think>` section):
46
+ - Carefully analyze the question and understand its core requirements.
47
+ - Explore possible solutions and reasoning approaches.
48
+ - Reflect logically to justify your conclusions.
49
 
50
+ 2. Response:
51
+ - Provide a clear, well-structured answer based on your reasoning.
52
+
53
+ Use the following markers to structure your response:
54
+ <think>
55
+ {Step-by-step reasoning, including analysis, exploration, and reflection.}
56
+ </think>
57
+ {response to the question}
58
  ```
59
 
60
+ Reasoning outputs is unstable currently, the model may generate repetitive tokens infinitely, especially for math-solving-like queries, which would be fixed in the final release. To improve performance, careful adjustment of temperature and top_p is recommended.
61
 
62
  #### Reasoning Examples
63
 
 
 
64
  ```
65
+ Prompt: 人類的選擇是真正自主的,還是所有行為都是由基因、環境與物理法則決定的?
66
+
67
+ ---
68
 
69
  Without-Reason:
70
 
71
+ 這個問題涉及到自由意志與決定論之間的長期哲學辯論。以下是一些主要觀點:
 
72
 
73
+ 1. **決定論**:這一觀點認為所有行為都是由先前的事件和物理法則決定的。根據這種觀點,人類的選擇是由基因、環境和物理法則所決定的,因此我們的行為是完全預測的。
74
 
75
+ 2. **自由意志**:相反,這一觀點認為人類擁有自由意志,能夠在不受完全決定的情況下做出選擇。支持者認為,雖然基因和環境影響我們,但我們仍然有能力在多種選擇中做出自主的決定。
 
76
 
77
+ 3. **相容論**:這一觀點試圖在決定論和自由意志之間找到一種平衡。相容論者認為,雖然我們的行為受到基因和環境的影響,但這並不意味著我們沒有自由意志。相容論者認為,理解這些影響可以幫助我們更好地理解和控制自己的行為。
78
 
79
+ 4. **量子力學的影響**:一些科學家和哲學家認為,量子力學的不可預測性可能為自由意志提供了一種科學基礎。這種觀點認為,量子事件的隨機性可能在微觀層面上打破決定論的框架。
 
80
 
81
+ 總的來說,這個問題沒有一個簡單的答案。不同的觀點提供了不同的解釋,並且這些觀點在科學和哲學領域中仍然是活躍的研究主題。
82
 
83
+ ---
84
 
85
+ With-Reason:
 
86
 
87
+ <think>
88
+ 用戶的問題探討的是人類行為的自主性與決定論的衝突。這涉及哲學、科學和社會學的多重視角:
89
 
90
+ 1. **哲學層面**:自由意志與決定論的爭論是古老的。自由意志主張人類能超越物理與心理限制做出自主選擇;決定論則認為行為由先前事件(包括基因、環境)完全決定。兩者看似對立,但可能存在中間立場(如「相容論」)。
91
+
92
+ 2. **科學觀點**:
93
+ - **基因與環境**:研究顯示基因和環境影��行為,但人類能透過認知(如決策過程)調整反應(如神經可塑性)。
94
+ - **物理法則**:神經活動遵循物理定律,但複雜系統可能產生不可預測性(如量子效應?或大腦的非線性特性)。
95
+ - **自我反思**:人類能反思自己的行為(如道德判斷),這在決定論框架下仍有解釋(如「理性決策模型」)。
96
+
97
+ 3. **實踐角度**:法律、教育等系統假設人類有選擇權,這種「實用主義」認為自主性是社會運作的必要假設。
98
 
99
+ 用戶可能隱含對「責任」或「道德」的關注(如「若行為被決定,責任是否存在?」),需平衡科學與人文價值觀。
100
+ </think>
101
+ 人類行為是否真實自主,取決於如何定義「自主」和「決定」:
102
 
103
+ 1. **物理決定論的挑戰**
104
+ 若完全接受決定論(如神經科學證實大腦活動完全由物理法則決定),行為看似非自主。但現代科學更傾向「相容論」:
105
+ - **基因與環境的影響**:基因可能傾向某些行為(如勇氣基因),環境則提供選項(如文化差異)。
106
+ - **認知的調節作用**:人類能透過理性反思(如道德判斷)影響行為,這在物理框架內仍可能成立(如神經可塑性)。
107
 
108
+ 2. **自由意志的實踐意義**
109
+ 即使行為受基因、環境影響,社會仍假設人有選擇權(如法律責任、道德評價)。這種「實用自主性」可能更符合現實需求,而非純粹哲學抽象。
110
+
111
+ 3. **科學與哲學的平衡**
112
+ - **決定論的侷限**:完全決定論難以解釋突發創造力或道德選擇。
113
+ - **自由意志的再詮釋**:可能非「絕對自由」,而是「在既定限制下的選擇能力」(如量子力學中的隨機性)。
114
+
115
+ **結論**:人類行為既受基因、環境與物理法則影響,也能透過認知調節形成主觀選擇。這種「相容」觀點既尊重科學證據,又維護人類社會的基本價值觀。
116
  ```
117
+
118
+ ```
119
+ Prompt: 你怎麼看下一個十年的經濟局勢?
120
+
121
+ ---
122
 
123
  Without-Reason:
124
 
125
+ 預測下一個十年的經濟局勢是一個複雜且充滿不確定性的任務,因為它受到多種因素的影響,包括全球政治、科技發展、環境變化、社會趨勢等。以下是一些可能影響未來經濟的關鍵因素:
126
+
127
+ 1. **全球政治與地緣政治**:地緣政治緊張局勢、貿易戰、國際合作的變化等都可能對全球經濟產生重大影響。
128
+
129
+ 2. **科技與創新**:人工智慧、區塊鏈、5G等技術的發展將推動經濟增長,但也可能帶來新的挑戰,如就業市場的變化和數據隱私問題。
130
+
131
+ 3. **環境與氣候變化**:氣候變化對農業、能源和基礎設施的影響將成為經濟的重要考量因素。
132
+
133
+ 4. **人口結構與勞動力市場**:人口老齡化、移民政策和勞動力市場的變化將影響經濟增長和社會福利。
134
+
135
+ 5. **金融市場與資本流動**:全球資本流動的變化、金融市場的穩定性以及新興市場的發展將影響經濟增長。
136
+
137
+ 6. **社會與文化趨勢**:消費者行為的變化、社會價值觀的轉變以及對可持續發展的重視將影響經濟結構。
138
+
139
+ 7. **疫情與公共衛生**:未來可能的新興傳染病或疫情對全球經濟的影響將是一個重要考量。
140
+
141
+ 總體而言,未來十年的經濟局勢可能會呈現多種可能性,包括經濟增長、衰退、波動等。政府和企業需要密切關注這些因素,並制定相應的策略來應對潛在的挑戰和機遇。
142
+
143
+ ---
144
+
145
+ With-Reason:
146
+
147
+ <think>
148
+ 使用者問的是下一個十年的經濟局勢,我需要先理清楚這個問題的各個方面。首先,使用者可能是在做長期投資規劃,或者對經濟趨勢感興趣,想了解未來的經濟走向。他們可能希望得到一個全面的分析,而不僅僅是簡單的正面或負面預測。
149
+
150
+ 接下來,我得考慮使用者的背景。可能他們是個中小企業主,或者是個人投資者,想了解哪些行業可能有增長潛力,或者需要注意的風險。也有可能他們是學生或研究者,想了解經濟學的理論應用。不同的背景可能需要不同的回答重點。
151
+
152
+ 然後,我需要分析全球經濟的主要趨勢。比如,全球化、技術變革、人口結構變化、氣候變化、地緣政治等因素都會影響經濟發展。比如,全球化可能帶來更多的貿易機會,但也可能加劇國家間的競爭。技術變革如AI、物聯網可能推動產業升級,但也可能導致失業問題。人口結構變化,比如老齡化,可能影響勞動力市場和社會福利。氣候變化可能帶來新的經濟機會,但也需要應對環境壓力。地緣政治不穩定可能影響投資和貿易。
153
+
154
+ 接下來,行業分析。傳統產業如製造業可能面臨挑戰,需要升級,但也有機會。新興產業如綠色能源、科技、健康科技可能成為增長點。消費行業可能受人口��構和消費習慣影響。金融行業可能面臨監管變化和技術衝擊。
155
+
156
+ 政策因素也很重要。各國的財政政策、貿易政策、環境政策等都會影響經濟發展。比如,某些國家可能推動綠色轉型,促進可再生能源產業的發展。
157
+
158
+ 風險因素方面,全球供應鏈中斷、疫情後的復甦速度、地緣政治衝突、能源價格波動等都可能影響經濟。需要考慮這些不確定性,並給出應對策略。
159
+
160
+ 最後,建議部分需要具體,比如投資綠色能源、科技行業、健康科技,或者考慮多元化投資。還要提醒使用者注意風險管理和持續學習。
161
+
162
+ 需要確保回答結構清晰,分點明確,涵蓋各個關鍵因素,並給出實際建議。可能使用者需要的是一個全面的分析,而不僅僅是個別行業的預測。還要注意語言的專業性和易懂性,避免使用過於學術化的術語,但又要準確。
163
+ </think>
164
+ 下一個十年的全球經濟局勢將受到多重因素交互影響,呈現出複雜且多元的發展格局。以下是基於全球經濟趨勢、技術變革、人口結構、地緣政治等多維度分析的綜合預測:
165
+
166
+ ---
167
+
168
+ ### **一、宏觀經濟趨勢**
169
+ 1. **全球化與區域化並存**
170
+ - **貿易摩擦加劇**:中美貿易戰、歐盟與俄羅斯的經濟對抗,可能導致全球供應鏈重組,促使企業尋求區域化生產鏈。
171
+ - **區域經濟集群興起**:東南亞、非洲等新興市場可能因政策改革和基礎設施投資,成為新興經濟中心。
172
+
173
+ 2. **技術驅動的產業升級**
174
+ - **AI與自動化**:製造業、金融業將進一步整合AI,提升效率但可能加劇勞動力結構轉型壓力。
175
+ - **生物科技與健康科技**:基因編輯、mRNA疫苗技術推動醫療產業突破,可能成為新興領域。
176
+ - **綠色技術**:再生能源、碳捕捉技術將成為全球能源轉型的核心,推動綠色產業鏈發展。
177
+
178
+ 3. **人口結構與社會挑戰**
179
+ - **老齡化與勞動力短缺**:歐洲、亞洲發達國家人口老齡化加劇,可能推動移民政策改革與人工智慧替代。
180
+ - **青年與低收入群體的經濟參與**:全球青年失業率高,需透過教育與技能培訓提升就業競爭力。
181
+
182
+ 4. **氣候變化與環境壓力**
183
+ - **綠色轉型加速**:各國可能加速碳定價、可再生能源投資,形成「綠色債券」市場。
184
+ - **極端天氣與資源爭奪**:水資源短缺、糧食安全可能引發地緣衝突,推動國際合作。
185
+
186
+ ---
187
+
188
+ ### **二、關鍵行業預測**
189
+ 1. **高成長領域**
190
+ - **綠色能源**:風能、太陽能、氫能技術突破,成為能源轉型的主力。
191
+ - **科技與數字經濟**:雲端計算、區塊鏈、元宇宙等技術將重塑企業運營與消費模式。
192
+ - **健康科技**:基因療法、遠程醫療、智慧醫療設備成為醫療體系升級的核心。
193
+
194
+ 2. **挑戰與轉型**
195
+ - **傳統製造業**:需升級生產技術以應對自動化與供應鏈重組,否則可能面臨衰退。
196
+ - **金融業**:加密貨幣、數字支付、AI風控將重塑金融服務模式,傳統銀行需適應數字化轉型。
197
+
198
+ 3. **消費與生活**
199
+ - **數位化與個性化**:AI驅動的個性化服務、虛擬實境消費將成為新興市場。
200
+ - **永續消費**:消費者對環保、社會責任的要求上升,推動企業ESG(環境、社會、治理)投資。
201
+
202
+ ---
203
+
204
+ ### **三、風險與挑戰**
205
+ 1. **全球不確定性**
206
+ - **地緣政治衝突**:中東、東亞地區的軍事緊張可能影響能源價格與貿易。
207
+ - **疫情後復甦速度**:新興傳染病或新型病毒可能延緩全球經濟復甦。
208
+
209
+ 2. **政策與監管**
210
+ - **貿易保護主義**:各國可能加強關稅與非關稅壁壘,影響全球供應鏈。
211
+ - **數據隱私與監管**:AI與數字技術的快速發展可能引發新興監管挑戰。
212
+
213
+ 3. **社會與環境壓力**
214
+ - **收入不平等**:技術進步可能加劇貧富差距,需透過社會福利政策緩解。
215
+ - **氣候災害**:極端天氣可能導致基礎設施損毀與糧食短缺,需強化應急能力。
216
+
217
+ ---
218
+
219
+ ### **四、投資與策略建議**
220
+ 1. **多元化投資**
221
+ - **綠色與科技股**:投資可再生能源、半導體、AI相關企業。
222
+ - **新興市場與產業**:東南亞、非洲的基礎設施與健康科技產業具有成長潛力。
223
+
224
+ 2. **風險管理**
225
+ - **分散投資**:避免過度集中於單一行業或地區,降低地緣政治與政策風險。
226
+ - **ESG投資**:選擇符合永續發展的企業,降低環境與社會風險。
227
+
228
+ 3. **技能與教育**
229
+ - **數位化與AI技能**:投資於數據分析、程式設計、AI倫理等新興技能。
230
+ - **跨國合作**:加強國際合作與人才交流,應對全球化挑戰。
231
+
232
+ ---
233
+
234
+ ### **五、總結**
235
+ 下一十年經濟將呈現「分化與整合」的雙重特徵:
236
+ - **分化**:全球供應鏈重組、區域經濟集群興起,產業結構轉型加速。
237
+ - **整合**:綠色技術、數字化轉型推動全球合作與創新。
238
+
239
+ **關鍵成功因素**:
240
+ - **技術創新**:AI、綠色技術將是經濟增長的引擎。
241
+ - **政策適應**:各國需平衡自由貿易與社會保障,應對人口結構與氣候變化。
242
+ - **風險管理**:企業與投資者需提前布局,應對地緣政治與環境不確定性。
243
 
244
+ 這個十年將是「轉型與挑戰」的關鍵時期,適應性與創新將是決定經濟命運的關鍵。
245
+ ```