#P2168. [NOI2015] 荷马史诗

    ID: 1151 Type: RemoteJudge 1000ms 125MiB Tried: 0 Accepted: 0 Difficulty: 4 Uploaded By: Tags>贪心2015NOI优先队列哈夫曼树哈夫曼,Huffman

[NOI2015] 荷马史诗

题目背景

追逐影子的人,自己就是影子 —— 荷马

题目描述

Allison 最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》 组成的鸿篇巨制《荷马史诗》实在是太长了,Allison 想通过一种编码方式使得它变得短一些。

一部《荷马史诗》中有 nn 种不同的单词,从 11nn 进行编号。其中第 ii 种单词出现的总次数为 wiw_i。Allison 想要用 kk 进制串 sis_i 来替换第 ii 种单词,使得其满足如下要求:

对于任意的 1i,jn1\leq i, j\leq niji\ne j ,都有:sis_i 不是 sjs_j 的前缀。

现在 Allison 想要知道,如何选择 sis_i,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的 sis_i 的最短长度是多少?

一个字符串被称为 kk 进制字符串,当且仅当它的每个字符是 00k1k-1 之间(包括 00k1k-1 )的整数。

字符串 str1str1 被称为字符串 str2str2 的前缀,当且仅当:存在 1tm1 \leq t\leq m ,使得 str1=str2[1..t]str1 = str2[1..t]。其中,mm 是字符串 str2str2 的长度,str2[1..t]str2[1..t] 表示 str2str2 的前 tt 个字符组成的字符串。

输入格式

输入的第 11 行包含 22 个正整数 n,kn, k ,中间用单个空格隔开,表示共有 nn 种单词,需要使用 kk 进制字符串进行替换。

接下来 nn 行,第 i+1i + 1 行包含 11 个非负整数 wiw_i,表示第 ii 种单词的出现次数。

输出格式

输出包括 22 行。

11 行输出 11 个整数,为《荷马史诗》经过重新编码以后的最短长度。

22 行输出 11 个整数,为保证最短总长度的情况下,最长字符串 sis_i 的最短长度。

4 2
1
1
2
2

12
2
6 3
1
1
3
3
9
9

36
3

提示

【样例解释】

样例 1 解释

X(k)X(k) 表示 XX 是以 kk 进制表示的字符串。

一种最优方案:令 00(2)00(2) 替换第 11 种单词, 01(2)01(2) 替换第 2 种单词, 10(2)10(2) 替换第 33 种单词,11(2)11(2) 替换第 44 种单词。在这种方案下,编码以后的最短长度为:

1×2+1×2+2×2+2×2=121 × 2 + 1 × 2 + 2 × 2 + 2 × 2 = 12

最长字符串 sis_i 的长度为 22

一种非最优方案:令 000(2)000(2) 替换第 11 种单词,001(2)001(2) 替换第 22 种单词,01(2)01(2) 替换第 33 种单词,1(2)1(2) 替换第 44 种单词。在这种方案下,编码以后的最短长度为:

1×3+1×3+2×2+2×1=121 × 3 + 1 × 3 + 2 × 2 + 2 × 1 = 12

最长字符串 sis_i 的长度为 33 。与最优方案相比,文章的长度相同,但是最长字符串的长度更长一些。

样例 2 解释

一种最优方案:令 000(3)000(3) 替换第 11 种单词,001(3)001(3) 替换第 22 种单词,01(3)01(3) 替换第 33 种单词, 02(3)02(3) 替换第 44 种单词, 1(3)1(3) 替换第 5 种单词, 2(3)2(3) 替换第 66 种单词。

【数据规模与约定】

所有测试数据的范围和特点如下表所示(所有数据均满足 0<wi10110 < w_i \leq 10^{11}):

测试点编号 nn 的规模 kk 的规模 备注
11 n=3n=3 k=2k=2
22 n=5n=5
33 n=16n=16 所有 wiw_i 均相等
44 n=1000n=1\,000 wiw_i 在取值范围内均匀随机
55
66 n=100000n=100\,000
77 所有 wiw_i 均相等
88
99 n=7n=7 k=3k=3
1010 n=16n=16 所有 wiw_i 均相等
1111 n=1001n=1\,001
1212 n=99999n=99\,999 k=4k=4
1313 n=100000n=100\,000
1414
1515 n=1000n=1\,000 k=5k=5
1616 n=100000n=100\,000 k=7k=7 wiw_i 在取值范围内均匀随机
1717
1818 k=8k=8 wiw_i 在取值范围内均匀随机
1919 k=9k=9
2020

【提示】

选手请注意使用 64 位整数进行输入输出、存储和计算。

【评分方式】

对于每个测试点:

  • 若输出文件的第 11 行正确,得到该测试点 40%40\% 的分数;
  • 若输出文件完全正确,得到该测试点 100%100\% 的分数。