最近,我尝试了John Crickett的编码挑战,并决定分享我的经验。第一个挑战是使用PHP重写经典的Unixwc(单词计数器)。虽然我自1997年以来就一直使用Linux,但wc并非我常用的工具,因此我决定深入研究一下。
我最初的想法是用文本编辑器直接编写代码,使用Vim在SSH连接下,平板作为终端,甚至不使用键盘。我选择了PHP作为我的开发语言,认为这应该很简单。结果证明,这是一个糟糕的主意,代码混乱不堪,我将其保留在GitHub仓库中作为警示。
在添加蓝牙键盘并将Vim配置成更像IDE之后,我进行了第二次尝试。这次,我的目标是:
- 面向对象编程
- 测试驱动开发
- 支持任意大的文件
- 尽可能模拟coreutils wc的行为
- 具有良好的性能
以下是我的主要收获:
立即学习“”;
挑战与解决方案:
-
多字节字符支持: 一个成熟的Unix工具理应支持多字节字符。PHP的mb_str解决了这个问题。
-
大文件支持: wc可能需要处理超过系统内存的文件。我需要分块读取文件,避免使用file_get_contents。 处理跨越块边界的单词也需要特殊考虑。
-
标准输入: 程序需要能够从标准输入(管道和重定向)读取数据。这需要使用流处理。
开发环境的重要性:
我放弃了平时使用的PHPStorm,转而使用一个简单的文本编辑器。这让我意识到IDE提供的自动化功能以及我对此的依赖程度。我尤其怀念代码补全和重构工具。
缺乏重构工具显著增加了我的认知负担,使编程过程变得笨拙。我不得不记住PHP内置函数的参数顺序以及自己代码的结构。这降低了我的开发速度。
我发现缺乏重构工具阻碍了迭代开发。进行代码结构调整变得非常费力,我经常选择保留最初的错误设计,而不是进行修改。
建议:
- 使用IDE或功能强大的编辑器,至少具备代码补全和代码导航功能。
- 自动化测试至关重要。黑盒测试可以验证程序行为,允许进行无风险的重构。
在第二次尝试中,我进行了大量的测试驱动开发,这极大地提高了我的开发速度和信心。
代码示例:
我最初的count方法:
if ($countmode === countmode::character) { return strlen($contents); } // ... other cases ...
改进后的count方法,使用匹配表达式:
return match($countMode) { CountMode::CHARACTER => strlen($contents), CountMode::MB_CHARACTER => mb_strlen($contents), CountMode::LINE => count(preg_split('( | | )', $contents)) - 1, CountMode::WORD => static::countWords($contents) };
其他收获:
- 生成器函数非常强大且易于使用。
- 页面大小对文件加载性能至关重要。
- 枚举类型非常有用。
- 箭头函数无法修改其父中的标量变量。
总而言之,这是一个很有挑战性的经历,让我学到了很多东西。我的完整解决方案已上传至GitHub。
以上就是我在php中建造了`wc’的详细内容,更多请关注php中文网其它相关文章!