摘要:作为首席技术官,将面临的最关键的挑战之一是在维护当前运营的同时准备好扩展基础设施。根据《2023年全球首席技术官调查》,技术债务和数字化转型是全球35%的首席技术官面临的最大挑战。这 |
你还没有准备好规模化的早期预警信号
正如组织经常在数字化转型计划中遇到挫折一样(正如GeorgeV.Hulme在对数字孪生实现挑战的分析中概述的那样),扩展准备需要仔细关注警告信号。你的第一个指标通常出现在看似微不足道的不便。注意以下关键指标:
•部署时间从几分钟到几小时不等
•基础设施成本的增长速度超过了你的用户基础
•开发团队花在维护功能上的时间多于构建新功能的时间
•简单的更新需要复杂的解决方案
•增加生产修复程序的数量
•客户对系统性能的投诉不断增加
当您的开发团队开始创建变通方法而不是解决方案时,请特别注意。这通常表明在增加更多重量之前,基础需要加固。
策略性技术债务管理
并非所有的技术债务都是平等的。聪明的首席技术官知道推动增长的债务和阻碍增长的债务之间的区别。把技术债务看作商业贷款——有些投资会得到回报,而有些投资可能会让你破产。
需要关注的关键领域包括:
•身份验证和授权系统——追溯扩展这些系统是痛苦的
•数据模型基础——这里早期的捷径呈指数复合
•API设计和版本控制——这些决定了未来的灵活性
•基础设施自动化——手动流程无法扩展
测量量表准备情况
成功的扩展需要明确的指标和基准。建立这些关键绩效指标:
系统运行状况指标:
•apdex评分(用户满意度)-目标为>.8
•错误率-保持在总请求的0.1%以下
•恢复时间目标(RTO)-定义每个服务层
•服务水平指标(SLIs)—设置特定的阈值
基础设施的效率:
•资源利用率(目标60-80%)
•每笔交易的成本(应随规模而降低)
•调整反应时间(可以多快地增加容量)
•基础设施成本占收入的百分比
飞行中的建筑
现实情况是,大多数首席技术官没有暂停来解决所有问题的奢侈。诀窍在于实现不破坏当前操作的渐进式改进。它的意思是:
•预留20%的sprint产能用于技术债务削减
•优先考虑能够加快未来发展的增强功能
•自动化重复性任务,节省工程时间
•在考虑可扩展性的情况下构建新功能
成功的扩张需要在创新和稳定之间取得平衡。考虑实施:
•逐步推出的功能标志
•用于安全实验的A/B测试基础设施
•自动回滚功能,快速恢复
•每一层的性能监控
•每季度进行产能计划审查
人的因素
也许最容易被忽视的因素是人的因素。您的系统不仅需要由您当前的团队管理,而且需要由您将来的团队管理。在进行扩展时,文档、清晰的编码标准和定义良好的流程变得至关重要。关注:
•在团队之间建立清晰的所有权界限
•建立具有规模意义的编码标准
•将文档构建到开发过程中,而不是作为事后的想法
•建立师徒计划,传播机构知识
•实施不会让团队精疲力竭的随叫随到的轮岗
前进的道路
首先绘制您的技术债务图景。找出那些快速修复会阻碍增长的领域。然后,创建一个平衡当前业务需求和长期技术健康的优先级路线图。
在执行扩展路线图时:
•从能够证明价值的快速成功开始
•通过可见的改进建立动力
•创建反馈循环来衡量影响
•根据指标调整你的方法
与利益相关者就进展和挑战保持清晰的沟通
现实世界的例子证明这种方法是有效的。在最近的一个案例研究中,我们帮助一家美国电信供应商改造了他们的基础设施,同时管理了50,000台连接设备。通过在不中断操作的情况下实施系统改进,他们将开发周期缩短了20%,成本降低了25%,同时将数据延迟从10分钟减少到10秒。这个转换演示了战略性技术债务管理和仔细的计划如何能够在不牺牲稳定性的情况下实现扩展。
人们的目标不是消除所有的技术债务——这是不现实的。人们的目标是战略性地管理它,确保今天的增长不会以明天的稳定为代价。
编辑:Harris