Triển khai kiểm toán số nhìn từ mô hình kim tự tháp chuyển đổi dữ liệu DIKW

GS. TS. Đoàn Xuân Tiên - TS. Lê Anh Vũ- TS. Vũ Thị Phương Liên Thứ hai, 19/01/2026 10:40 (GMT+7)

Chuyển đổi số đã tạo ra những thay đổi sâu sắc trong các ngành nghề, trong đó kiểm toán là một lĩnh vực chịu ảnh hưởng lớn. Kiểm toán số không chỉ là việc áp dụng các công nghệ tiên tiến như trí tuệ nhân tạo (AI), phân tích dữ liệu lớn (Big Data Analytics), mà còn yêu cầu một khung lý thuyết rõ ràng để tổ chức và khai thác dữ liệu một cách hiệu quả. Mô hình kim tự tháp DIKW (Data – Information – Knowledge - Wisdom: Dữ liệu, Thông tin, Kiến thức, Trí tuệ) cung cấp một phương pháp luận mạnh mẽ, gi

1. Giới thiệu chung về kiểm toán số

Kiểm toán số (Digital auditing) được hiểu là quá trình ứng dụng công nghệ số tiên tiến vào các hoạt động kiểm toán nhằm tăng cường hiệu quả, độ chính xác và khả năng phân tích dữ liệu. Theo Knechel (2020), kiểm toán số không chỉ đơn thuần là việc sử dụng các công cụ công nghệ, mà còn là sự thay đổi trong cách thức tiếp cận kiểm toán, từ việc tập trung vào các thủ tục thủ công sang khai thác Big Data, AI và các nền tảng phân tích hiện đại. Ngoài ra, kiểm toán số còn yêu cầu xây dựng một khung lý thuyết rõ ràng để tổ chức và khai thác dữ liệu hiệu quả, từ đó hỗ trợ các quyết định chiến lược của tổ chức (Appelbaum et al., 2017).

Mặc dù còn một số quan điểm khác nhau về kiểm toán số, song đa phần đều thống nhất rằng kiểm toán số thường xoay quanh ba yếu tố chính là công nghệ, dữ liệu và con người. Về công nghệ, kiểm toán số tận dụng các công nghệ tiên tiến như AI, Blockchain và Big Data Analytics để cải thiện quy trình kiểm toán. Những công nghệ này không chỉ giúp tự động hóa các bước lặp lại mà còn cung cấp thông tin chi tiết từ dữ liệu phức tạp (Alles, 2015). Dữ liệu đóng vai trò trung tâm trong kiểm toán số, việc chuyển đổi dữ liệu từ trạng thái thô sang thông tin, kiến thức và cuối cùng là trí tuệ, như mô hình DIKW, là một trong những yếu tố cốt lõi để kiểm toán số đạt hiệu quả (Rowley, 2007). Mặc dù công nghệ đóng vai trò quan trọng, yếu tố con người vẫn không thể thay thế. Kiểm toán viên cần có kỹ năng phân tích dữ liệu, tư duy phản biện và khả năng sử dụng công nghệ để đưa ra các đánh giá phù hợp (Yoon et al., 2015).

Trong bối cảnh nền kinh tế số toàn cầu đang phát triển mạnh mẽ, các tổ chức và đơn vị phải đối mặt với sự gia tăng đột biến về khối lượng dữ liệu. Thách thức quan trọng đặt ra là làm thế nào để khai thác và chuyển đổi lượng dữ liệu khổng lồ này thành thông tin và tri thức có giá trị, từ đó tạo ra lợi thế cạnh tranh. Kiểm toán, với chức năng kiểm tra và xác minh một cách có hệ thống các báo cáo và hồ sơ tài chính nhằm cung cấp đánh giá độc lập, khách quan về tính trung thực và độ tin cậy của thông tin tài chính, hiện đang trải qua một cuộc cách mạng sâu rộng nhờ sự xuất hiện của các công nghệ tiên tiến như AI và phân tích Big Data. Sự tích hợp của các công nghệ này đã thúc đẩy sự phát triển của kiểm toán số. Các công cụ hỗ trợ bởi AI không chỉ nâng cao khả năng phân tích dữ liệu, mà còn giúp nhận diện các mẫu dữ liệu, phát hiện bất thường và đánh giá rủi ro một cách hiệu quả. Điều này cho phép kiểm toán viên tập trung vào các khu vực có rủi ro cao, thực hiện các phân tích chuyên sâu hơn, đồng thời tự động hóa các nhiệm vụ lặp lại, giúp giám sát liên tục và phát hiện gian lận nhanh chóng, chính xác hơn. Vì vậy, việc nghiên cứu kiểm toán số từ nhiều góc độ khoa học khác nhau là điều cần thiết, nhằm đảm bảo hoạt động này được triển khai một cách hiệu quả, đúng đắn và phù hợp với yêu cầu của thời đại số.

Kiểm toán số là một lĩnh vực đang phát triển mạnh mẽ nhờ sự hỗ trợ của công nghệ hiện đại và khả năng xử lý Big Data. Các mô hình kiểm toán số phổ biến bao gồm kiểm toán dựa trên rủi ro (Risk-based Audit), kiểm toán theo thời gian thực (Real-time Audit), kiểm toán tự động hóa (Automated Audit) và kiểm toán dựa trên AI (AI-driven Audit). Mô hình kiểm toán dựa trên rủi ro tập trung vào việc xác định và đánh giá các rủi ro tiềm ẩn trong hoạt động kinh doanh, từ đó tối ưu hóa nguồn lực kiểm toán (Bell et al., 1997). Kiểm toán theo thời gian thực sử dụng các hệ thống giám sát liên tục để cung cấp thông tin kiểm toán ngay lập tức, giúp phát hiện sai sót hoặc gian lận nhanh chóng (Vasarhelyi & Halper, 1991). Kiểm toán tự động hóa sử dụng các công cụ phần mềm để giảm thiểu sự can thiệp của con người trong các quy trình kiểm toán lặp lại (Brown et al., 2007). Trong khi đó, kiểm toán dựa trên AI tận dụng các thuật toán học máy để phân tích dữ liệu và hỗ trợ ra quyết định (Gepp et al., 2018). Mặc dù, các mô hình này mang lại những lợi ích đáng kể, chúng thường chỉ giải quyết một khía cạnh cụ thể của kiểm toán số, chẳng hạn như tập trung vào quản trị rủi ro hoặc tự động hóa quy trình. Điều này dẫn đến sự thiếu hụt một cách tiếp cận toàn diện trong việc quản lý và khai thác dữ liệu. Do vậy, bài viết này giới thiệu một mô hình có cách tiếp cận toàn diện và mạnh mẽ hơn - mô hình DIKW trong hoạt động kiểm toán số. Khác với các mô hình truyền thống, DIKW (Data - Information - Knowledge - Wisdom) cung cấp một cách tiếp cận toàn diện và hệ thống, từ việc xử lý dữ liệu thô đến việc ra quyết định dựa trên trí tuệ. Mô hình này phân cấp dữ liệu thành bốn cấp độ: dữ liệu, thông tin, kiến thức và trí tuệ, giúp các tổ chức không chỉ phân tích và hiểu dữ liệu mà còn chuyển đổi dữ liệu thành giá trị chiến lược (Rowley, 2007).

Trong bối cảnh chuyển đổi số mạnh mẽ tại Việt Nam, việc áp dụng mô hình DIKW trong kiểm toán số mang lại nhiều lợi ích quan trọng. DIKW giúp cấu trúc hóa dữ liệu, biến dữ liệu thô thành thông tin có ý nghĩa và tri thức hữu ích, từ đó tạo điều kiện ra quyết định chiến lược (Ackoff, 1989). Điều này đặc biệt cần thiết trong bối cảnh các đơn vị/tổ chức tại Việt Nam đang tìm cách tận dụng dữ liệu để cạnh tranh hiệu quả hơn. So với các mô hình phức tạp như kiểm toán dựa trên AI, DIKW yêu cầu ít nguồn lực công nghệ hơn và có thể dễ dàng tích hợp vào các quy trình hiện tại. Điều này phù hợp với các doanh nghiệp tại Việt Nam, nơi mà nguồn lực công nghệ và tài chính còn hạn chế (Zeleny, 1987). Trong bối cảnh kinh tế Việt Nam đang phát triển nhanh chóng, việc ra quyết định dựa trên tri thức và trí tuệ là yếu tố sống còn. DIKW không chỉ hỗ trợ việc phân tích dữ liệu, mà còn giúp các tổ chức xây dựng chiến lược dài hạn dựa trên sự hiểu biết sâu sắc (Bellinger et al., 2004). Bên cạnh đó, Mô hình DIKW dễ dàng tích hợp với các quy định pháp lý và chuẩn mực văn hóa tại Việt Nam, nơi mà việc quản lý dữ liệu và minh bạch trong kiểm toán đang ngày càng được chú trọng (Davenport & Prusak, 1998).

Ứng dụng mô hình DIKW mang lại lợi ích đáng kể như tối ưu hóa quy trình ra quyết định dựa trên hiểu biết sâu sắc, nâng cao hiệu quả hoạt động thông qua nhận diện xu hướng và tăng cường khả năng cạnh tranh bằng cách biến dữ liệu thành tài sản chiến lược. Trong nghiên cứu này, các nghiên cứu đều sử dụng mô hình DIKW để cung cấp một khuôn khổ hữu ích để giúp nhận diện cách dữ liệu được thu thập, xử lý thành thông tin, tích lũy thành kiến thức và cuối cùng được áp dụng để đưa ra trí tuệ trong kiểm toán từ đó giúp chúng ta hiểu sâu hơn về hoạt động kiểm toán số và cách ứng dụng AI hiệu quả trong hoạt động kiểm toán. Các câu hỏi nghiên cứu chính bao gồm: Cách vận dụng mô hình DIKW với tư cách là khuôn khổ lý thuyết để định hướng và đo lường mức độ trưởng thành ứng dụng CNTT và chuyển đổi số trong hoạt động kiểm toán, đặc biệt là trong việc chuyển hóa dữ liệu thô thành thông tin, kiến thức và trí tuệ (thông thái)? Việc áp dụng các công nghệ AI tác động như thế nào đến các bước chuyển hóa dữ liệu trong mô hình DIKW và cải thiện các hoạt động kiểm toán số cụ thể?

2. Mô hình kim tự tháp chuyển đổi dữ liệu DIKW

DIKW (Data – Information – Knowledge – Wisdom) là một khung lý thuyết cốt lõi của quản lý tri thức và khoa học thông tin, mô tả hành trình giá trị đi từ dữ liệu thô đến thông tin có bối cảnh, kiến thức có ngữ nghĩa, và cuối cùng là trí tuệ – khả năng đưa ra quyết định sáng suốt dựa trên nguyên tắc cốt lõi. Khung này, được đề cập từ gợi ý ban đầu của Ackoff (1989), trở thành “kim chỉ nam” giúp tổ chức hiểu mình đang ở đâu trên lộ trình khai thác dữ liệu, đang thiếu gì để tiến thêm một bậc, và cần đầu tư năng lực nào để biến dữ liệu thành lợi thế.

Mô hình DIKW thường được biểu diễn dưới dạng hình tháp, trong đó Dữ liệu nằm ở đáy và Trí tuệ ở đỉnh, thể hiện sự gia tăng giá trị và tính phức tạp khi chuyển từ dữ liệu lên trí tuệ.

Hình ảnh: Bốn tầng của kim tự tháp DIKW

Mô hình DIKW bao gồm 4 tầng:

· Tầng thứ nhất - Dữ liệu (Data): Là các sự kiện, số liệu thô, rời rạc. Tự thân dữ liệu chưa có ý nghĩa khi tách khỏi bối cảnh. Đây là nền móng: nếu móng không chắc (thiếu, sai, cũ, khó truy cập), mọi tầng phía trên sẽ lung lay.

· Tầng thứ hai - Thông tin (Information): Dữ liệu đã được làm sạch, tổ chức, gắn bối cảnh quy trình để trả lời câu hỏi Ai? Cái gì? Khi nào? Ở đâu? Thông tin dùng được là thông tin phù hợp mục đích, có cấu trúc, có ngữ cảnh.

· Tầng thứ ba - Kiến thức (Knowledge): Thông tin được diễn giải, kết nối và soi chiếu bằng kinh nghiệm, quy tắc nghiệp vụ, mô hình phân tích, từ đó trả lời Tại sao? Như thế nào? Kiến thức làm lộ ra quy luật, mối quan hệ, mẫu bất thường.

· Tầng thứ tư - Trí tuệ (Wisdom): Khả năng áp dụng kiến thức gắn với nguyên lý gốc, chuẩn mực nghề nghiệp, đạo đức và mục tiêu để ra quyết định đúng đắn. Ở tầng này, tổ chức không chỉ “biết” mà còn “làm đúng” và “làm có trách nhiệm”.

Hình ảnh kim tự tháp nhấn mạnh quy luật: càng lên cao, khối lượng giảm nhưng giá trị và tính tinh lọc tăng. Mọi nỗ lực “nhảy cóc” đều rủi ro: nếu không có dữ liệu đủ chuẩn, các phân tích nâng cao sẽ không đảm báo tính chính xác và độ tin cậy.

Trong kiểm toán, nơi độ tin cậy, tính kịp thời và sự minh bạch là nền tảng, DIKW đặc biệt hữu ích. Kỷ nguyên Big Data và AI tạo ra lượng dữ liệu khổng lồ, đa dạng và tốc độ phát sinh nhanh, nhưng chính sự “nhiều – nhanh – phức tạp” ấy cũng khiến dữ liệu khó dùng nếu thiếu khung chuyển hóa có phương pháp. DIKW giúp “đặt dữ liệu vào đúng chỗ”: phải đúng – đủ – kịp thời – sẵn sàng ở tầng Dữ liệu; phải được gắn bối cảnh nghiệp vụ ở tầng Thông tin; phải được tích hợp, đối chiếu, làm giàu ngữ nghĩa ở tầng Kiến thức; và phải được soi chiếu bởi chuẩn mực, đạo đức, mục tiêu ở tầng Trí tuệ để trở thành khuyến nghị có giá trị.

3. Ứng dụng mô hình Kim tự tháp DIKW trong kiểm toán số

Mô hình DIKW cho phép nhìn toàn bộ hành trình chuyển hóa giá trị trong kiểm toán số: từ dữ liệu thô ở đáy kim tự tháp đến thông tin có bối cảnh, tích lũy thành kiến thức có ngữ nghĩa và cuối cùng kết tinh thành trí tuệ – tức năng lực đưa ra quyết định đúng đắn, kịp thời và có trách nhiệm. Khi áp dụng vào kiểm toán, DIKW không chỉ là khuôn khổ khái niệm mà còn là “bản đồ vận hành” để xác định mức trưởng thành hiện tại, nhận diện điểm nghẽn và lập lộ trình nâng cấp năng lực dữ liệu – phân tích – quản trị nhằm tạo ra lợi ích thực chất.

Giai đoạn 1: Dữ liệu (Data) – nền tảng sơ khởi.

Ở tầng thấp nhất, dữ liệu chính là đầu vào căn bản của mọi hoạt động phân tích kiểm toán: bút toán sổ cái, hóa đơn, chứng từ điện tử, nhật ký hệ thống, log truy cập, file đính kèm, dữ liệu cảm biến thiết bị, thậm chí là hình ảnh/scan chưa được trích xuất ký tự. Trong các đơn vị mới số hóa, dữ liệu thường phân tán ở nhiều ứng dụng tác nghiệp, bảng tính rời, thư mục chia sẻ, hoặc nằm trong các hệ thống cũ khó tích hợp. CNTT có thể đã hỗ trợ ghi nhận và lưu trữ, nhưng năng lực xử lý, chuẩn hóa, kết nối và truy xuất còn hạn chế, khiến dữ liệu chủ yếu phục vụ thống kê đơn giản hoặc đối chiếu thủ công. Thực trạng này làm cho dữ liệu tuy nhiều nhưng “thô”, chưa sẵn sàng để leo tầng thành thông tin và kiến thức.

Muốn dữ liệu trở thành nền móng vững chắc, bốn yếu tố phải đi cùng lúc. Thứ nhất, khối lượng (Volume) cần đủ bao quát để phản ánh thực tế nghiệp vụ, nhưng cần tránh tích trữ trùng lặp và dữ liệu rác. Thứ hai, chất lượng (Quality) là điều kiện tiên quyết: tính đúng, đầy đủ, nhất quán, hợp lệ; phải có quy tắc kiểm tra dữ liệu đầu vào (validations), cơ chế đối soát (reconciliation) và quy trình làm sạch. Thứ ba, tốc độ (Velocity) liên quan năng lực cập nhật và trích xuất kịp thời để phục vụ giám sát gần thời gian thực hoặc phân tích theo kỳ. Thứ tư, khả dụng/sẵn sàng (Readiness/Availability) đòi hỏi dữ liệu được phân loại, đánh chỉ mục, gán metadata, có pipeline ETL/ELT ổn định và phân quyền truy cập rõ ràng. Bốn yếu tố này bổ sung lẫn nhau; việc chỉ dồn vào một yếu tố (chẳng hạn tăng dữ liệu thật nhiều) mà bỏ qua ba yếu tố còn lại thường dẫn đến “tắc” ở các tầng trên.

Một ví dụ điển hình là hệ thống ERP hoặc nền tảng mua sắm công cấp tỉnh ghi nhận hàng trăm nghìn giao dịch mỗi năm; ở quy mô quốc gia, con số có thể lên đến hàng triệu. Nếu các trường thiết yếu như mã nhà cung cấp, giá trị hợp đồng, mã gói thầu, kỳ hạch toán còn thiếu hoặc nhập sai; nếu định dạng ngày, tiền tệ không thống nhất; hoặc nếu không có pipeline trích xuất và kiểm tra hợp lệ tự động, thì các thuật toán phát hiện bất thường, phân tích rủi ro hay giám sát liên tục phía sau sẽ thiếu tin cậy. Quy tắc “rác vào – rác ra” (garbage in – garbage out) luôn đúng, bất kể tổ chức sử dụng công cụ phân tích hay mô hình AI mạnh đến đâu.

Về mặt tổ chức, tầng Data đòi hỏi quản trị dữ liệu (data governance) bài bản: lập từ điển dữ liệu thống nhất, chuẩn định danh chủ thể (nhà cung cấp, đơn vị, tài khoản) để tránh “đa hình” dữ liệu; quy định vai trò (data owner, data steward) và trách nhiệm tương ứng; áp dụng quản trị dòng dõi dữ liệu (data lineage) để biết dữ liệu đi qua những bước biến đổi nào trước khi đến kho. Khi ai chịu trách nhiệm cho tập dữ liệu nào được minh định, việc mở rộng quy mô kiểm toán số sẽ bớt rủi ro lệ thuộc vào cá nhân hoặc bộ phận.

Giai đoạn 2: Thông tin (Information) – dữ liệu cộng bối cảnh.

Bước chuyển từ dữ liệu sang thông tin không chỉ là “làm sạch rồi trình bày”, mà là gắn bối cảnh nghiệp vụ để trả lời các câu hỏi Ai? Cái gì? Khi nào? Ở đâu? Các trường dữ liệu được ánh xạ vào cấu trúc quy trình: mã ngành, mã dự toán, đơn vị phát sinh, kỳ kế toán, trạng thái phê duyệt, văn bản quy phạm chi phối. Nhờ bối cảnh, cùng một số liệu có thể phục vụ nhiều góc nhìn: theo đơn vị, theo nhà cung cấp, theo hạng mục, theo giai đoạn dự án; đồng thời, người dùng hiểu “ý nghĩa thực tế” của con số, chứ không chỉ biết giá trị thuần túy.

Ở tầng Information, kiểm toán viên cần hiểu môi trường CNTT của đơn vị: hệ thống nào là “nguồn sự thật” (system of record), dữ liệu đi qua những khâu xử lý nào trước khi đổ về kho, quy tắc nghiệp vụ đang áp dụng ra sao, định nghĩa từng chỉ tiêu cụ thể thế nào. Một năng lực quan trọng là phân biệt thời gian sự kiện (event time) với thời gian xử lý (processing time); báo cáo chỉ có ý nghĩa khi nêu rõ “kỳ nào, dữ liệu chốt đến ngày nào, có hiệu chỉnh hồi tố hay không”. Không ít sai lệch xảy ra khi trộn lẫn hai khái niệm này, đặc biệt trong bối cảnh dữ liệu đồng bộ từ nhiều nguồn.

Khi bối cảnh được gắn đúng, tổ chức hình thành bộ báo cáo chuẩn và chỉ số kiểm soát (key control indicators) thống nhất; có thể thiết kế cảnh báo ngưỡng đơn giản (ví dụ chi tiêu vượt ngưỡng theo nhóm hàng hóa hoặc đơn vị). Ứng dụng NLP để nối nhanh văn bản quy định với mẫu giao dịch giúp gia tăng giá trị của thông tin: mỗi chỉ báo đều có “điểm tựa” pháp lý/quy chuẩn để giải thích khi cần. Mục tiêu của tầng này là biến dữ liệu thành thông tin dùng được – đúng bối cảnh, truy xuất nhanh, và đủ tin cậy để bước sang phân tích sâu.

Giai đoạn 3: Kiến thức (Knowledge) – thông tin cộng ngữ nghĩa.

Kiến thức hình thành khi thông tin từ nhiều nguồn được kết nối chéo, diễn giải bằng quy tắc nghiệp vụ và mô hình phân tích để trả lời “Tại sao?” và “Như thế nào?”. Đây là bước đổi chất: từ báo cáo rời rạc sang bức tranh hệ thống về hành vi, xu hướng và rủi ro. Về kỹ thuật, tổ chức cần tích hợp dữ liệu từ ERP, mua sắm, ngân quỹ, nhân sự, CRM…, thiết kế mô hình dữ liệu theo chủ đề (data marts) và triển khai phân tích nâng cao/AI.

Các kỹ thuật tiêu biểu bao gồm: phát hiện bất thường theo phân phối hoặc theo chuỗi thời gian; đối sánh thực thể (entity resolution) để nhận diện nhà cung cấp “đổi hình” (biến thể tên, chung địa chỉ/số điện thoại); phân tích mạng lưới (network analytics) để phát hiện cụm nhà cung cấp – người phê duyệt có liên hệ bất thường; chấm điểm rủi ro theo bộ chỉ báo trọng số; học bán giám sát trong bối cảnh thiếu nhãn. Điểm mấu chốt là mọi phát hiện phải lưu vết (audit trail): dữ liệu đầu vào, quy tắc/thuật toán, tham số mô hình, phiên bản, kết quả xác minh thủ công. Nhờ vậy, kiến thức không nằm rời rạc trong đầu chuyên gia mà trở thành tài sản tổ chức.

Cùng với công cụ phân tích, tầng Knowledge đòi hỏi quản trị tri thức kiểm toán (knowledge management). Cần xây dựng thư viện chương trình kiểm toán mẫu theo ngành/lĩnh vực; CSDL lịch sử phát hiện – khuyến nghị – mức khắc phục để nhận diện rủi ro kế thừa; kho case điển hình với chỉ dấu (fingerprints) đã xác minh; và cơ chế tìm kiếm nhanh dựa trên từ khóa và thuộc tính. Ngoài ra, cần chuẩn hóa quy trình xử lý cảnh báo: tiêu chí ưu tiên, SLA phản hồi, điều kiện đóng/mở cảnh báo, và vòng phản hồi để tinh chỉnh mô hình/ngưỡng. Về nhân sự, các vai trò cũng chuyên môn hóa: kiểm toán viên dữ liệu, kỹ sư dữ liệu, quản trị kho tri thức, chuyên gia nghiệp vụ đồng hành chuẩn hóa quy tắc.

Giai đoạn 4: Trí tuệ (Wisdom) – kiến thức cộng nguyên lý gốc.

Trí tuệ là đỉnh kim tự tháp, nơi kiến thức dữ liệu được áp dụng theo nguyên tắc – chuẩn mực – đạo đức để đưa ra quyết định có trách nhiệm. Với kiểm toán, điều này thể hiện ở ba bình diện. Thứ nhất, xét đoán nghề nghiệp: kết hợp bằng chứng dữ liệu với hiểu biết bối cảnh, cân nhắc mức trọng yếu, xác suất rủi ro, chi phí – lợi ích của các thủ tục kiểm tra, và tác động đến các bên. Thứ hai, minh bạch và giải trình: mọi kết luận dựa trên phân tích/AI cần giải thích được, có dẫn chiếu nguồn và audit trail có thể tái dựng. Thứ ba, độc lập và khách quan: bảo đảm cơ chế tổ chức để vai trò kiểm toán không chịu chi phối bởi đơn vị vận hành hệ thống hoặc nhóm phát triển mô hình.

AI ở tầng này đóng vai trò trợ giúp quyết định: tổng hợp insight gần thời gian thực, gợi ý vùng rủi ro cần “khoan sâu”, mô phỏng tác động nếu siết/giãn ngưỡng kiểm soát. Tuy vậy, quyết định cuối vẫn thuộc về con người – chủ thể chịu trách nhiệm giải trình. Vì thế, quản trị mô hình (ML governance) là yêu cầu bắt buộc: kiểm thử thiên lệch/công bằng (bias/fairness), theo dõi trôi dạt (drift), tái huấn luyện theo định kỳ/điều kiện, tiêu chí dừng/rollback, và rà soát độc lập khi cần. Chỉ khi mô hình được kiểm soát chặt chẽ, “trí tuệ” mới thực sự đáng tin và phù hợp chuẩn mực.

Ví dụ xuyên suốt DIKW trong kiểm toán mua sắm công. Một tỉnh muốn nâng cấp kiểm toán mua sắm theo hướng số. Ở tầng Dữ liệu, tỉnh thiết lập pipeline trích xuất giao dịch từ hệ thống đấu thầu điện tử, ERP tài chính, kho chứng từ; chuẩn hóa định nghĩa trường; kiểm tra hợp lệ giá trị, định dạng ngày, tiền tệ; chuẩn định danh nhà cung cấp để tránh trùng/đa hình. Sang tầng Thông tin, dữ liệu được gắn bối cảnh: mã dự toán, ngành, đơn vị mua sắm, trạng thái phê duyệt, văn bản quy định; xây bộ báo cáo theo đơn vị/nhà cung cấp/thời gian, nêu rõ ngày “chốt dữ liệu” và quy tắc hiệu chỉnh. Ở tầng Kiến thức, nhóm kiểm toán triển khai phát hiện bất thường giá theo phân khúc, kiểm tra “chia nhỏ gói” qua chuỗi giao dịch, phân tích mạng lưới để nhận diện cụm nhà cung cấp có liên hệ bất thường; kết quả được chấm điểm rủi ro và đưa vào hàng đợi xử lý với SLA. Mỗi case xác minh được lưu mẫu và cập nhật kho tri thức. Cuối cùng, tại tầng Trí tuệ, hội đồng cân nhắc mức trọng yếu và tác động, quyết định ưu tiên kiểm tra sâu một số gói, đồng thời khuyến nghị điều chỉnh ngưỡng phê duyệt và tiêu chí mời thầu; toàn bộ suy luận, nguồn chứng cứ và tham số mô hình được lưu vết phục vụ giải trình và hậu kiểm.

Rủi ro và kiểm soát sẽ được thiết lập theo từng tầng. Ở tầng Data, rủi ro chính là chất lượng kém và khó truy cập; biện pháp là chuẩn hóa đầu vào, áp validations, đối soát liên hệ chéo, quản trị metadata và phân quyền tối thiểu. Ở tầng Information, rủi ro là gắn sai bối cảnh dẫn đến hiểu nhầm; khắc phục bằng định nghĩa chỉ tiêu rõ ràng, tách bạch event time – processing time, công bố phạm vi dữ liệu và ngày chốt. Ở tầng Knowledge, rủi ro là mô hình hóa sai/thiên lệch/quá khớp; cần kiểm thử chéo, đánh giá ngoại mẫu, mô hình dễ giải thích cho khâu trọng yếu, vòng phản hồi với nhóm xác minh thực địa. Ở tầng Wisdom, rủi ro là phụ thuộc mù quáng vào AI hoặc thiếu giải trình; yêu cầu audit trail, chính sách giải thích được, rà soát độc lập và đào tạo xét đoán nghề nghiệp trong bối cảnh có AI.

Để quản trị tiến trình này, cần thiết lập bộ chỉ số theo từng tầng. Với Data, đo tỷ lệ trường bắt buộc đầy đủ, tỷ lệ lỗi hợp lệ, độ trễ nạp, thời gian trích xuất, số tập dữ liệu có data owner được chỉ định. Với Information, đo tỷ lệ báo cáo có mô tả bối cảnh đầy đủ, số chỉ tiêu kiểm soát chuẩn hóa, thời gian tạo báo cáo đột xuất. Với Knowledge, đo số mẫu kiểm tra tái sử dụng, tỷ lệ cảnh báo hữu ích (precision/recall), thời gian xử lý cảnh báo, tỷ lệ vùng rủi ro được giám sát liên tục. Với Wisdom, đo tỷ lệ phát hiện chuyển thành kiến nghị khả thi, thời gian từ phát hiện đến quyết định, tỷ lệ khuyến nghị được thực thi, và số vụ việc có thể tái dựng chuỗi suy luận đầy đủ khi hậu kiểm.

Một lộ trình áp dụng thường đi theo thứ tự: (1) Củng cố tầng Dữ liệu bằng từ điển dữ liệu, chuẩn chất lượng, pipeline ETL/ELT, dashboard đo độ đầy đủ – chính xác – kịp thời; (2) Gắn bối cảnh tạo Thông tin bằng mô hình hóa theo quy trình, bộ báo cáo kiểm soát, tự động nối quy định – chứng từ bằng NLP; (3) Nâng lên Kiến thức với tích hợp hệ thống, triển khai phát hiện bất thường/chấm điểm rủi ro, thiết lập giám sát liên tục và kho tri thức kiểm toán; (4) Đạt tới Trí tuệ bằng quản trị mô hình/đạo đức AI, yêu cầu lưu vết suy luận và trích dẫn nguồn, đào tạo xét đoán nghề nghiệp. Nên bắt đầu từ bài toán hẹp nhưng sâu (ví dụ phát hiện chia nhỏ gói thầu, giá vượt chuẩn theo phân khúc), có ROI rõ ràng (giá trị tổn thất phòng tránh, thời gian xử lý rút ngắn), rồi mở rộng. Mỗi chu kỳ đều trả lại mẫu, ngưỡng, bài học vào kho tri thức để tạo hiệu ứng tích lũy.

Vai trò con người luôn ở vị trí đỉnh tháp. AI có thể mở rộng phạm vi phân tích, phát hiện tín hiệu yếu và rút ngắn thời gian, nhưng không thay thế được xét đoán nghề nghiệp và đạo đức của kiểm toán viên. Con người đặt câu hỏi đúng, đánh giá độ phù hợp/đủ tin của bằng chứng, cân nhắc lợi ích các bên và chọn cách truyền đạt phù hợp. Vì vậy, trong mọi ứng dụng DIKW, yếu tố con người phải được bồi dưỡng song hành: năng lực dữ liệu, hiểu biết công nghệ, và đặc biệt là khả năng phán đoán trong bối cảnh có AI.

Như vậy có thể thấy mô hình DIKW cung cấp một trục trưởng thành rõ ràng cho kiểm toán số: dữ liệu phải sạch và sẵn sàng; thông tin phải đúng bối cảnh và truy xuất nhanh; kiến thức phải có ngữ nghĩa, lưu vết và tái sử dụng; còn trí tuệ phải minh bạch, giải trình và phù hợp chuẩn mực. Khi từng tầng được xây đúng và liên kết trơn tru, kiểm toán số không chỉ “nhanh hơn – rẻ hơn”, mà đáng tin hơn và có giá trị chiến lược cao hơn: phát hiện sắc bén, khuyến nghị khả thi, quyết định kịp thời. AI đóng vai trò chất xúc tác mạnh mẽ ở mọi tầng, nhưng không thay thế vai trò con người. Sự kết hợp đúng liều giữa nền tảng dữ liệu, bối cảnh nghiệp vụ, phân tích có kiểm soát và quản trị đạo đức sẽ giúp tổ chức leo vững chắc từng bậc của kim tự tháp DIKW, đưa kiểm toán số từ mức ghi nhận – báo cáo đến nhận biết – dự báo – ra quyết định một cách tự tin và minh bạch.

4. Định hướng nghiên cứu ứng dụng DIKW vào hoạt động kiểm toán số tại Việt Nam

Áp dụng mô hình kim tự tháp DIKW vào kiểm toán số ở Việt Nam nên được định hình như một chương trình nghiên cứu – triển khai liên tục, trong đó AI đóng vai trò chất xúc tác giúp đẩy nhanh sự chuyển hóa từ dữ liệu thô lên thông tin, kiến thức và cuối cùng là trí tuệ nghề nghiệp. Trọng tâm không chỉ là xây công cụ, mà là kiểm chứng được giá trị kiểm toán gia tăng, tính giải trình và sự phù hợp chuẩn mực trong bối cảnh pháp lý – tổ chức – nguồn lực của Việt Nam. Dưới đây là các định hướng nghiên cứu chủ đạo theo từng tầng DIKW, kèm các câu hỏi, giả thuyết, phương pháp đo lường và lộ trình thử nghiệm khuyến nghị.

Tầng thứ nhất - Dữ liệu (Data): phát triển AI phục vụ việc đo chất lượng – tăng khả dụng – chuẩn hóa dòng chảy

Ở Việt Nam, dữ liệu kiểm toán thường phân tán giữa các hệ thống tài chính – kế toán, mua sắm, nhân sự, quản lý tài sản và kho chứng từ số; định nghĩa trường không đồng nhất, nhiều tài liệu ở dạng ảnh/PDF. Hướng nghiên cứu đầu tiên là phát triển và đánh giá các pipeline trích xuất–biến đổi–nạp có khả năng tự kiểm tra hợp lệ, theo dõi dòng dõi dữ liệu và đo chất lượng theo thời gian. Giả thuyết cốt lõi: nếu nâng đồng thời bốn yếu tố khối lượng, chất lượng, tốc độ, khả dụng thì hiệu quả phát hiện rủi ro ở các tầng trên tăng đáng kể. Cần thử nghiệm các mô-đun AI nền tảng, như OCR cho hóa đơn/chứng từ đa định dạng, đối sánh thực thể để hợp nhất nhà cung cấp/đơn vị bị “đa hình”, chuẩn hóa mã lĩnh vực – mục lục ngân sách – kỳ kế toán. Bộ chỉ số đánh giá nên bao gồm tỷ lệ trường bắt buộc đầy đủ, tỷ lệ lỗi hợp lệ, độ trễ nạp dữ liệu, thời gian truy xuất, và mức độ lặp/trùng dữ liệu sau hợp nhất. Một hướng nữa là thiết kế từ điển dữ liệu thống nhất và chức năng gợi ý quy tắc làm sạch tự động dựa trên học máy; nghiên cứu mức lợi ích biên khi bổ sung thêm luật so với chi phí vận hành trong môi trường nguồn lực hạn chế.

Tầng thứ hai - Thông tin (Information): gắn bối cảnh nghiệp vụ cho AI – mở khóa giá trị sử dụng.

Khi dữ liệu đã sạch và có thể truy cập, bước nghiên cứu tiếp theo là phương thức gắn bối cảnh để biến dữ liệu thành thông tin đúng mục đích. Ở đây, AI có thể tự động liên kết giao dịch với văn bản quy định, chính sách, định mức; phân loại giao dịch theo kịch bản nghiệp vụ; và tạo chỉ số kiểm soát có chú giải. Câu hỏi nghiên cứu trọng tâm: đâu là mức “đủ bối cảnh” để thông tin vừa chính xác vừa dễ hiểu với người dùng khác nhau (kiểm toán viên, quản lý đơn vị, cơ quan giám sát)? Có thể kiểm chứng qua thí nghiệm sử dụng: so sánh thời gian hoàn thành một tác vụ kiểm toán khi có/không có chú giải bối cảnh tự động, tỷ lệ lỗi diễn giải, và mức độ đồng thuận giữa các kiểm toán viên về ý nghĩa chỉ số. Một hướng thực nghiệm phù hợp là xây dựng công cụ NLP trích điều khoản liên quan từ văn bản quy phạm và tự gắn “thẻ pháp lý” vào từng nhóm giao dịch; đánh giá độ chính xác gắn thẻ, độ bao phủ quy định, và tác động đến khả năng truy xuất bằng chứng. Bên cạnh đó, cần phân biệt và đo lường tác động của việc hiển thị “thời gian sự kiện” và “thời gian xử lý” đối với các kết luận kiểm toán; giả thuyết rằng làm rõ hai khái niệm này sẽ giảm đáng kể mâu thuẫn số liệu giữa các báo cáo và tăng tính nhất quán của xét đoán.

Tầng thứ ba - Kiến thức (Knowledge): Huấn luyện AI thực hiện các phân tích nâng cao – quản trị tri thức – giám sát liên tục.

Ở tầng này, nghiên cứu tập trung vào việc kết nối chéo thông tin từ nhiều hệ thống để phát hiện mẫu rủi ro và hình thành kho tri thức kiểm toán sống. Cần thiết kế và đánh giá các mô hình phát hiện bất thường theo chuỗi thời gian, phân tích mạng lưới nhà cung cấp – người phê duyệt, chấm điểm rủi ro đa chỉ báo, và học bán giám sát cho bối cảnh thiếu nhãn. Giả thuyết: mô hình kết hợp (ensemble) giữa luật nghiệp vụ và học máy sẽ cho độ chính xác – khả năng giải thích tốt hơn so với dùng đơn lẻ. Phương pháp đánh giá gồm precision/recall, tỷ lệ phát hiện hữu ích được xác minh, thời gian từ cảnh báo đến xử lý, và “độ chì” phát hiện (lead time trước khi rủi ro trở nên trọng yếu). Song song, cần nghiên cứu thiết kế kho tri thức kiểm toán: chuẩn hóa cách lưu vết case, mẫu phát hiện, tham số mô hình, bằng chứng xác minh; so sánh hiệu quả tổ chức làm việc “dựa trên tri thức” trước và sau khi áp dụng. Một nhánh nghiên cứu giàu tiềm năng là trợ lý kiểm toán số dùng RAG (retrieval-augmented generation) để truy xuất kế hoạch – chương trình mẫu – hồ sơ lịch sử và gợi ý thủ tục kiểm tra; đánh giá bằng thử nghiệm mù về chất lượng gợi ý, mức chấp nhận của kiểm toán viên và tác động đến thời gian lập kế hoạch.

Tầng thứ 4 - Trí tuệ (Wisdom): Huấn luyện AI phù hợp chuẩn mực – giải thích được – ra quyết định có trách nhiệm.

Ở đỉnh tháp, mục tiêu nghiên cứu là đảm bảo các quyết định dựa trên dữ liệu và AI phù hợp chuẩn mực nghề nghiệp, có thể giải trình và bảo toàn tính độc lập. Ba chủ đề nổi bật gồm: (i) khung quản trị mô hình cho kiểm toán, bao trùm kiểm thử thiên lệch/công bằng, theo dõi trôi dạt, tiêu chí tái huấn luyện và kịch bản dừng/rollback; (ii) cơ chế giải thích kết quả mô hình theo cấp độ đối tượng sử dụng (chuyên gia dữ liệu, kiểm toán viên, đối tượng được kiểm toán, công chúng), với thí nghiệm đo mức hiểu đúng – tin cậy – sẵn sàng hành động; (iii) tích hợp chuẩn mực và đạo đức vào quy trình ra quyết định, bao gồm các check-point độc lập, yêu cầu dẫn chiếu nguồn, và quy tắc xử lý xung đột lợi ích khi công cụ phân tích do cùng tổ chức vận hành. Giả thuyết cần kiểm chứng là: khi ràng buộc “giải thích được” và “lưu vết suy luận” được tích hợp ngay từ thiết kế, chi phí kiểm tra hậu kiểm giảm, mức chấp nhận kết luận tăng, và rủi ro pháp lý – danh tiếng giảm.

Để ứng dụng được DIKW vào hoạt động kiểm toán số tại Việt Nam hiện nay, cần có các nghiên cứu đồng thời, gồm:

Thứ nhất, nghiên cứu mô hình kinh tế – kỹ thuật cho các địa phương/đơn vị khác nhau về quy mô và mức độ số hóa: tổng chi phí sở hữu của pipeline dữ liệu, chi phí duy trì mô hình và kho tri thức so với lợi ích (giá trị tổn thất phòng tránh, thời gian rút ngắn, mức bao phủ trọng yếu).

Thứ hai, nghiên cứu khung trưởng thành DIKW thích ứng Việt Nam, với các mức đánh giá cụ thể cho dữ liệu, thông tin, kiến thức, trí tuệ; xác định “điểm ngưỡng” cần đạt trước khi nâng cấp tầng tiếp theo.

Thứ ba, nghiên cứu chiến lược nhân lực: chuẩn năng lực dữ liệu – công nghệ tối thiểu cho kiểm toán viên; mô hình phối hợp ba vai trò kiểm toán viên dữ liệu – kỹ sư dữ liệu – chuyên gia nghiệp vụ; đánh giá hiệu quả đào tạo tại chỗ so với đào tạo tập trung.

Thứ tư, nghiên cứu bảo mật và quyền riêng tư trong điều kiện dữ liệu phân tán: ẩn danh hóa, phân quyền tối thiểu, nhật ký truy cập, và phương án tính toán an toàn khi chia sẻ dữ liệu liên cơ quan.

Thứ năm, nghiên cứu tính phù hợp văn hóa – tổ chức: cơ chế khuyến khích sử dụng kho tri thức, quy tắc ghi nhận đóng góp, và xử lý “sở hữu tri thức” cá nhân để tránh “đứt gãy” khi luân chuyển.

Về thiết kế thí điểm và phương pháp đánh giá, nhóm nghiên cứu đề xuất một lộ trình khả thi gồm ba pha, gồm:

· Pha 1 tập trung dữ liệu và thông tin: chọn hai đến ba nghiệp vụ có dữ liệu tương đối “sạch” (ví dụ mua sắm, chi thường xuyên), xây pipeline, gắn bối cảnh, chuẩn hóa báo cáo, triển khai OCR và đối sánh thực thể; đánh giá bằng bộ chỉ số chất lượng – tốc độ – khả dụng.

· Pha 2 nâng lên kiến thức: triển khai phát hiện bất thường, mạng lưới, chấm điểm rủi ro; thiết lập quy trình xử lý cảnh báo và kho tri thức; đo precision/recall, lead time, SLA xử lý.

· Pha 3 hướng tới trí tuệ: áp dụng trợ lý kiểm toán số cho lập kế hoạch và gợi ý thủ tục; tích hợp khung quản trị mô hình và cơ chế giải thích; đo tỷ lệ khuyến nghị khả thi, thời gian từ phát hiện đến quyết định, tỷ lệ thực thi khuyến nghị và khả năng tái dựng chuỗi suy luận khi hậu kiểm. Mỗi pha nên kèm đối chứng (before/after) hoặc so sánh nhóm, và có hội đồng đạo đức – chuẩn mực giám sát.

Để nghiên cứu ứng dụng này có thể tạo ra các tác động bền vững, cần liên danh giữa cơ quan kiểm toán/đơn vị được kiểm toán, trường đại học/viện nghiên cứu và doanh nghiệp công nghệ trong nước. Cơ quan kiểm toán và đơn vị vận hành cung cấp dữ liệu, kịch bản nghiệp vụ và tiêu chí thực thi; khối học thuật đảm nhiệm thiết kế thí nghiệm, đánh giá và công bố; doanh nghiệp công nghệ hiện thực hóa giải pháp và tối ưu chi phí triển khai. Một sản phẩm quan trọng của hợp tác là bộ “chuẩn mở” cho dữ liệu kiểm toán (từ điển trường, siêu dữ liệu, giao thức log/audit trail) và kho tri thức dùng chung có phân quyền, giúp nhân rộng mô hình mà không lệ thuộc nhà cung cấp.

Nghiên cứu ứng dụng DIKW vào kiểm toán số ở Việt Nam nên đặt mục tiêu kép: gia tăng giá trị kiểm toán (phát hiện sớm, bao phủ rộng, khuyến nghị khả thi) và củng cố nền tảng tin cậy (minh bạch, giải trình, phù hợp chuẩn mực). Từ dữ liệu sạch – sẵn sàng, qua thông tin đúng bối cảnh, tới kiến thức có ngữ nghĩa và trí tuệ có trách nhiệm, AI cần được thiết kế như công cụ hỗ trợ chứ không thay thế xét đoán nghề nghiệp. Khi từng tầng được nghiên cứu – kiểm chứng – triển khai có đo lường, kiểm toán số sẽ tiến từ “ghi nhận và báo cáo” sang “nhận biết, dự báo và ra quyết định”, phù hợp với điều kiện nguồn lực và yêu cầu minh bạch, hiệu quả của Việt Nam.

5. Kết luận

Thông qua lăng kính mô hình DIKW, nghiên cứu đã làm rõ một cách có hệ thống về sự thay đổi căn bản trong lĩnh vực kiểm toán khi chuyển từ phương pháp truyền thống sang kiểm toán số. Sự chuyển đổi từ kiểm toán truyền thống sang kiểm toán số thông qua mô hình DIKW không chỉ là một bước tiến về công nghệ, mà còn là sự thay đổi trong cách tiếp cận và tư duy của ngành kiểm toán. Tuy nhiên, để đạt được hiệu quả tối đa, các tổ chức cần đầu tư vào việc đào tạo kiểm toán viên, xây dựng các chuẩn mực đạo đức và triển khai các công cụ kiểm soát phù hợp. AI mặc dù là yếu tố then chốt, cần được sử dụng một cách cẩn trọng để đảm bảo tính minh bạch và công bằng trong kiểm toán. Như vậy, để triển khai hoạt động kiểm toán số một cách hiệu quả và hiệu lực, các đơn vị/tổ chức cần xây dựng chiến lược chuyển đổi số đúng đắn, tập trung vào việc nâng cao năng lực chuyển hóa dữ liệu theo mô hình DIKW và tận dụng tối đa tiềm năng của AI và Big Data, đồng thời duy trì sự kết hợp hài hòa giữa năng lực công nghệ và năng lực xét đoán của con người./

Tài liệu tham khảo

Ackoff, R. L. (1989). From data to wisdom. Journal of Applied Systems Analysis, 16, 3-9.

Alles, M. G. (2015). Drivers of the use, facilitators, and obstacles of the evolution of Big Data by the audit profession. Accounting Horizons, 29(2), 439-449. https://doi.org/10.2308/acch-51067

Appelbaum, D., Kogan, A., & Vasarhelyi, M. A. (2017). Big Data and Analytics in the Modern Audit Engagement: Research Needs. Auditing: A Journal of Practice & Theory, 36(4), 1-27. https://doi.org/10.2308/ajpt-51684

Bell, T. B., Marrs, F. O., Solomon, I., & Thomas, H. (1997). Auditing organizations through a strategic-systems lens: The KPMG business measurement process. KPMG LLP.

Bellinger, G., Castro, D., & Mills, A. (2004). Data, information, knowledge, and wisdom. Retrieved from http://www.systems-thinking.org/dikw/dikw.htm

Brown, C., Wong, J., & Baldwin, A. (2007). Automated audit: The next frontier. Journal of Accountancy, 204(3), 46-51.

Davenport, T. H., & Prusak, L. (1998). Working knowledge: How organizations manage what they know. Harvard Business School Press.

Gepp, A., Linnenluecke, M. K., O’Neill, T. J., & Smith, T. (2018). Big data analytics in auditing: A review and research agenda. Journal of Accounting Literature, 40, 102-121.

Knechel, W. R. (2020). The changing face of audit research: Addressing the real challenges of an evolving profession. International Journal of Auditing, 24(1), 1-12. https://doi.org/10.1111/ijau.12186.

Lê Anh Vũ (2021), Xây dựng giải pháp ứng dụng công nghệ thông tin trong quản lý điều hành và ứng dụng trong hoạt động kiểm toán của kiểm toán nhà nước, NCKH cấp Bộ, KTNN.

Rowley, J. (2007). The wisdom hierarchy: Representations of the DIKW hierarchy. Journal of Information Science, 33(2), 163-180. https://doi.org/10.1177/0165551506070706.

Vasarhelyi, M. A., & Halper, F. B. (1991). The continuous audit of online systems. Auditing: A Journal of Practice & Theory, 10(1), 110-125.

Yoon, K., Hoogduin, L., & Zhang, L. (2015). Big Data as complementary audit evidence. Accounting Horizons, 29(2), 431-438. https://doi.org/10.2308/acch-51076

Zeleny, M. (1987). Management support systems: Towards integrated knowledge management. Human Systems Management, 7(1), 59-70.