Làm thế nào để xây dựng một siêu máy tính?

Bây giờ có một cách nhanh chóng và rẻ tiền
để giải quyết các tính toán rất khó khăn
William W. Hargrove, Forrest M. Hoffman và Thomas Sterling
Khoa học Mỹ

NEW YORK - Trong các câu chuyện ngụ ngôn nổi tiếng cũng "Soup đá" một người lính lang thang dừng lại ở một ngôi làng nghèo và cho biết ông sẽ làm cho súp bằng cách đun sôi một cái vạc nước chỉ chứa một viên đá sáng bóng. Người dân thị trấn hoài nghi lúc đầu tiên nhưng nhanh chóng mang lại những dịch vụ nhỏ: một đầu của cải bắp, một bó cà rốt, một chút thịt bò.Cuối cùng, cái vạc đầy với súp thịnh soạn đủ để nuôi sống mọi người. Bài học: hợp tác có thể sản xuất những thành tựu đáng kể, thậm chí từ các khoản đóng góp ít ỏi, dường như không đáng kể.

Nhóm các máy tính tại Phòng thí nghiệm quốc gia Oak Ridge ở Tennessee đã được mệnh danh là máy tính Souper đá.

Các nhà nghiên cứu đang sử dụng một chiến lược tương tự như hợp tác để xây dựng siêu máy tính, máy mạnh mẽ mà có thể thực hiện hàng tỷ phép tính trong một lần thứ hai. Hầu hết các siêu máy tính thông thường sử dụng xử lý song song: chúng chứa các mảng của bộ vi xử lý cực nhanh mà công việc song song để giải quyết các vấn đề phức tạp như dự báo thời tiết hoặc mô phỏng một vụ nổ hạt nhân.
Được thực hiện bởi IBM, Cray và các nhà cung cấp máy tính khác, máy có giá hàng chục triệu đô la - quá nhiều cho một nhóm nghiên cứu với một ngân sách khiêm tốn. Vì vậy, trong vài năm qua, các nhà khoa học tại phòng thí nghiệm quốc gia và các trường đại học đã học được làm thế nào để xây dựng siêu máy tính của mình bằng cách liên kết các máy tính rẻ tiền và phần mềm bằng văn bản cho phép các máy tính thông thường để giải quyết vấn đề bất thường.

Một cụm máy tính. SouperComputer đá tại Phòng thí nghiệm quốc gia Oak Ridge bao gồm hơn 130 máy tính liên kết trong một cụm máy tính. Một trong những máy phục vụ là các nút front-end cho cluster, có hai thẻ Ethernet, một để giao tiếp với người dùng và mạng bên ngoài, và để nói chuyện với phần còn lại của các nút trong cluster. Hệ thống giải quyết các vấn đề thông qua xử lý song song: phân chia khối lượng công việc tính toán thành nhiều nhiệm vụ được giao đến các hạch. Các máy tính phối hợp nhiệm vụ của mình và các kết quả trung gian chia sẻ bằng cách gửi tin nhắn cho nhau.

Năm 1996, hai chúng tôi (Hargrove và Hoffman) gặp phải một vấn đề trong công việc của chúng tôi tại Phòng thí nghiệm quốc gia Oak Ridge (ORNL) ở Tennessee. Chúng tôi đã cố gắng để vẽ một bản đồ quốc gia của vùng sinh thái, được xác định bởi điều kiện môi trường: tất cả các lĩnh vực cùng với khí hậu, địa mạo và đặc trưng đất rơi vào cùng một vùng sinh thái. Để tạo ra một bản đồ độ phân giải cao của Hoa Kỳ lục địa, chúng tôi chia đất nước thành 7,8 triệu ô vuông, mỗi một khu vực cây số vuông.Đối với mỗi tế bào, chúng tôi đã phải xem xét tới 25 biến, khác nhau, từ lượng mưa trung bình hàng tháng để hàm lượng nitơ của đất. Một máy tính hoặc máy trạm không thể hoàn thành nhiệm vụ.Chúng tôi cần một siêu máy tính xử lý song song và một mà chúng ta có thể đủ khả năng!
Giải pháp của chúng tôi là xây dựng một cụm máy tính bằng cách sử dụng máy tính lỗi thời mà ORNL sẽ có nếu không bị loại bỏ. Được mệnh danh là SouperComputer đá bởi vì nó được xây dựng cơ bản miễn phí, cụm máy tính của chúng tôi là mạnh mẽ, đủ để sản xuất bản đồ vùng sinh thái chi tiết giá.
Nhóm nghiên cứu khác đã phát minh ra các cụm thậm chí còn nhiều khả năng cạnh tranh với hiệu suất của siêu máy tính tốt nhất của thế giới chỉ một phần nhỏ của chi phí của họ. Này tỷ lệ giá thực hiện thuận lợi đã thu hút sự chú ý của một số tập đoàn, kế hoạch sử dụng các cụm cho các nhiệm vụ phức tạp như vậy là giải mã bộ gen của con người. Trong thực tế, khái niệm cluster hứa hẹn cách mạng hóa lĩnh vực tính toán bằng cách cung cấp sức mạnh xử lý to lớn cho nhóm nghiên cứu bất kỳ, trường học hoặc doanh nghiệp nào muốn nó

"CRASH HÀNG" với một màn hình và bàn phím chẩn đoán vấn đề với SouperComputer đá.

Các khái niệm về kết nối máy tính với nhau không phải là mới. Trong những năm 1950 và 1960, Không quân Mỹ đã thiết lập một mạng lưới các ống chân không máy tính được gọi là SAGE để bảo vệ chống lại một cuộc tấn công hạt nhân Liên Xô. Trong những năm 1980 giữa Tổng công ty Thiết bị kỹ thuật số đặt ra thuật ngữ "cluster" khi nó tích hợp máy tính mini VAX tầm trung của nó vào các hệ thống lớn hơn. Mạng lưới các máy trạm làm việc - thường ít mạnh mẽ hơn so với máy tính mini nhưng nhanh hơn so với máy tính nhanh chóng trở thành phổ biến tại các tổ chức nghiên cứu. Vào những năm 1990, các nhà khoa học sớm bắt đầu để xem xét xây dựng các cụm của máy tính, một phần vì sản xuất hàng loạt bộ vi xử lý của họ đã trở nên quá tốn kém. Điều gì đã khiến ý tưởng thậm chí còn hấp dẫn hơn là giảm chi phí của Ethernet, công nghệ chiếm ưu thế để kết nối các máy tính trong mạng cục bộ.
Những tiến bộ trong phần mềm cũng đã mở đường cho các cụm máy tính.Trong những năm 1980 Unix nổi lên như là hệ điều hành chủ đạo cho tính toán khoa học và kỹ thuật. Thật không may, các hệ điều hành cho máy tính cá nhân thiếu sức mạnh và tính linh hoạt của Unix. Nhưng vào năm 1991, sinh viên đại học Phần Lan Linus Torvalds tạo ra Linux, Unix như hệ thống điều hành chạy trên máy tính.
Torvalds Linux miễn phí có sẵn phí trên Internet, và sớm hàng trăm lập trình viên bắt đầu cải thiện đóng góp. Bây giờ cực kỳ phổ biến như là một hệ điều hành cho máy tính độc lập, Linux cũng là lý tưởng cho máy tính cụm.
Cụm máy tính đầu tiên ra đời năm 1994 tại Trung tâm Bay Vũ trụ Goddard của NASA NASA đã tìm kiếm một cách rẻ hơn để giải quyết các vấn đề tính toán có nhiều nút thường gặp trong khoa học trái đất và không gian. Cơ quan không gian cần một máy có thể đạt được một gigaflops - đó là, thực hiện điểm nổi một tỷ phép tính mỗi giây. (Một hoạt động nổi-điểm là tương đương với 1 tính toán đơn giản như bổ sung hoặc nhân.) Vào thời điểm đó, tuy nhiên, siêu máy tính thương mại mà mức chi phí thực hiện khoảng $ 1 triệu, mà là quá đắt để được dành riêng 1 nhóm duy nhất của các nhà nghiên cứu .
Một trong số chúng tôi (Sterling) quyết định theo đuổi khái niệm căn bản xây dựng một cụm máy tính từ máy tính cá nhân. Sterling và Goddard đồng nghiệp của ông Donald J. Becker kết nối 16 máy tính cá nhân, mỗi có chứa bộ vi xử lý Intel 486, bằng cách sử dụng Linux và một mạng Ethernet tiêu chuẩn. Đối với các ứng dụng khoa học, các cụm máy tính cung cấp hiệu suất duy trì 70 megaflops, 70 triệu tính dấu phẩy động mỗi giây. Mặc dù khiêm tốn so với tiêu chuẩn ngày nay, tốc độ này không thấp hơn nhiều so với một số nhỏ hơn siêu máy tính thương mại có sẵn tại thời điểm đó. Cluster được xây dựng với chỉ 40.000 $, hoặc 10 về một trong những giá so sánh một máy tính thương mại vào năm 1994.
NASA nhà nghiên cứu đặt tên Beowulf cluster, sau khi người anh hùng có nghĩa là nạc, của huyền thoại thời Trung Cổ, người đã đánh bại quái vật khổng lồ Grendel bằng cách xé toạc một cánh tay của sinh vật. Kể từ đó, tên đã được chấp nhận rộng rãi để chỉ bất kỳ cụm chi phí thấp được xây dựng từ máy tính cá nhân thương mại có sẵn. Năm 1996 hai người kế cụmBeowulf ban đầu xuất hiện: Hyglac (được xây dựng bởi các nhà nghiên cứu tại Viện Công nghệ California và Phòng thí nghiệm Jet Propulsion) và Loki (xây dựng tại Phòng thí nghiệm quốc gia Los Alamos). Mỗi cụm tích hợp 16 Intel bộ vi xử lý Pentium Pro và cho thấy hiệu quả bền vững hơn một gigaflops với chi phí ít hơn $ 50.000, đáp ứng mục tiêu ban đầu của NASA.
Cách tiếp cận Beowulf dường như là tính toán giải pháp hoàn hảo cho vấn đề của chúng ta về lập bản đồ các vùng sinh thái của Mỹ Một máy trạm có thể xử lý các dữ liệu cho một số ít bang ở hầu hết, và chúng tôi không thể chỉ định các khu vực khác nhau của đất nước để riêng biệt các máy trạm các dữ liệu môi trường cho mỗi phần của đất nước đã được so sánh và xử lý đồng thời. Nói cách khác, chúng ta cần một hệ thống xử lý song song. Vì vậy, trong năm 1996, chúng tôi đã viết một đề nghị mua 64 máy tính mới có chứa bộ vi xử lý Pentium II và xây dựng một siêu máy tính Beowulf-class.Tuy nhiên, ý tưởng này nghe có vẻ không hợp lý để nhận xét tại ORNL, người đã từ chối đề xuất của chúng tôi.
Không nản lòng, chúng tôi đã nghĩ ra một kế hoạch thay thế. Chúng tôi biết rằng các máy tính lỗi thời tại Sở phức tạp Năng lượng Hoa Kỳ tại Oak Ridge đã được thay thế thường xuyên với các mô hình mới hơn. Các máy tính cũ đã được quảng cáo trên một trang web nội bộ và bán đấu giá là thiết bị dư thừa. Một kiểm tra nhanh chóng cho thấy hàng trăm máy tính đã lỗi thời chờ đợi để được loại bỏ theo cách này. Có lẽ chúng ta có thể xây dựng cụm Beowulf của chúng tôi từ các máy mà chúng ta có thể thu thập và tái chế miễn phí. Chúng tôi lệnh cho một phòng tại ORNL trước đó đã đặt một máy tính máy tính lớn cổ đại. Sau đó, chúng tôi bắt đầu thu thập các máy tính thặng dư để tạo ra các SouperComputer đá.
Chiến lược đằng sau tính toán song song là "chia để trị". Một hệ thống xử lý song song phân chia một vấn đề phức tạp thành các nhiệm vụ thành phần nhỏ hơn. Các nhiệm vụ được giao cho các nút của các hệ thống - ví dụ, các máy tính trong một cụm Beowulf - giải quyết các thành phần cùng một lúc.Hiệu quả của xử lý song song phụ thuộc phần lớn vào bản chất của vấn đề.Một xem xét quan trọng là các nút phải giao tiếp thường xuyên như thế nào để phối hợp công việc của họ và chia sẻ kết quả trung gian. Một số vấn đề phải được chia thành các nhiệm vụ vô số rất nhỏ, bởi vì những vấn đề hạt mịn yêu cầu lóng thường xuyên thông tin liên lạc, họ không phải là rất thích hợp cho xử lý song song. Vấn đề hạt thô, ngược lại, có thể được chia thành nhiều phần tương đối lớn. Những vấn đề này không yêu cầu thông tin liên lạc giữa các nút và do đó có thể được giải quyết rất nhanh chóng bởi hệ thống xử lý song song.
Bất cứ ai xây dựng một cụm Beowulf phải đưa ra quyết định trong việc thiết kế hệ thống. Để kết nối các máy tính cá nhân, các nhà nghiên cứu có thể sử dụng một trong hai mạng Ethernet tiêu chuẩn hoặc nhanh hơn, mạng lưới chuyên ngành, chẳng hạn như Myrinet. Thiếu của chúng ta về một ngân sách khiển mà chúng ta sử dụng Ethernet, đó là miễn phí. Chúng tôi chọn một máy tính sẽ làm nút front-end của cluster và cài đặt hai card Ethernet vào máy. Một thẻ để giao tiếp với những người dùng bên ngoài, và người khác là nói chuyện với phần còn lại của các nút, mà sẽ được liên kết trong mạng riêng của mình. Các máy tính phối hợp nhiệm vụ của mình bằng cách gửi tin nhắn cho nhau. Hai tin nhắn phổ biến nhất qua các thư viện được tin nhắn thông qua giao diện (Bộ Kế hoạch và Đầu tư) và máy ảo song song (PVM), mà là cả hai có sẵn miễn phí trên Internet. Chúng tôi sử dụng cả hai hệ thống trong SouperComputer đá.
Nhiều cụm Beowulf là đồng nhất, với tất cả các máy tính có chứa các thành phần giống hệt nhau và các bộ vi xử lý. Thống nhất Điều này giúp đơn giản hoá việc quản lý và sử dụng cluster nhưng không phải là một yêu cầu tuyệt đối. SouperComputer đá của chúng tôi sẽ có một kết hợp của các loại bộ vi xử lý và tốc độ vì chúng tôi có ý định sử dụng chúng ta có thể tìm thấy thiết bị bất cứ điều gì dư thừa. Chúng tôi bắt đầu với các máy tính có chứa bộ vi xử lý Intel 486 nhưng sau đó chỉ Pentium dựa trên máy với ít nhất 32 MB RAM và 200 MB dung lượng đĩa cứng.
Đây là hiếm hoi mà máy đáp ứng tiêu chuẩn tối thiểu của chúng tôi khi đến, thường là chúng ta phải kết hợp các thành phần tốt nhất từ một số máy tính.Chúng tôi thiết lập tương đương với kỹ thuật số của cửa hàng chop một tên trộm ô tô để chuyển đổi máy tính thặng dư vào các nút cho cluster của chúng tôi. Bất cứ khi nào chúng tôi đã mở một máy, chúng tôi cảm thấy cùng một sự dự đoán rằng một đứa trẻ cảm thấy khi mở một món quà sinh nhật: máy tính có một đĩa lớn, rất nhiều bộ nhớ hoặc (tốt nhất của tất cả) một bo mạch chủ nâng cấp tặng cho chúng ta một cách tình cờ? Thường thì tất cả chúng tôi tìm thấy là một cựu chiến binh già mệt mỏi với một fan hâm mộ nghẹn ngào với bụi.
Phòng của chúng tôi tại Oak Ridge đã trở thành một nhà xác đầy xác hái trên các máy tính cá nhân đã chết. Một khi chúng ta mở một máy, chúng tôi ghi nhận nội dung của nó trên một "tag ngón chân để tạo điều kiện thuận lợi cho việc khai thác các bộ phận của nó sau này. Chúng tôi phát triển thương hiệu yêu thích và ưa thích nhất, các mô hình và các trường hợp và trở nên lão luyện trong việc cản trở các mật khẩu còn lại do chủ sở hữu trước đó.Trung bình, chúng tôi đã thu thập và xử lý khoảng năm máy tính để làm cho một nút tốt.
Như mỗi nút mới gia nhập các cụm, chúng tôi nạp hệ điều hành Linux vào máy. Chúng tôi sẽ sớm tìm ra cách để loại bỏ sự cần thiết phải cài đặt một bàn phím hoặc theo dõi cho mỗi nút. Chúng tôi tạo ra "tai nạn xe" di động có thể được bánh và cắm vào một nút chưa đủ mạnh để xác định những gì là sai với nó. Cuối cùng một người nào đó, những người muốn không gian trong phòng của chúng tôi mua kệ để củng cố bộ sưu tập của chúng ta về phần cứng. SouperComputer đá chạy mã đầu tiên vào đầu năm 1997, và tháng 5 năm 2001 có 133 nút, trong đó có 75 máy tính với bộ vi xử lý Intel 486, 53 nhanh hơn dựa trên máy Pentium và năm vẫn còn nhanh hơn các máy trạm Alpha, được thực hiện bởi Compaq.
Nâng cấp lên SouperComputer đá đơn giản: chúng tôi thay thế các nút chậm nhất đầu tiên. Mỗi nút chạy một thử nghiệm tốc độ đơn giản, mỗi giờ là một phần của nhiệm vụ vệ sinh thường xuyên của cụm. Bảng xếp hạng của các nút bởi tốc độ giúp chúng tôi tinh chỉnh cụm của chúng tôi. Không giống như các máy thương mại, hiệu suất của SouperComputer đá liên tục được cải thiện, bởi vì chúng ta có một nguồn cung cấp vô tận của nâng cấp miễn phí.

COMPUTING các CLUSTER tại Bảo tàng Lịch sử tự nhiên tại thành phố New York Hoa Kỳ có 560 bộ vi xử lý Pentium III. Các nhà nghiên cứu sử dụng hệ thống để nghiên cứu sự tiến hóa và hình thành sao.

Lập trình song song đòi hỏi kỹ năng và sự sáng tạo và có thể có nhiều thách thức hơn so với lắp ráp phần cứng của một hệ thống Beowulf. Mô hình phổ biến nhất cho lập trình Beowulf cụm là một sắp xếp master-slave. Trong mô hình này, một trong những hành vi nút như là bậc thầy, chỉ đạo các tính toán được thực hiện bởi một hoặc nhiều tầng của các nút nô lệ. Chúng tôi chạy cùng một phần mềm trên tất cả các máy trong SouperComputer đồ đá, với các phần riêng biệt của mã dành cho các nút chủ và nô lệ. Mỗi bộ vi xử lý trong cluster thực hiện chỉ có phần thích hợp. Các lỗi lập trình có thể có tác động đáng kể, kết quả trong một tai nạn xe lửa kỹ thuật số như sự sụp đổ của một nút bị trật bánh những người khác. Phân loại thông qua các đống đổ nát để tìm ra lỗi có thể là khó khăn.
Một thách thức khác là cân bằng khối lượng công việc xử lý giữa các máy tính của cụm. Bởi vì SouperComputer đá có chứa một loạt các bộ vi xử lý với tốc độ rất khác nhau, chúng tôi không thể phân chia khối lượng công việc đồng đều giữa các nút: nếu chúng ta đã làm như vậy, các máy nhanh hơn sẽ ngồi nhàn rỗi trong thời gian dài như họ chờ đợi cho các máy chậm hơn để kết thúc chế biến.
Thay vào đó, chúng tôi phát triển một thuật toán lập trình cho phép các nút chính để gửi dữ liệu đến các hạch nô lệ nhanh hơn khi họ hoàn thành nhiệm vụ của mình. Trong sắp xếp cân bằng tải, máy tính nhanh hơn hầu hết công việc, nhưng các máy chậm hơn vẫn đóng góp vào hiệu suất của hệ thống.
Bước đầu tiên của chúng tôi trong việc giải quyết các vấn đề lập bản đồ vùng sinh thái là tổ chức số lượng lớn dữ liệu - 25 đặc điểm môi trường của 7,8 triệu tế bào của lục địa Mỹ
Chúng tôi tạo ra không gian 25 chiều, trong đó mỗi chiều đại diện cho một trong các biến (nhiệt độ trung bình, lượng mưa, đặc trưng đất và như vậy).Sau đó, chúng tôi xác định mỗi tế bào với các điểm thích hợp trong không gian dữ liệu. Hai điểm gần nhau trong không gian dữ liệu này, theo định nghĩa, đặc điểm tương tự và do đó được phân loại trong cùng một vùng sinh thái. Địa lý gần gũi không phải là một yếu tố trong các loại phân loại, ví dụ, nếu hai đỉnh núi có môi trường rất giống nhau, điểm của họ trong không gian dữ liệu rất gần với nhau, ngay cả khi các đỉnh núi là hàng ngàn dặm ngoài.
Một khi chúng tôi tổ chức dữ liệu, chúng ta phải xác định số lượng các vùng sinh thái sẽ được hiển thị trên bản đồ quốc gia. Cụm máy tính cho từng vùng sinh thái một "vị trí hạt giống" đầu tiên trong không gian dữ liệu. Đối với mỗi người trong số 7,8 triệu điểm dữ liệu, hệ thống xác định vị trí hạt giống gần nhất và giao điểm với các vùng sinh thái tương ứng.
Sau đó, nhóm tìm thấy các trọng tâm cho mỗi vùng sinh thái - vị trí trung bình của tất cả các điểm được chỉ định cho khu vực. Trọng tâm này thay thế vị trí hạt giống như là điểm xác định cho vùng sinh thái.
Cluster sau đó lặp đi lặp lại các thủ tục, giao lại các điểm dữ liệu cho các vùng sinh thái tùy thuộc vào khoảng cách từ centroids. Vào cuối mỗi lần lặp, vị trí trọng tâm mới được tính cho mỗi vùng sinh thái. Quá trình này tiếp tục cho đến khi ít hơn so với một số quy định của điểm dữ liệu thay đổi tập vùng sinh thái của họ. Sau đó phân loại là hoàn tất.
Nhiệm vụ lập bản đồ là rất thích hợp cho xử lý song song bởi vì các nút khác nhau trong cluster có thể làm việc độc lập trên một phần nhỏ của 7,8 triệu điểm dữ liệu.
Sau mỗi lần lặp các nút nô lệ gửi các kết quả tính toán của họ đến nút tổng thể, trung bình số lượng từ tất cả các tập con để xác định các vị trí trọng tâm mới cho mỗi vùng sinh thái. Các nút chủ sau đó gửi thông tin này về các nút nô lệ cho vòng tiếp theo của tính toán.
Xử lý song song cũng hữu ích cho việc lựa chọn các vị trí hạt giống tốt nhất cho các vùng sinh thái ở đầu của thủ tục. Chúng tôi đã nghĩ ra một thuật toán cho phép các nút trong SouperComputer đá để xác định tập các điểm dữ liệu phân tán rộng rãi nhất, mà sau đó được chọn là vị trí hạt giống. Nếu cluster bắt đầu với vị trí hạt giống tốt, phân tán, lặp đi lặp lại ít hơn cần thiết để lập bản đồ các vùng sinh thái.
Kết quả của tất cả các công việc của chúng tôi là một loạt các bản đồ của nước Mỹ cho thấy mỗi vùng sinh thái trong một màu sắc khác nhau. Chúng tôi sản xuất bản đồ hiển thị các quốc gia chia thành ít nhất là bốn vùng sinh thái và khoảng 5.000. Các bản đồ với các vùng sinh thái ít hơn chia cắt đất nước thành các khu nhận ra - ví dụ, quốc gia Rocky Mountain và sa mạc phía Tây Nam. Ngược lại, các bản đồ với hàng ngàn của vùng sinh thái là phức tạp hơn nhiều hơn bất kỳ phân loại trước đó của môi trường của đất nước. Bởi vì nhiều loài thực vật và động vật sống chỉ có một hoặc hai vùng sinh thái, bản đồ của chúng tôi có thể hữu ích cho các nhà sinh thái học nghiên cứu các loài có nguy cơ tuyệt chủng.
Trong các bản đồ đầu tiên của chúng tôi, các màu sắc của các vùng sinh thái được phân phối ngẫu nhiên, nhưng sau đó chúng tôi sản xuất bản đồ, trong đó màu sắc của các vùng sinh thái này phản ánh sự giống nhau của môi trường tương ứng của họ. Chúng tôi thống kê kết hợp chín của các biến môi trường vào ba đặc tính hỗn hợp, mà chúng đại diện trên bản đồ với mức độ khác nhau của màu đỏ, xanh lá cây và màu xanh. Khi bản đồ được vẽ theo cách này, nó cho thấy tỷ lệ hao hụt của màu sắc thay vì các đường viền sắc nét: khu vực Đông Nam tươi tốt là chủ yếu là màu xanh lá cây, vùng Đông Bắc lạnh chủ yếu là màu xanh, và phương Tây khô cằn chủ yếu là màu đỏ.
Hơn nữa, SouperComputer đá đã có thể hiển thị các vùng sinh thái ở Mỹ sẽ thay đổi nếu có những thay đổi trên toàn quốc trong điều kiện môi trường như là kết quả của sự nóng lên toàn cầu. Sử dụng hai kịch bản khí hậu dự kiến phát triển bởi nhóm nghiên cứu khác, chúng tôi so sánh các bản đồ vùng sinh thái hiện tại với các bản đồ dự báo cho năm 2099. Theo những dự báo, vào cuối thế kỷ này môi trường ở Pittsburgh sẽ được nhiều hơn như của Atlanta ngày nay, và điều kiện ở Minneapolis sẽ giống như những người ngày nay St Louis.

Trên tất cả, khái niệm Beowulf là một FORCE nâng cao vị thế.

Các biện pháp truyền thống về hiệu suất siêu máy tính là chuẩn tốc độ nhanh như thế nào hệ thống chạy một chương trình tiêu chuẩn. Là nhà khoa học, tuy nhiên, chúng tôi muốn tập trung vào việc làm thế nào hệ thống có thể xử lý các ứng dụng thực tế. Để đánh giá SouperComputer đá, chúng tôi cho ăn cùng một vấn đề lập bản đồ vùng sinh thái để ORNL của Intel Paragon siêu máy tính ngay trước khi nó được nghỉ hưu. Tại một thời gian, máy tính này là nhanh nhất của phòng thí nghiệm, với một hiệu suất cao điểm là 150 gigaflops. Trên một cơ sở cho mỗi bộ vi xử lý, thời gian chạy trên Paragon là về cơ bản giống như trên SouperComputer đá. Chúng tôi đã không bao giờ chính thức tốc độ cụm của chúng tôi (chúng tôi là miễn cưỡng để ăn cắp các chu kỳ tính toán từ công việc thực tế), nhưng hệ thống có hiệu suất cao điểm lý thuyết của khoảng 1,2 gigaflops. Sự khéo léo trong thiết kế thuật toán song song là quan trọng hơn tốc độ sống hoặc năng lực trong khoa học trẻ này, David và Goliath (hay Beowulf và Grendel) vẫn cạnh tranh trên một sân chơi bình đẳng.
Xu hướng Beowulf đã tăng tốc kể từ khi chúng tôi xây dựngSouperComputer đá. Cụm mới với những cái tên kỳ lạ - Grendel, Naegling, Megalon, Brahma, Avalon, Medusa và Hive , Đề cập đến chỉ là một vài - đã dần dần lớn lên các đường cong hiệu suất bằng cách cung cấp tốc độ cao hơn với chi phí thấp hơn. Tính đến cuối tháng mười một, 28 cụm máy tính cá nhân, máy trạm hoặc máy chủ trên danh sách 500 máy tính nhanh nhất thế giới.
Los Lobos nhóm tại Đại học New Mexico có 512 Intel Pentium III bộ vi xử lý và hệ thống 80-nhanh nhất trên thế giới, với một hiệu suất của 237 gigaflops. Cụm Cplant tại Phòng thí nghiệm quốc gia Sandia có 580 bộ xử lý Compaq Alpha và được xếp hạng 84. Quỹ Khoa học Quốc gia vàBộ Năng lượng Mỹ đang có kế hoạch để xây dựng các cụm thậm chí còn tiên tiến hơn có thể hoạt động trong phạm vi teraflop (1000000000000 tính dấu phẩy động mỗi giây), sánh với tốc độ của siêu máy tính nhanh nhất trên hành tinh.
Beowulf hệ thống cũng muscling cách của họ vào thế giới doanh nghiệp. Các nhà cung cấp máy tính lớn đang bán các cụm cho các doanh nghiệp có nhu cầu lớn tính toán, ví dụ, IBM đang xây dựng một cụm 1.250 máy chủ choNutec Khoa học, một công ty công nghệ sinh học có kế hoạch sử dụng hệ thống để xác định gen gây bệnh.
Một xu hướng quan trọng không kém là sự phát triển của các mạng máy tính cá nhân đóng góp sức mạnh xử lý của họ một công việc tập thể. Một ví dụ là SETI @ home, một dự án đưa ra bởi các nhà nghiên cứu tại Đại học California tại Berkeley, những người đang phân tích các tín hiệu vô tuyến không gian sâu, các dấu hiệu của cuộc sống thông minh. SETI @ home gửi các khối dữ liệu qua Internet tới hơn 3.000.000 máy tính cá nhân, xử lý dữ liệu tín hiệu vô tuyến trong thời gian nhàn rỗi của họ. Một số chuyên gia trong ngành công nghiệp máy tính dự đoán rằng các nhà nghiên cứu cuối cùng sẽ có thể để khai thác vào "tính toán lưới" sẽ làm việc giống như một lưới điện: người dùng sẽ có thể có được sức mạnh xử lý cũng dễ dàng như bây giờ họ nhận được điện.
Trên tất cả, khái niệm Beowulf là một lực lượng nâng cao vị thế. Nó wrests tính toán cấp cao từ vài đặc quyền đặc lợi và làm cho chi phí thấp hệ thống xử lý song song cho những người có nguồn lực khiêm tốn. Các nhóm nghiên cứu, các trường trung học, cao đẳng hoặc các doanh nghiệp nhỏ có thể xây dựng hoặc mua các cụm Beowulf riêng của họ, thực hiện lời hứa của một siêu máy tính trong mọi tầng hầm. Nếu bạn quyết định tham gia vào giai cấp vô sản xử lý song song, xin vui lòng liên hệ với chúng tôi qua trang web của chúng tôi và cho chúng tôi biết về kinh nghiệm xây dựng Beowulf của bạn.Chúng tôi đã tìm thấy Soup đá nồng nhiệt thực sự.

[Biên tập viên của Lưu ý: Hargrove làm việc trong vật lý tính toán và bộ phận kỹ thuật tại Phòng thí nghiệm quốc gia Oak Ridge tại Tennessee. Ông là một nhà sinh thái học cảnh quan. Hoffman, chuyên gia máy tính trong việc phân chia khoa học môi trường tại ORNL. Trong thời gian rảnh rỗi của mình, ông xây dựng siêu máy tính trong tầng hầm của ông. Sterling, người đã tạo ra các cụm Beowulf đầu tiên, trong khi tại Trung tâm NASA Goddard Space Flight. Ông là CalTech của Trung tâm Nghiên cứu máy tính nâng cao và là một nhà khoa học tại Phòng thí nghiệm Jet Propulsionchính. Trang web này có thể được truy cập tại: [ http://stonesoup.esd.ornl.gov/ ].