TXT फ़ाइल को FASTA में कैसे बदलें
प्रोटीन अनुक्रम डेटा का विश्लेषण करने और बीमारियों के लिए उपचार खोजने के लिए नैदानिक अध्ययन किए जाते हैं। प्रोटीन अनुक्रम डेटा को FASTA (फास्ट-ऑल) प्रारूप में रखा जाता है ताकि सॉफ़्टवेयर प्रोग्राम समझ सकें कि डेटा अनुक्रम को कैसे संसाधित किया जाए। FASTA प्रारूप में प्रति अनुक्रम डेटा लाइन में 80 वर्ण तक हैं और IUB/IUPAC (इंटरनेशनल यूनियन ऑफ बायोकैमिस्ट्री/इंटरनेशनल यूनियन ऑफ प्योर एंड एप्लाइड केमिस्ट्री) कोड मानक का उपयोग करता है। एक TXT (सादा पाठ) फ़ाइल को FASTA प्रारूप में बदलने में प्रोटीन अनुक्रम डेटा लाइनों के साथ मौजूदा टेक्स्ट फ़ाइल में FASTA-स्वरूपित अनुक्रम डेटा को संपादित करना या जोड़ना शामिल है। नोटपैड जैसे टेक्स्ट एडिटर प्रोग्राम इसे करना आसान बनाते हैं।
प्रोटीन अनुक्रम टेक्स्ट फ़ाइल खोलें जिसे आप टेक्स्ट संपादन प्रोग्राम जैसे नोटपैड में संपादित करना चाहते हैं।
FASTA प्रारूप का पालन करने के लिए विवरण पंक्ति संपादित करें या जोड़ें। उदाहरण के लिए, >gi|129295|sp|P01013|OVAX_CHICK GENE X PROTEIN (OVALBUMIN-संबंधित) एक मान्य FASTA विवरण पंक्ति है। यह पंक्ति अनुक्रम डेटा लाइनों का अनुसरण करने के लिए एक अद्वितीय विवरण प्रदान करती है। FASTA प्रारूप में प्रतीक (>) से अधिक के उपयोग की आवश्यकता होती है ताकि सॉफ्टवेयर प्रोग्राम अद्वितीय वर्णनात्मक जानकारी की पहचान कर सके और विवरण को प्रोटीन डेटा अनुक्रम लाइन के रूप में संसाधित करने से बच सके।
विवरण पंक्ति संपादित होने के बाद लाइन ब्रेक डालने के लिए "एंटर" कुंजी दबाएं।
IUB/IUPAC मानक कोड के अनुरूप प्रोटीन अनुक्रम डेटा लाइन स्वरूप संपादित करें या जोड़ें। IUB/IUPAC मानक FASTA प्रारूप में अमीनो एसिड या न्यूक्लिक एसिड के लिए स्वीकार्य कोड या क्वेरी अनुक्रमों का प्रतिनिधित्व करने के लिए वर्णमाला के अक्षरों का उपयोग करता है। उदाहरण के लिए, QIKDLLVSSSTDLDTTLVLVNAIYFKGMWKTAFNAEDTREMPFHVTKQESKPVQMMCMNNSFNVATLPAE वैध अनुक्रम डेटा की एक पंक्ति का प्रतिनिधित्व करता है क्योंकि यह ग्लूटामाइन का प्रतिनिधित्व करने वाले "क्यू" अक्षर से शुरू होता है, और ग्लूटामेट का प्रतिनिधित्व करने वाले अक्षर "ई" के साथ समाप्त होता है।
अधिक अनुक्रम डेटा लाइनें जोड़ें, मौजूदा अनुक्रम डेटा लाइनों को संपादित करें या आवश्यकतानुसार 80 वर्णों के बाद लाइन ब्रेक जोड़ें। FASTA अनुक्रम डेटा लाइन मानकों और लाइन ब्रेक का पालन करना सुनिश्चित करता है कि कार्यक्रम ग्लूटामाइन, ग्लूटामेट और अन्य अक्षर कोड से संबंधित निर्देशों का पालन करता है। IUB/IUPAC मानक में अक्षर केवल उस सॉफ़्टवेयर प्रोग्राम के लिए निर्देश हैं जो FASTA स्वरूपित डेटा को संसाधित करता है।
"फ़ाइल" पर क्लिक करें, "सहेजें" चुनें और फिर "सहेजें" बटन पर क्लिक करें। आपकी TXT फ़ाइल अब FASTA प्रारूप में है।