Gene Nmag_2031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_2031
Symbol
ID	8824874
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	+
Start bp	2067258
End bp	2069180
Gene Length	1923 bp
Protein Length	640 aa
Translation table	11
GC content	66%
IMG OID
Product	helicase c2
Protein accession	YP_003480163
Protein GI	289581697
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACTCAGA CGGTGAACCC CGAGCGGATC TTCGACGCCT TTCCCGCGCC CAGCTACCGC 
GGGAACCAGG AGCAGGCCCT CCGCGACATT CGTGACGCCT TCGCGGCCGG CAACGATGTC 
GTCCTCGTGC GCGCACCCAC CGGGAGCGGC AAGTCCCTTC TCGCACGGTC CGTCGCCGGC 
TGTGCCCGAA CGATCGACGA GGCGGAGCCG AGCGAGGCCG CCGGGGCCTA CTACACGACC 
CCGCAGGTCT CACAGCTCGA CGACGTCGCC TCGGACGACC TGCTCGCCGA TTTGAACGTC 
ATCCGCGGCA AGTCGAACTA CACCTGTATC CTCCCCCAGG AGCGCAATAC GCCGGTCAAC 
CAGGCACCCT GCGTCCGCGA ACGGGGCTAT GACTGCTCGG TCCAGCATCG CTGTCCGTAC 
TTTTCGGACC GTGCAATCGC CTCGAATCGC TCGATTGCGG CGATGACCCT CGCGTACTTC 
ATGCAGACTG CGGGTAGCGA GGTCTTTCGC AAACGCGACG TCGTCGTCAT CGACGAGGCA 
CACGGTCTCG CCGAGTGGGC GGAGATGTAC GCGACGATCC AGCTTGGGCC GCGAACCGTC 
CCGTTCTGGG ACGACCTCCG TGTGCCGCAA ATCGACAGTA TCGAACGGGC CGTCCGCTAC 
GCCGAGAACC TCGAGCAGAC CTGTACCCGT CGCAAGGACG ACCTGCTCGC ACAGGAGACG 
CTCTCGCCTC GCGAGGTCCG CGAACGCGAC CGGCTGCAGG AGCTGATCGG CGAACTCGAC 
TGGTTCGTCT CGGACTTTCG GGACCCACAG AGTCCGACGA CGTGGTTGGT CGACCAGTCC 
GAGCGGAACG CAGCCAGTAC GGACGACGAG ACCGACGACG AGGAACTCGG CGGTCCCCTG 
ACCATCAAGC CGATGAACCC CGAGAAGTAC CTCGCCCACA CCGTCTGGGA CCGAGGCAAC 
AAGTTCGCGC TCCTCTCGGC GACCATCCTC AACAAGGCGG CCTTCTGCCG GCAGGTCGGG 
CTCAATCCTG ACGACGTCGC GCTCGTCGAC GTCAGCCACA CCTTCCCCGT CGAAAACCGG 
CCGCTGTACG ACGTCACCCA GGGGAAAATG ACCTACGAGC ACCGTGACGA GACGACGCCG 
GACATCGCCC GTACCATCGT CCGGCTCATG CAGCGCCACC CCGACGAGAA GGGGCTGATT 
CACGCCCACT CCTACAACAT TCAGGAGCGA CTCGCCGACC TCCTGCGCGA TTTCGGCGTC 
GGCGAGCGTA TTCGCGTCCA CGACCGCGAC GGCCGCGACG CCGACTTAGA GGAGTGGAAA 
GCCAGCGACG ACCCCGACGT GTTTATCTCC GTGAAGATGG AGGAAGCGCT CGACCTCAAG 
GGCGACCTCT GTCGCTGGCA GGTGCTCTGT AAGGCCCCCT ACCTCAACAC CGGCGACTCG 
CGCGTCGCCC ACCGACTCGA GGAAGGCCAG TGGGCGTGGT ACTACCGGAC CGCGCTGCGA 
ACCATCATCC AGGCCTGCGG CCGCGTCGTC CGCGCCCCCG ACGACCACGG CGCGACGTAC 
CTCGCGGACT CGAGTCTCCT CGATCTTTTC GAGCGCGCGC GAACGGACAT GCCCGACTGG 
TTCGCAGCGC AGGTCGACCG CATGTCGACG CCCGAGTTGC CGGCGTTCGA TCCACAGGCG 
GCGTGTGACT CGTCCGGACC GGGTGGCCGG CGCGGCTCTG GTCGTGGTGG TGGCTCGGGC 
AGGGACTCGA GTACAAGTGG GTCACAATCC GAGTCACCGG GTCAGTCTGC AACTGGGTCG 
GATTCGGGGA GTGCGTACAC GCGCTCTCGG TCTCGGTCTG GTTCTCGCTC GCGCTCACAG 
TCGGGGTCGT CGAAAGACTC ATCATCGAGT CCGCTCGCAG ATGTCTGGGA TACGGACGGC 
TAA

Protein sequence

MTQTVNPERI FDAFPAPSYR GNQEQALRDI RDAFAAGNDV VLVRAPTGSG KSLLARSVAG 
CARTIDEAEP SEAAGAYYTT PQVSQLDDVA SDDLLADLNV IRGKSNYTCI LPQERNTPVN 
QAPCVRERGY DCSVQHRCPY FSDRAIASNR SIAAMTLAYF MQTAGSEVFR KRDVVVIDEA 
HGLAEWAEMY ATIQLGPRTV PFWDDLRVPQ IDSIERAVRY AENLEQTCTR RKDDLLAQET 
LSPREVRERD RLQELIGELD WFVSDFRDPQ SPTTWLVDQS ERNAASTDDE TDDEELGGPL 
TIKPMNPEKY LAHTVWDRGN KFALLSATIL NKAAFCRQVG LNPDDVALVD VSHTFPVENR 
PLYDVTQGKM TYEHRDETTP DIARTIVRLM QRHPDEKGLI HAHSYNIQER LADLLRDFGV 
GERIRVHDRD GRDADLEEWK ASDDPDVFIS VKMEEALDLK GDLCRWQVLC KAPYLNTGDS 
RVAHRLEEGQ WAWYYRTALR TIIQACGRVV RAPDDHGATY LADSSLLDLF ERARTDMPDW 
FAAQVDRMST PELPAFDPQA ACDSSGPGGR RGSGRGGGSG RDSSTSGSQS ESPGQSATGS 
DSGSAYTRSR SRSGSRSRSQ SGSSKDSSSS PLADVWDTDG