Gene Nmag_3337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_3337
Symbol
ID	8826202
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	+
Start bp	3468641
End bp	3469795
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	66%
IMG OID
Product	MaoC domain protein dehydratase
Protein accession	YP_003481449
Protein GI	289582983
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.191953
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTAAAG AGCCACAACG GGATTCCGAC ACCGACACCG ACACCGGGAG CGGAGAGCAA 
CCCGAACCGC GACCGATCGA CTGGACCGAT CCCGACACGT TTGCACAGGC ACTCGAACAG 
GTCGAGACGA AGGAGAAGGG CAACTACTTC GAGGACTTCT CGGAAGGCGA CCTCCTCGAA 
CACGACCCCG GGCTCACGCT CACCCGCTGG GGGAACGAGT CATGGATGAG CCAGACGCTC 
AACCACGACC CGGCCTACTG GCGCGCCGAC GCCGCCGCGG AGCGCGGCTT CGACGAACCG 
CCGATCCATC CGGACTATCT CACCGCTGCC ACGCTCGGCA TCACTGTCGA GGACCTGAGC 
GAGAAAGGAG GCTACTTCCT CGGCCGGACA GACGTTCGGT TCCCTGGCAC GCCGGTCTAC 
GCCGGTACCG AACTGCACGT CGAAAGCGAG GTCGTCTCGA CGGCGACCTC GAGTTCCCGT 
CCCGAGTTCG GCATCGTGAC GTGGCGAACG CGCGGCACCG ACGCCGAGAC TGGTGACGTG 
CTCTGCTCGT ACGAGCGGAC GAACATGATT CCGCGGCGAG AGCCGGTTGC GACGGACGGC 
GGCGGGAGTG CTGCAACGGC CGACGCCGAC GCAAACGGCG ACAACACCCC TGCGCTCCCC 
GAAACGTTCG TCACCCCCGA CGGCGGCTAC TTCGAGGATT TCGTGGCTGC ACTCGAGACG 
GCCGAGGGAG ACGACGAGAA CGCCGCAGTT GCCTATCGCC ACGAGCGCGG CCGTACGCAG 
GACGACGTAA CCGTCGCCTC GCTCCCGCTC GCGACGCTGA ACACGGCCAA ACAGCACCAC 
AACATCGACG TGATGGCCGA CTCGCCGTCG GGCGATATCG TCACCTACGG CGACGTGACC 
CGATCGACCG CGCTTGGCCA CGCGCGCTCG GACGAACAGA CCTGGCGCGA GGTCGGCTTC 
GACGACGAGC AGTTCCACAC GTTCGTCGCG GCCGGCGACA CCGTCTACGC GTTCACGCGC 
GTCCTCGACG CCGAAGACGA TGCGTCCACC GACGCAGCGG GAACGGTCCG GTTCGAACAC 
ATCGCGTTCA ACCAGGACGA CGAACCCGTC TACTCGGGAA CCAGAACAGC GGAAATCCAG 
AAGCGCACAG CCTAA

Protein sequence

MTKEPQRDSD TDTDTGSGEQ PEPRPIDWTD PDTFAQALEQ VETKEKGNYF EDFSEGDLLE 
HDPGLTLTRW GNESWMSQTL NHDPAYWRAD AAAERGFDEP PIHPDYLTAA TLGITVEDLS 
EKGGYFLGRT DVRFPGTPVY AGTELHVESE VVSTATSSSR PEFGIVTWRT RGTDAETGDV 
LCSYERTNMI PRREPVATDG GGSAATADAD ANGDNTPALP ETFVTPDGGY FEDFVAALET 
AEGDDENAAV AYRHERGRTQ DDVTVASLPL ATLNTAKQHH NIDVMADSPS GDIVTYGDVT 
RSTALGHARS DEQTWREVGF DDEQFHTFVA AGDTVYAFTR VLDAEDDAST DAAGTVRFEH 
IAFNQDDEPV YSGTRTAEIQ KRTA