Gene Nmag_3000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_3000
Symbol
ID	8825860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	+
Start bp	3089784
End bp	3090950
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	64%
IMG OID
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_003481114
Protein GI	289582648
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCTCGC CGGCGATTCG CGACAGGACA GTACTCGTCA CCGGCGGTGG CGGCTTCATC 
GGGAGCCACC TCGTCGAGGC GCTGGCACCG TACAACGATG TCCGCGTACT GGATAACTTC 
TCGACCGGTT CGCGGGACAA TCTCTCGTCG GTGACCAGTC CGCAGTGGAC CAACGATGCG 
CCGACAAGTG CGGATGGTGG GTTCGACGAC GCTGGAGGCG GCGGAGACGC TGGAGACGCC 
GGAGACGCTG GAGACGCCAG GTACGACGGC TCGCCCACGA TCATCGACGG AGACATTACC 
GATCCGATGG CCCTCCAGCG CGCCGCTCGC GGCGTCGACC TCATTTTCCA CCAGGCCGCG 
CTCGTTAGCG TCGCCAAGAG CGTCGACGCG CCACGCCGGA GCAACGAGAC CAACCTCGAC 
GCCAGCCTAC TCGTCCTCGA CCAGGCCCGC CAGGAGGACG CCCGCGTCGT CCTCGCCTCG 
AGTGCGGCCG TCTACGGTCA CCCCGACGAA TTACCCGTCT CCGAGACGGC AAGGACGGAG 
CCGACCTCGC CCTACGGCAT TCAGAAGCTC GCACTCGACC AGTACGCTCG CCGCTACCAC 
GAACTATATG ACCTCCCAAC CGTTGCGCTA CGCTATTTTA ACGCGTACGG ACCACGCCAG 
CAGGGCCCCT ACAGCGGCGT CATCTCGACG TTCCTCGAGC AGGCCCGTTC CGACGATCCG 
ATCACGATCG AAGGTGACGG CGAGCAGACG CGAGACTTCG TCCACGTTTC AGATGTCGTC 
CGTGCAAACA TCCGCGCTGC GACGACTGAC GCCGTCGGCG AGGCCTACAA CGTCGGTACC 
GGAGACCGGA CCTCGATCCG GGACCTCGCC GAACTCGTTC GCGACGCCGT TGGTTCGTCC 
TCGCCAATCG TCCACCGTGA GCCTCGTCCG GGCGATATCA GACACAGTCG TGCAGATGTT 
TCGAAAGCGA GTCGCGAACT CGGCTTCGAG ACCCGCGTCG GTCTCGAGTC CGGGATTCGA 
TCGCTTGTCG CTGAGACTGG GAGTGAACAG GGGCGTTCGA CTTCGCCTCC GCAGGAACAA 
GGACAGGGAC AGGGACAGGG ACAGCAACAG CAACAGCAAC AGCAACAGCC ACTGACCGCC 
AGACCAGAGC GACAGTCACA GGACTAG

Protein sequence

MTSPAIRDRT VLVTGGGGFI GSHLVEALAP YNDVRVLDNF STGSRDNLSS VTSPQWTNDA 
PTSADGGFDD AGGGGDAGDA GDAGDARYDG SPTIIDGDIT DPMALQRAAR GVDLIFHQAA 
LVSVAKSVDA PRRSNETNLD ASLLVLDQAR QEDARVVLAS SAAVYGHPDE LPVSETARTE 
PTSPYGIQKL ALDQYARRYH ELYDLPTVAL RYFNAYGPRQ QGPYSGVIST FLEQARSDDP 
ITIEGDGEQT RDFVHVSDVV RANIRAATTD AVGEAYNVGT GDRTSIRDLA ELVRDAVGSS 
SPIVHREPRP GDIRHSRADV SKASRELGFE TRVGLESGIR SLVAETGSEQ GRSTSPPQEQ 
GQGQGQGQQQ QQQQQQPLTA RPERQSQD