Gene Nmag_3903 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_3903
Symbol
ID	8826773
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013923
Strand	-
Start bp	300155
End bp	301864
Gene Length	1710 bp
Protein Length	569 aa
Translation table	11
GC content	66%
IMG OID
Product	thiamine pyrophosphate protein central region
Protein accession	YP_003482006
Protein GI	289583596
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.567329
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGTCCA CAGCAGCCAC ACTCGTCGAG ACACTCGAGG ACCTCGGCGT CGAGTACGTC 
TTCGGCTACC CGGGCGGCCG CGTGATCGAA CTGTTCGAGG CGGTTCCCGA CGCCGATATC 
GACCTCGTCC GGCCGCGAGA CGAGCGCGAG GCGAGCGTGA TGGCCGAAAT GTACGGCCGG 
CTAACCGGAG ATCCGGGCGT CCTCACCGGG CAGGGGCCGT GGATCGGCAG TATCGGCATG 
ATCGGCCAGA TGGAGGCCCG ACTTGCCTCT TCGCCGATGG TTGTTCTCAC CGAAGCCTCC 
GAGCGCGGCG AGTACTCGAC GCTCGCGCCG TACCAGCAGG CTCGCGGCGA TTACGGTGGC 
TTCAGCCTCC CGGATATCCT CGACGGTGTG AGCAAGGAGT GGTGGTTCCC GCGGACGCCG 
GTCGAGACGA TTCGCTCGAC GCAACTGGCG TTCAAACACG CGGTCGCCGG TCGCTCCGGC 
CCGACAGCAG TTATCCTCGA CGGGAACGCG ATCACTGCTG AGGTTCCCGA GGACCCAACA 
CCCAGAGCCT GGGATGCAGC AGCACAGACG CGGACGTGGG ACGCCGCGCC GACCGCCACC 
GACACCGCGG CAGCGGTGGG CGTACTCGAG TCCGCCGAGC GACCAGTGAT CGTTGCGGGC 
AACGGCGTCC ACGCCGCACA GGCCTACGAC GAACTCGCGG CGGTTGCCGA GACGTACGAC 
TGTGCGGTCG TCACGTCCTA CCTCGGCAAG TCGACCTACC CTGAAACTGA CGAGCGGGCA 
GCGGGCGTTA TCGGCTCCTT CGGCCACGAG GGGGCAAACC GCGTCGTCAG CGAGGCCGAC 
ACGCTGCTGG TCGTTGGGTG CCGGCTGAAC CCAATGGACA CCAACTGGCA GGCGCCCGAG 
TTCATCCGCC CGGACGAGCA GACGATTATC CACGCCGATA TCGACACGCG AAACGCTGGC 
TGGGTCTATC CCGCGGACGT CGGCCTGATC GGTGACGCCG CCGAGACGCT CGCGGTGCTC 
GCCGAGGCAG GTTCGGGAGG CTCGTCGAAC GGGTGGGCAC TCGAGCGCGC CGCCGAGGCT 
CGTGAGTGGT TCGACGCACC CGAGTGTACG GACGATTCGG CACCGATCAA GCCCCAGCGC 
GCTGCGACGG CCATCCAGTC AGTCGTCGAC GAGGACACCA TCGTCACCGC CGACTCGGGG 
AACAACCGCT TCTGGCTGCT GTACTACCTC CAGACGCCCG CCGTCAGAAC CTACTTCGGC 
AGTGGCGGCG TCGGCGGTAT GGGGTGGGCC AACCCCGCTG CGGTGTCTGC GGCGCTCACA 
ACCGACGACG AAACAGACGT CATCGCCGTC GCCGGCGACG GCGGCTTCTC GATGACGATG 
AACAGCGTCG AAACTGCCGT CGAGTACGGC GTCGCGCCCA CGTTCGTCAT TCTGAACGAC 
ACCAGCCTCG GGATGGTCCG CCAGATGCAA CACGAGGATG GCGACATCGC CGGCGTGGAG 
TTCCACGACA CCGACTTCGT CGGCATCGCC GAGGCCTTCG GCGCGGTCGG CAAGCGGGTG 
ACTGAGCCCA GTGAGTTGGC TGGGGTACTC GAGTCCGCCA AGTCGGCGGA CGTGCCACAC 
GTGATCGACG TTCGGATTGA TCGCGAGGAG GATATGGCGG AAACGCTATC GTCGTCGTTC 
TACGAGTCAG TTGGCGGGTT ACACGAGTGA

Protein sequence

MTSTAATLVE TLEDLGVEYV FGYPGGRVIE LFEAVPDADI DLVRPRDERE ASVMAEMYGR 
LTGDPGVLTG QGPWIGSIGM IGQMEARLAS SPMVVLTEAS ERGEYSTLAP YQQARGDYGG 
FSLPDILDGV SKEWWFPRTP VETIRSTQLA FKHAVAGRSG PTAVILDGNA ITAEVPEDPT 
PRAWDAAAQT RTWDAAPTAT DTAAAVGVLE SAERPVIVAG NGVHAAQAYD ELAAVAETYD 
CAVVTSYLGK STYPETDERA AGVIGSFGHE GANRVVSEAD TLLVVGCRLN PMDTNWQAPE 
FIRPDEQTII HADIDTRNAG WVYPADVGLI GDAAETLAVL AEAGSGGSSN GWALERAAEA 
REWFDAPECT DDSAPIKPQR AATAIQSVVD EDTIVTADSG NNRFWLLYYL QTPAVRTYFG 
SGGVGGMGWA NPAAVSAALT TDDETDVIAV AGDGGFSMTM NSVETAVEYG VAPTFVILND 
TSLGMVRQMQ HEDGDIAGVE FHDTDFVGIA EAFGAVGKRV TEPSELAGVL ESAKSADVPH 
VIDVRIDREE DMAETLSSSF YESVGGLHE