Gene Moth_1511 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1511
Symbol
ID	3831976
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1555787
End bp	1557709
Gene Length	1923 bp
Protein Length	640 aa
Translation table	11
GC content	61%
IMG OID	637829443
Product	1-deoxy-D-xylulose-5-phosphate synthase
Protein accession	YP_430363
Protein GI	83590354
COG category	[H] Coenzyme transport and metabolism [I] Lipid transport and metabolism
COG ID	[COG1154] Deoxyxylulose-5-phosphate synthase
TIGRFAM ID	[TIGR00204] 1-deoxy-D-xylulose-5-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTGC TAGAAAAAAT CAACGAACCG GCAGCCATAA AAAAATTTAC CCTTGCCGAG 
CTTGATATAC TCGCCAGGGA AATCCGCCAG GAACTGGTCC AGACGGTCGC CCGCACGGGC 
GGTCACCTGG CCCCCAACCT TGGGGTTGTG GAGCTGACCC TGGCCCTGCA CAGCGTCTTT 
GATCTACCCC GGGATAAAAT CATCTGGGAC GTCGGCCACC AGTGCTACGT TCATAAGATC 
CTTACCGGAC GGCGCCAGGA AATGACCAGC CTGCGTCAGT TCGGGGGCCT GAGCGGTTTT 
CCCAAGCGGG CCGAAAGCCC CTACGACGCC TTTGATACCG GGCATAGCAG CACCTCGATC 
TCGGCTGCCC TGGGGATGGC CCTGGCCCGG GACTTAAAGG GAGAAGACTA CCAGGTGGTG 
GCTGTTATCG GCGATGGTGC CCTGACGGGC GGGATGGCTT TCGAAGCCAT GAACCATGCC 
GGCCACCTGC AGGCCAACTT GATTGTTGTC TTAAATGATA ATGAGATGTC TATCGCCCCT 
CCGGTTGGTG GCCTGGCGGC CTATCTTTCC CGCCTGCGGA CGGACCCCAT GTATTCCCGA 
GGTAAGGAAG AGCTGGAGAA TCTTCTCAAC CGGCTCCCCC ATTTAGGTCC CCGGGTGCTC 
AAGGTAATTG ATCGCCTCAA GGACAGCTTT AAATATCTGG TCGTTCCAGG CATGTTTTTC 
GAAGAGATTG GTTTTACCTA CCTGGGGCCC ATTGAAGGTC ACAATATTGC CCGGTTAAAA 
GAGGTCCTCC AGCATGCCCG GAATACCAGA GGCCCGGTCC TGGTACATGT AATTACCACC 
AAGGGGAAGG GTTACCAGCC GGCCGAGGAC CATCCCGACC GCTTCCACGG CATAGGCCCC 
TTTGATCCGG CAACAGGGGA ACCCCTGGCC GGAGGAGGGC CGCCGACCTA CACCTCTGTT 
TTTGGTGCCG AACTGGTGCG CCAGGGGGAA AAGAACAACC GCCTGGTGGC CATAACGGCT 
GCCATGCCCG ATGGCACCGG CCTGACGCCC TTTGCCCGGC GCTTCCCCAA ACGCTTTTTT 
GATGTCGGCA TCGCCGAGCA GCACGCCCTG ACCCTGGCCG CCGGCCTGGC CGCTGCCGGG 
ATGCACCCTG TAGTAGCCAT CTATTCTACT TTTTTACAGC GGGCCATTGA CCAGGTAATC 
CACGATATCG CCTTAATGGA GCTGCCGGTG GTCCTGGCCA TTGACCGGGC CGGCCTGGTA 
GGTGAAGACG GTGAAACCCA CCAGGGTCTC TTTGATGTGT CCCTGTTGCG TTGTGTTCCC 
GGCCTGGTCC TCATGGCACC CAAGGATGAA CAGGAACTGC GCCACATGCT GGTAACCGCC 
CTCCAGTACC AAGGACCGGC GGCGCTGCGC TACCCCCGGG GCGCCGGTAT GGGTGTGCCC 
CTGACGGGAA CGGCCCAGCC TTTGCCCATT GGCAAGGGTG AAGTCCTGCG TCGTGGCCGG 
GATGTCACCA TCCTGGCTCT AGGCCCCCTG GCGTATGCAG CCCTGGAAGC GGCCGGGGAC 
CTGGCAGCCC GGGGTATCGA AGCCACCGTC ATTAATCCCC GGTTTATTAA GCCCCTGGAT 
GAAGACCTGA TCCTCACCTG GGCGGATCGC ACCGGCCATC TGGTGACCGT GGAAGAACAC 
GTCCTGGCCG GGGGCTTTGG CAGCGCCGTT CTGGAACTCC TGGCACGGAA CGGGCGCAAG 
GGTATCCGGG TGCGGTGCCT GGGGGTGAAG GACGAGTTTG TCCACCAGGG TAAACCAGCC 
ATTTTACGGG AACACTTAGG CTTGACTCCG GCCGGGATCA GGGCTGCCGT CCAGGCGCTG 
CTGGCGGAGA CCCCGGTCCT GCACCGGCGG CGCAACCAGA CAAAGGGGAT TTCCGGTGGC 
TAA

Protein sequence

MSLLEKINEP AAIKKFTLAE LDILAREIRQ ELVQTVARTG GHLAPNLGVV ELTLALHSVF 
DLPRDKIIWD VGHQCYVHKI LTGRRQEMTS LRQFGGLSGF PKRAESPYDA FDTGHSSTSI 
SAALGMALAR DLKGEDYQVV AVIGDGALTG GMAFEAMNHA GHLQANLIVV LNDNEMSIAP 
PVGGLAAYLS RLRTDPMYSR GKEELENLLN RLPHLGPRVL KVIDRLKDSF KYLVVPGMFF 
EEIGFTYLGP IEGHNIARLK EVLQHARNTR GPVLVHVITT KGKGYQPAED HPDRFHGIGP 
FDPATGEPLA GGGPPTYTSV FGAELVRQGE KNNRLVAITA AMPDGTGLTP FARRFPKRFF 
DVGIAEQHAL TLAAGLAAAG MHPVVAIYST FLQRAIDQVI HDIALMELPV VLAIDRAGLV 
GEDGETHQGL FDVSLLRCVP GLVLMAPKDE QELRHMLVTA LQYQGPAALR YPRGAGMGVP 
LTGTAQPLPI GKGEVLRRGR DVTILALGPL AYAALEAAGD LAARGIEATV INPRFIKPLD 
EDLILTWADR TGHLVTVEEH VLAGGFGSAV LELLARNGRK GIRVRCLGVK DEFVHQGKPA 
ILREHLGLTP AGIRAAVQAL LAETPVLHRR RNQTKGISGG