Gene Moth_2302 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2302
Symbol
ID	3831334
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2417534
End bp	2419048
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	57%
IMG OID	637830222
Product	glucose-6-phosphate 1-dehydrogenase
Protein accession	YP_431132
Protein GI	83591123
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0364] Glucose-6-phosphate 1-dehydrogenase
TIGRFAM ID	[TIGR00871] glucose-6-phosphate 1-dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.00258738
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCCGG ATCGGTTGGA CAACAGCTTG CTGGTGATCT TTGGCGGCAC GGGGGACCTC 
GCCCGGCGCA AGCTTTACCC GGCTTTATTC AACCTTTTTG TCGATGGTTT CCTGCCGCCG 
GCTCTTGGGG TAATAGCTGT GGGCCGGTGC GGTTTTACCC GGGATAGCTT CCGGCAGGAG 
ATATTACTGC CGTCCCTGGA GACCTTTTCC CGCCGCGCCG CTTCCCTGGA CGCCTATTTT 
GAGCCCTTTG CCACCCGTTT GCACTATTTC CGAACCGACA TTTATGACCC GGAGGGATAT 
ACCCGCCTGG GACAGTTCCT GGTGGAACTG GAGGAGGCGG CGGGCTCCCG GGGCAACCGC 
ATTTTTTACC TGGCCGTGGC CCCGGAACAC TTTGGCCCCG TAATCCGGAG CTTAAAGGAA 
ACAGGCCTGG TACCAGCGCG GGGCTGGCAG CGGGTCGTTA TTGAGAAACC CTTCGGCCAT 
GACCTGCCTT CGGCGACAGA ATTAAACCGC CAGCTGCGGG AGGCTTTCAG CGAAGAAGAG 
ATTTACCGCA TTGACCATTA CCTGGGGAAA GAAATGATCC AGAACATCAT GGTCATCCGC 
TTTGCCAATA CTTTTTTTGA ACCGGTCTGG AATAATAAAT ATATCGACCA CGTCCAAATT 
ACTTCGGCGG AAACGGTGGG TGTGGAGAAC CGGGGCGGCT ACTACGACCG CGCCGGGGCG 
CTGCGGGACA TGGTCCAGAA CCACCTCCTG CAACTGGTGA CTTTGGTGGC CATGGAACCA 
CCGGCCAGCC TGGCCACTGA AGCTATTCGC GATGAAAAGG TAAAGGTGCT ACGTTCTTTG 
AAACCCCTGG ATGCGGCGGC AGTCAGCAAG AACGCCATCC GCGGCCAGTA CGGTGCCGGG 
GAGATAGATG GGCAGATGGT GCCGCCTTAC CGCCAGGAAA AGGAAGTGGC CCCTGATTCC 
ACGACGGAAA CGTTTGTCGC TTTAAAGCTT TTCATAGATA ACTTCCGCTG GGCCGGCGTG 
CCCTTTTACC TGCGTACGGG CAAGCGCCTG CCGCTTAAAG TGACGGAAAT TATCCTCCAG 
TTTAAATCCC TGCCGGATAT CCTGTATTTT AAGGAATACG GTGAATTACG CCCCAATCTC 
CTGGTCATCC GCGTCCAGCC CCTGGAAGGC GTCTACGTTC AGCTCAATGC CAAGCGGCCG 
GGGAATAATA ATTACATCGT ACCCATCCGC CTGGATTTTT GCCAGAATTG TGAGGTGGGG 
GTTAATTCCC CCGAGGCCTA TGAGCGCCTG CTTTATGATG TAATGCGGGG GGACCCTACC 
CTTTTCACCC GCTGGGATGA GGTGGAGGCG GCCTGGAAGT TTGTCGATCC CATATCGGCC 
GCGTGGGCGG CTCAGGGGCA GCCGCAATTT CCCAATTACG CCGCCGGCCA GTGGGGGCCG 
CCAGCGGCCC AGAGACTATT AATTTGCGAT GCTCGCCGCT GGTGGGAGGA AAATGGAGCA 
GAATCGATTT CTTAA

Protein sequence

MAPDRLDNSL LVIFGGTGDL ARRKLYPALF NLFVDGFLPP ALGVIAVGRC GFTRDSFRQE 
ILLPSLETFS RRAASLDAYF EPFATRLHYF RTDIYDPEGY TRLGQFLVEL EEAAGSRGNR 
IFYLAVAPEH FGPVIRSLKE TGLVPARGWQ RVVIEKPFGH DLPSATELNR QLREAFSEEE 
IYRIDHYLGK EMIQNIMVIR FANTFFEPVW NNKYIDHVQI TSAETVGVEN RGGYYDRAGA 
LRDMVQNHLL QLVTLVAMEP PASLATEAIR DEKVKVLRSL KPLDAAAVSK NAIRGQYGAG 
EIDGQMVPPY RQEKEVAPDS TTETFVALKL FIDNFRWAGV PFYLRTGKRL PLKVTEIILQ 
FKSLPDILYF KEYGELRPNL LVIRVQPLEG VYVQLNAKRP GNNNYIVPIR LDFCQNCEVG 
VNSPEAYERL LYDVMRGDPT LFTRWDEVEA AWKFVDPISA AWAAQGQPQF PNYAAGQWGP 
PAAQRLLICD ARRWWEENGA ESIS