Gene Moth_2345 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2345
Symbol
ID	3832063
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2465846
End bp	2467186
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	43%
IMG OID	637830268
Product	major facilitator transporter
Protein accession	YP_431174
Protein GI	83591165
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.205861
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAAGG AAAACAGTAA CAGTAGCCTG ATTACATGGT GGCGTTACCG GTACCTTATT 
GCGAGCATTC TATTTTTTGC ATATAGCATC CAGTACCTGG ATCGGATTAA AACAACAGCC 
CTTATTCCCC TGATTATGGA TAGTATTCAT CTTAGTCACG CCGATGTAGG TAACGGTATT 
TTCTTAATGC TAATTTTTTA TGGACCGTCA CAATTCATTT CAGGGATTAT ATGCGACAAA 
TACGGCGCTA AGAAAGTACT TATCTTTTCA TTGATTGGCT GGAGCCTTCT AACTTTTTGG 
ATGGCATTCT TACAATCCAG GGACGAGTGG TACATCCGGA ACGCCCTTTT TGGAATTTTT 
ATTGGAACTG AATTTATACC TAGTGCCCGC CTTCTTTCAC GGTGGTTCCC ATCACGGCAG 
CGAGCACGGG CTCAAAGCAG TCTTTCCTGG GCTTGGATCC TTACACCGGC ATGGGCTACT 
ATTGTAGCAA CACAGCTTGC TTCATTTTTT GGCAGCTGGC GTCCCGTATT TATAGTGGTT 
GCAATTATTG GCTTAGTTCC CTTGGCATTA ATAATCTGGC TAATTAAAGA CCGTCCAGAA 
CAGGTTAAAC ATCTTTCATT AGCAGAAATA AAGGAAAGTT ACGAGGATGA GATTTCCTCG 
GGCGTAATCT CCAGTGATGA AATTAATAGG AGAGAAGTAT CTACCCAAAC TATCAAAAAG 
GCACAGATCC CCCTCCGTAA TATACTTACT TATCGTGGCT TTTGGGCGAT AGCTTTTGTT 
GATATTGCCT CCCAGATGAT GTACTGGGGA GTTGTATCTT GGTCGCCAAC CTATCTTAAA 
GACGTATTTA AGTTTAGTAT AACAGGGATG GGTTTCTGGG CTTCTATTTA TTTTGCTGCG 
GGTGTATTGG GTGCCTATTT GAGTTCTATT ATCAGTGATA AAGTGATGAA ATCAAAAAGA 
AAACCCATGA TTGTTATTTC CTTTTTAGGC ACCCTTCCTT TTATTGTCAT ATTATCGCAG 
TTGCATTCAG GAGTCAGTCA TGCTGTCATT TTGCTTGTGC TCTCTTGTGC GGGATTCTTT 
GCTAATATGG CCTGGGGCCC CTTCCTTTCC TGGCCGGCGG ACGTTTTTTC TCCTGAGGTT 
TACGGTACTG CCATGGGCTT CGTAAACATG CTGGCATATA TCGGAGGAGC ATTTGCACCC 
TTAATTATGA GCCGCCTAAT CCGTGTAGGC CAGGTTGGCC CCGACTATAC CTATGCTTGG 
ATTTTTATCG CTTGTGCTGC TTTCGTCGGA TTCATTGCTT CCTGCCTTGT AAAGGATAAA 
AAATATAGTC AGGCTAATTA G

Protein sequence

MNKENSNSSL ITWWRYRYLI ASILFFAYSI QYLDRIKTTA LIPLIMDSIH LSHADVGNGI 
FLMLIFYGPS QFISGIICDK YGAKKVLIFS LIGWSLLTFW MAFLQSRDEW YIRNALFGIF 
IGTEFIPSAR LLSRWFPSRQ RARAQSSLSW AWILTPAWAT IVATQLASFF GSWRPVFIVV 
AIIGLVPLAL IIWLIKDRPE QVKHLSLAEI KESYEDEISS GVISSDEINR REVSTQTIKK 
AQIPLRNILT YRGFWAIAFV DIASQMMYWG VVSWSPTYLK DVFKFSITGM GFWASIYFAA 
GVLGAYLSSI ISDKVMKSKR KPMIVISFLG TLPFIVILSQ LHSGVSHAVI LLVLSCAGFF 
ANMAWGPFLS WPADVFSPEV YGTAMGFVNM LAYIGGAFAP LIMSRLIRVG QVGPDYTYAW 
IFIACAAFVG FIASCLVKDK KYSQAN