Gene Moth_2413 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2413
Symbol
ID	3832164
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2534265
End bp	2535608
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	60%
IMG OID	637830332
Product	major facilitator transporter
Protein accession	YP_431238
Protein GI	83591229
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00000787137
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATTG CCGAGCGTCT GGAACGGTTG CCCTTAAGCG CCTTTCACTA CAAGATGTTA 
TTTATCTGCG GCATCGGCTG GCTTTTTGAC GCCATGGACG TGGGCCTGGT ATCCTTTGTC 
CTGCCGGCGG TGGGTAAAGA ATGGCACTTG ACAGCCACCC AAATGGGCGC CCTGGGCAGC 
ATCGGCCTCC TGGGCATGGG CCTGGGAGCC GTCTTCGGCG GCAGCCTGAG CGACCTCTGG 
GGGCGGAAGC GGGTTTTCAA CTACACCCTG ATCTTCTACG GCCTCGCCAC TTTCCTGGCC 
GGTTTATCCA CCAATTACGC CATGCTCATG GTCCTGCGCT TTCTGGTGGG CCTGGGTTTG 
GGCGCGGAAG TACCGGTGGC CTTCACCCTG GCCAGCGAGT TTTCGCCCGT CCAGTACCGG 
GGGAGGATGG CGGTGCTGCT GGAAAGCTTC TGGGCCTTCG GCTGGATTGC CGCGGCCCTT 
ATCGGTTACC TGGCCGTACC CCACTGGGGC TGGCGTCTGG CCTTCTTTAT CGGCGCCCTG 
CCGGCCCTCT ACGCCGCCGT CCTGCGGCGG GCTTTACCAG AGTCCCCGCG CTATCTAGAG 
AAGATCGGCA AAGAAAGCGA AGCCCGGGCA ATAGTGGAAA GCATAGAAAG AAGCTGCGGC 
GTCGACCCCG GCAAAGTGGC AACCAGCCCG GCGGCGGCAA CAGCCGAAAC GTCCGTCAAA 
GCAACCTTTG CCGACCTCTG GTCCTCACGG TATGCCCGGC GCACCCTCTG CCTGTGGATC 
CTGTGGTTCG GCATTAATTT TTCCTATTAC GGCATTGTCA CCTGGCTGCC CTCCCTGATG 
GTGGGGAAAG GTTTTGCCAT TATCAAGAGC TTTGAGTACG TGCTGATCAT GACCCTGGGA 
CAGGTGCCGG GCTATTTCAG CGCCGCCTAC CTGGTAGAGA AGATCGGCCG CAAAGCCACC 
CTGGTTTCTT ATCTTATCTT AAGCGGCGTG GCGGCCTACA TGTTCTCCTT AAGCACTACC 
ACCAGCCAGA TAATCTGGTG GGGCCTGGCG GTCTACTTCT TTAATCTGGG TGCGTGGGGC 
GTCCTGTACG CCTATACCCC GGAAATGTAC CCGACGGCCA TCCGGGCAAC TGGTTCCGGC 
TGGGCCTCCT TCTGCGGCCG CATAGGCGCC ATCCTGGCAC CGGTGATTGT CGGCCAGATG 
ATCGTGGTTA TGGGCCAGGC AAAAGCCTAC CCGTTGATCT TTGTCCTCTT CACCGCCGTT 
TTTGTGATCA CCGCCCTGGG CATGCTGGCC CTGGGTATTG AAACAAAGGG CAAGACCCTG 
GAGGAACTGG CCGGGATACG CTAA

Protein sequence

MSIAERLERL PLSAFHYKML FICGIGWLFD AMDVGLVSFV LPAVGKEWHL TATQMGALGS 
IGLLGMGLGA VFGGSLSDLW GRKRVFNYTL IFYGLATFLA GLSTNYAMLM VLRFLVGLGL 
GAEVPVAFTL ASEFSPVQYR GRMAVLLESF WAFGWIAAAL IGYLAVPHWG WRLAFFIGAL 
PALYAAVLRR ALPESPRYLE KIGKESEARA IVESIERSCG VDPGKVATSP AAATAETSVK 
ATFADLWSSR YARRTLCLWI LWFGINFSYY GIVTWLPSLM VGKGFAIIKS FEYVLIMTLG 
QVPGYFSAAY LVEKIGRKAT LVSYLILSGV AAYMFSLSTT TSQIIWWGLA VYFFNLGAWG 
VLYAYTPEMY PTAIRATGSG WASFCGRIGA ILAPVIVGQM IVVMGQAKAY PLIFVLFTAV 
FVITALGMLA LGIETKGKTL EELAGIR