Gene Moth_0614 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0614
Symbol
ID	3832589
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	639974
End bp	640969
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	46%
IMG OID	637828555
Product	inner-membrane translocator
Protein accession	YP_429487
Protein GI	83589478
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGGAG CGACCAATAT TTCGAATAGC GCTAAGTTGA AGTATAGCCA TCTGAATAGC 
ATTGTTAAGG AATATAGTTT CATCTTTGTA TTCCTTGCTT TATGTATACT ACTCTCTATA 
CTGGTTCCGA CTTTCCTCTT GCCCCAAAAT TTGTTAAATG TATTGATTCA GATCTCTATC 
AACGCCCTGT TAGCTATAGG TATGACCTTT GTCATTATTT CCGGTGGCAT TGACCTTTCA 
GTGGGTTCAG TAGCAGCACT GGCAGGTATT GTCGTTACGG CTTTGCTTAA ACAGTACCCG 
TCCAGTACGC CGATGATGTA TGTAATAATT ATTTTTAGTG TCCTGGCTGT GGGTATAGTC 
TGTGGCGGTA TCTCCGGCCT GGCAATTGCG AAACTTAATG TCGAACCCTT TATAGCCACC 
CTCGCTATGT TGAGCATCGC CAGGGGGTTT GCCTTCGTTT ACACCCAGAG CAAACCAATT 
TTCGGCTTGC CCCCGGCCTT TAGTTGGATT GGTCAGGGGT ATATTGGCCC TATCCCGGTT 
ATCGTGTTGA TTATGATTTT TTGCCTGGTT ATCGCCCACA TTGTCTTATC AAAAACCTGT 
TTTGGACGTT ATATTTACGC CATCGGGAGC AACGAAGAAG TGGCTAAATT ATGCGGTATT 
AACGTTGCCC GGGTGAAGCT TATTATTTAT GTAATCAGCG GCGTCCTTTC TGCTCTGGGG 
GGAGTCGCTC TGGCGTCCCG TTTAGCAACA GGGCAACCGG CTGCCGCCAG CGGTTACGAG 
CTCAATGCGA TCGCAGCGGT TGTGCTGGGG GGTACCAGCC TTTCCGGAGG TAAGGGCAGT 
ATTGGTAAAA CCATTATCGG CATTATGACC ATTGGCGTTA TTAACAACGG TTTAAGCCTG 
TTGCAAATCT CCTCTTACTG GCAGTCCATT ACCATGGGTT TAATCATTAT GATTGCCGTA 
ATACTGGATA AAATCAACAC CCGTAAGAAA GCCTGA

Protein sequence

MNGATNISNS AKLKYSHLNS IVKEYSFIFV FLALCILLSI LVPTFLLPQN LLNVLIQISI 
NALLAIGMTF VIISGGIDLS VGSVAALAGI VVTALLKQYP SSTPMMYVII IFSVLAVGIV 
CGGISGLAIA KLNVEPFIAT LAMLSIARGF AFVYTQSKPI FGLPPAFSWI GQGYIGPIPV 
IVLIMIFCLV IAHIVLSKTC FGRYIYAIGS NEEVAKLCGI NVARVKLIIY VISGVLSALG 
GVALASRLAT GQPAAASGYE LNAIAAVVLG GTSLSGGKGS IGKTIIGIMT IGVINNGLSL 
LQISSYWQSI TMGLIIMIAV ILDKINTRKK A