Gene Moth_2020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2020
Symbol
ID	3831395
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2106914
End bp	2108107
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	42%
IMG OID	637829949
Product	inner-membrane translocator
Protein accession	YP_430859
Protein GI	83590850
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4214] ABC-type xylose transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.232129
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTTAATC TTATTAAAAC TATTTCCCCT GCAGAAACGG TACAATCTAA ACCTAAAGCG 
AATGGGTATT TAAGTAGAAT AGATATACGC GCTTATACAA TGATATTAGC CTTATTGGGT 
ATATGGGCTA TTTTCACTTA TACTACCCAG GGTGCTTTTT TGACTTCCCG TAATCTATCA 
AACCTCTTCA GGCAGATGTC AATTACCTCT ATTTTAGCGA TAGGTATGGT CTTTGTAATA 
GTAGCCGGTC ATATTGACCT TTCCGTAGGT TCTCTCATGG GACTTACTGG AGGGGTAGCG 
GCAATTTTAC AGGTCTGGTA TGGTTGGCAG ACCATTCCTG CTATTTTTAT AAGCTTTTTA 
ATTGGTCTGC TGGCCGGCTT ATGGCAGGGC TGGTGGGTTG CCTATAAAAA GGTGCCTGCT 
TTCATTGTCA CCCTGGGCGG TATGATGGTA TTTCGGGGAA TTCTAATAGG AATTAGTCAT 
GGCGAAACAG TTTCGCCTCT CATGGATAGT TTTAAACAAA TAGGCCAATC CTATGTACCT 
GAAAGTACAG GCTTCTTATT AGCATTCCTG GGTATTATTT ATGTGATCTA TGTTACTGTA 
AAGCAACGGT ATACTAGAAT TAAGTATGGT TTTACTGTGC CTTCTTTAGC TCTGGAAATA 
ATGCGTACCA TTTTTTACGC CTTTCTCATT GGCCTTTTTG TCTATCTAAT GAATGATTAC 
CAGGGTATAC CTGTACCTGT CCTAATCGTA GTGGCGATGG CATTTATTTT TACGGGTTTA 
GCAACGAAAA CTCGCTTCGG GCGTTATGTC TACGCAATTG GTGGTAACAG TGAAGCAGCA 
CGTTTATCCG GTATTAATAT TCGATATAAC ATCCTGGCCG TTTTTGTTAT CAGTGGGTTA 
ATGGCTGCCT TAAGCGGTAT CCTGTTAACT GCAAGATTAA ACGGTGCTTC AGTAGCTGCA 
GGGCAAAATG CTGAGCTTGA TGCCATTGCA GCGTGCGTTA TAGGTGGTAC AAGTCTTATG 
GGTGGTACAG GTAGTATTGG TGGGGCGATG ATAGGAGCAC TTGTTATGGC CAGTTTAGAT 
AATGGCCTGA GCATGATGAA TACCCCGACC TTCTGGCAGT TTATAGTTAA AGGTTTGATT 
CTTGTGCTGG CGGTATGGAT CGATATCGCA ACTAAAACAA GGGCTCAAAA TTGA

Protein sequence

MFNLIKTISP AETVQSKPKA NGYLSRIDIR AYTMILALLG IWAIFTYTTQ GAFLTSRNLS 
NLFRQMSITS ILAIGMVFVI VAGHIDLSVG SLMGLTGGVA AILQVWYGWQ TIPAIFISFL 
IGLLAGLWQG WWVAYKKVPA FIVTLGGMMV FRGILIGISH GETVSPLMDS FKQIGQSYVP 
ESTGFLLAFL GIIYVIYVTV KQRYTRIKYG FTVPSLALEI MRTIFYAFLI GLFVYLMNDY 
QGIPVPVLIV VAMAFIFTGL ATKTRFGRYV YAIGGNSEAA RLSGINIRYN ILAVFVISGL 
MAALSGILLT ARLNGASVAA GQNAELDAIA ACVIGGTSLM GGTGSIGGAM IGALVMASLD 
NGLSMMNTPT FWQFIVKGLI LVLAVWIDIA TKTRAQN