Gene EcSMS35_3901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3901
Symbol
ID	6146605
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3970875
End bp	3972152
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	51%
IMG OID	641618727
Product	TRAP transporter, DctM subunit
Protein accession	YP_001745866
Protein GI	170682198
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1593] TRAP-type C4-dicarboxylate transport system, large permease component
TIGRFAM ID	[TIGR00786] TRAP transporter, DctM subunit

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGTGC TGATTTTTCT GGGCTGTCTG TTGGGTGGTA TTGCTATCGG TTTGCCTATT 
GCCTGGGCAC TGTTGTTGTG CGGGGCGGCG TTAATGTTCT GGCTGGGCAT GTTTGATGTC 
CAGATCATGG CACAAACGCT GGTGAACGGA GCCGACAGCT TCTCCCTGCT GGCGATTCCG 
TTCTTTGTGC TGGCGGGTGA AATCATGAAT GCGGGCGGCT TGTCAAAACG CATTGTTGAC 
CTGCCGATGA AACTGGTGGG GCATAAACCA GGCGGGCTGG GCTACGTCGG CGTGCTGGCG 
GCTATGATTA TGGCAAGCCT TTCTGGTTCT GCCGTTGCGG ATACCGCCGC CGTTGCCGCT 
CTACTGGTGC CGATGATGCG CAGCGCCAAC TACCCGGTCA ACCGGGCGGC GGGGCTGATT 
GCCTCTGGCG GCATTATCGC GCCAATTATT CCCCCTTCCA TTCCGTTTAT TATTTTCGGC 
GTTTCCAGCG GATTATCCAT CAGTAAGCTG TTTATGGCGG GCATTGCCCC TGGCATGATG 
ATGGGCGCAA CGCTGATGCT TACCTGGTGG TGGCAGGCCA GTCGCCTTAA TTTACCCCGC 
CAGCAAAAAG CAACGATGCA GGAAATCTGG CACTCTTTTG TCTCCGGTAT CTGGGCGCTG 
TTTCTTCCAG TCATCATTAT TGGCGGGTTT CGCTCCGGTC TGTTTACCCC TACCGAAGCC 
GGGGCCGTTG CTGCTTTCTA TGCGCTGTTT GTCGCCACAG TTATTTACCG TGAAATGACC 
TTCGCCACAC TTTGGCATGT ACTCATTGGC GCGGCGAAAA CCACCTCAGT GGTAATGTTT 
CTGGTGGCCT CGGCACAAGT TTCTGCCTGG CTGATTACCA TTGCTGAATT GCCGATGATG 
GTTTCTGATT TACTGCAACC GTTGGTCGAT TCACCGCGTC TGCTGTTTAT CGTTATTATG 
CTGGCTATCC TGATTGTCGG CATGGTCATG GATTTAACGC CGACGGTGTT AATTCTTACT 
CCGGTATTAA TGCCTTTAGT TAAAGAGGCA GGAATCGATC CGATTTATTT CGGTGTCATG 
TTTATCATTA ACTGCTCAAT CGGCTTAATT ACACCGCCTA TCGGTAATGT GCTTAACGTT 
ATTTCAGGGG TGGCAAAACT CAAATTCGAT GATGCAGTCA GAGGCGTTTT CCCTTACGTC 
CTGGTTTTAT ATTCATTATT AGTCGTATTT GTTTTTATTC CCGATCTCAT CATCCTCCCT 
TTGAAATGGA TTAATTAA

Protein sequence

MAVLIFLGCL LGGIAIGLPI AWALLLCGAA LMFWLGMFDV QIMAQTLVNG ADSFSLLAIP 
FFVLAGEIMN AGGLSKRIVD LPMKLVGHKP GGLGYVGVLA AMIMASLSGS AVADTAAVAA 
LLVPMMRSAN YPVNRAAGLI ASGGIIAPII PPSIPFIIFG VSSGLSISKL FMAGIAPGMM 
MGATLMLTWW WQASRLNLPR QQKATMQEIW HSFVSGIWAL FLPVIIIGGF RSGLFTPTEA 
GAVAAFYALF VATVIYREMT FATLWHVLIG AAKTTSVVMF LVASAQVSAW LITIAELPMM 
VSDLLQPLVD SPRLLFIVIM LAILIVGMVM DLTPTVLILT PVLMPLVKEA GIDPIYFGVM 
FIINCSIGLI TPPIGNVLNV ISGVAKLKFD DAVRGVFPYV LVLYSLLVVF VFIPDLIILP 
LKWIN