Gene EcHS_A3782 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3782
Symbol
ID	5595244
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3774107
End bp	3775384
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	51%
IMG OID	640922896
Product	TRAP transporter DctM family protein
Protein accession	YP_001460374
Protein GI	157163056
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1593] TRAP-type C4-dicarboxylate transport system, large permease component
TIGRFAM ID	[TIGR00786] TRAP transporter, DctM subunit

Plasmid Coverage information

Num covering plasmid clones	53
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGTGC TGATTTTTCT GGGCTGTCTG TTGGGTGGTA TTGCTATCGG TTTGCCTATT 
TCCTGGGCAC TGTTGTTGTG CGGGGCGGCG TTAATGTTCT GGCTGGACAT GTTTGATGTC 
CAGATCATGG CACAAACGCT GGTGAACGGA GCCGATAGCT TCTCCCTGCT GGCGATTCCG 
TTCTTTGTGC TGGCGGGTGA AATCATGAAT GCGGGCGGCT TGTCAAAACG CATTGTTGAC 
CTGCCGATGA AACTGGTGGG GCATAAACCA GGCGGGCTGG GCTACGTCGG CGTGCTGGCG 
GCTATGATTA TGGCAAGCCT TTCTGGTTCT GCCGTTGCGG ATACCGCCGC CGTTGCCGCT 
CTACTGGTGC CGATGATGCG CAGCGCCAAC TACCCGGTCA ACCGGGCGGC GGGGCTGATT 
GCCTCTGGCG GCATTATCGC GCCAATTATT CCCCCTTCCA TTCCGTTTAT TATCTTCGGC 
GTTTCCAGCG GATTATCCAT CAGTAAGCTG TTTATGGCGG GCATTGCCCC TGGCATGATG 
ATGGGCGCAA CGCTGATGCT TACCTGGTGG TGGCAGGCCA GTCGCCTTAA TTTACCCCGC 
CAGCAAAAAG CAACGATGCA GGAAATCTGG CACTCTTTTG TCTCCGGTAT CTGGGCGCTG 
TTTCTTCCAG TCATCATTAT TGGCGGGTTT CGCTCCGGTC TGTTTACCCC TACCGAAGCC 
GGGGCCGTTG CTGCTTTCTA TGCGCTGTTT GTCGCCACAG TTATTTACCG TGAAATGACC 
TTCGCCACAC TTTGGCATGT ACTCATTGGC GCGGCGAAAA CCACCTCAGT GGTTATGTTT 
CTGGTGGCCT CGGCACAAGT TTCCGCCTGG CTAATTACCA TTGCTGAACT GCCGATGATG 
GTTTCTGATT TACTGCAACC GTTGGTCGAT TCACCGCGTC TGCTGTTTAT CGTCATTATG 
GTGGCTATCC TGATTGTCGG CATGGTCATG GATTTAACGC CGACGGTATT AATTCTTACC 
CCGGTATTAA TGCCTTTAGT TAAAGAGGCA GGAATCGATC CGATTTATTT CGGTGTCATG 
TTTATCATTA ACTGCTCAAT CGGCTTAATT ACACCGCCTA TCGGTAATGT ACTTAACGTT 
ATTTCAGGGG TGGCAAAACT CAAATTCGAT GATGCAGTCA GAGGCGTTTT CCCTTACGTC 
CTGGTTTTAT ATTCATTATT AGTCGTATTT GTTTTTATTC CCGATCTCAT CATCCTCCCT 
TTGAAATGGA TTAATTAA

Protein sequence

MAVLIFLGCL LGGIAIGLPI SWALLLCGAA LMFWLDMFDV QIMAQTLVNG ADSFSLLAIP 
FFVLAGEIMN AGGLSKRIVD LPMKLVGHKP GGLGYVGVLA AMIMASLSGS AVADTAAVAA 
LLVPMMRSAN YPVNRAAGLI ASGGIIAPII PPSIPFIIFG VSSGLSISKL FMAGIAPGMM 
MGATLMLTWW WQASRLNLPR QQKATMQEIW HSFVSGIWAL FLPVIIIGGF RSGLFTPTEA 
GAVAAFYALF VATVIYREMT FATLWHVLIG AAKTTSVVMF LVASAQVSAW LITIAELPMM 
VSDLLQPLVD SPRLLFIVIM VAILIVGMVM DLTPTVLILT PVLMPLVKEA GIDPIYFGVM 
FIINCSIGLI TPPIGNVLNV ISGVAKLKFD DAVRGVFPYV LVLYSLLVVF VFIPDLIILP 
LKWIN