Gene EcSMS35_4675 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4675
Symbol
ID	6145560
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	4772475
End bp	4773776
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	44%
IMG OID	641619491
Product	TRAP transporter, DctM subunit
Protein accession	YP_001746599
Protein GI	170679845
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1593] TRAP-type C4-dicarboxylate transport system, large permease component
TIGRFAM ID	[TIGR00786] TRAP transporter, DctM subunit

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTACT GGTTACCGAT TATTGTGTTA TTTGGTGCCT TCTTTTTTAT GTTGGCATTA 
GGTGTACCTA TTGTTTATGC CATTGGTTTA TCCACACTGG CATCAATTTC CACACAACTC 
GATTTCAACT CAGCATTGAG TGTGGTTTCC CAAAAGTTAG CCTCCGGGTT AGATAGCTTT 
ACATTATTGG CAATTCCATT TTTTATTTTG TCTGGCAACA TTATGAATCA TGGAGGAATA 
GCGCGACGAT TAATCAACTT TGCCAGAATT CTTGGCGGTC GACTGCCTGG CTCACTTGCT 
CACTGTAATA TTCTTGCCAA TATGCTGTTC GGGGCAATTT CTGGTTCAGC TGTTGCTTCG 
GCGGCTGCGA TGGGCGGCGT CATGCATCCG CAACAGGTTA AAGAGGGCTA CGACCCGGCA 
TTCAGTACTG CGGTTAACGT TGCCTCTGCC CCGACGGGTT TGCTTATTCC ACCAAGTAAT 
ACGTTAATCG TCTATTCACT GGTCAGTGGT GGTACTTCTA TTGCCGCACT GTTCCTGGCG 
GGTTATGTTC CGGGAATTTT GCTGGGTCTG GCACTGATGG TAATAGCCGG TATTATCGCG 
GTACGTCGCG GTTATCCAAA GCCAGAACGC CCGACTTTAC GCCAGGCTGG CGTTGCGATA 
TGGATGGCTA TCCCCAGTAT TTTCCTGATT ATTTTAATTA TGGGGGGTGT ATTAAGTGGT 
ATTTTTACCC CGACAGAGGC CTCCGCAATT GCAGTAATTT ATACCCTTTT CCTTGCACTG 
GTTCTTTATC GTGAAATCTC AGTTAAAGAT TTACCTAAAA TATTTCTGGA ATCCGTTATT 
ACCACTGCAA TTGTCTTGTT ATTAATTGGT TCTTCGATGG GAATGTCATG GGCGATGTCA 
AACGCTGACG TTCCCTTCCT GATTCTCGAT TTGCTTAACA CTATTTCTGA CAACCCAATA 
ATAATCCTGC TTATTATCAA TATTATCCTG TTGATTATCG GCACTTTTAT GGATATGACA 
CCGGCGGTAC TGATTTTTAC GCCGATATTT TTACCGGTTG TCACCGAACT GGGCATGGAC 
CCGATTCACT TTGGTATTGT CATGGTACTG AACATGTGTA TCGGTATTTG TACTCCGCCT 
GTAGGCAGTG TGTTATTTGT CGGTTGTAGT GTATCTAAAT TACCGATTAA TAAAATTATC 
AAACCTATGC TGCCATTTTA TGCCGTGATG GTATTGGTGC TGGCAATGGT GACCTATATT 
CCGCAAATCA GTATGGCATT GCCAAGAGCA CTGGGTTACT GA

Protein sequence

MDYWLPIIVL FGAFFFMLAL GVPIVYAIGL STLASISTQL DFNSALSVVS QKLASGLDSF 
TLLAIPFFIL SGNIMNHGGI ARRLINFARI LGGRLPGSLA HCNILANMLF GAISGSAVAS 
AAAMGGVMHP QQVKEGYDPA FSTAVNVASA PTGLLIPPSN TLIVYSLVSG GTSIAALFLA 
GYVPGILLGL ALMVIAGIIA VRRGYPKPER PTLRQAGVAI WMAIPSIFLI ILIMGGVLSG 
IFTPTEASAI AVIYTLFLAL VLYREISVKD LPKIFLESVI TTAIVLLLIG SSMGMSWAMS 
NADVPFLILD LLNTISDNPI IILLIINIIL LIIGTFMDMT PAVLIFTPIF LPVVTELGMD 
PIHFGIVMVL NMCIGICTPP VGSVLFVGCS VSKLPINKII KPMLPFYAVM VLVLAMVTYI 
PQISMALPRA LGY