Gene EcSMS35_1565 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1565
Symbol	tppB
ID	6146773
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1548584
End bp	1550086
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	52%
IMG OID	641616442
Product	putative tripeptide transporter permease
Protein accession	YP_001743620
Protein GI	170682111
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3104] Dipeptide/tripeptide permease
TIGRFAM ID	[TIGR00924] amino acid/peptide transporter (Peptide:H+ symporter), bacterial

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCACTG CAAACCAAAA ACCAACTGAA AGCGTCAGTT TGAACGCTTT CAAACAACCG 
AAGGCGTTCT ATCTCATCTT CTCGATTGAG TTATGGGAAC GTTTTGGTTA TTACGGCCTA 
CAAGGAATTA TGGCTGTTTA CCTGGTTAAA CAACTGGGTA TGTCTGAAGC GGATTCAATC 
ACCCTTTTCT CTTCCTTTAG TGCCCTGGTT TATGGTCTGG TCGCTATCGG CGGCTGGTTA 
GGTGACAAGG TACTGGGTAC TAAACGCGTA ATTATGCTTG GCGCTATTGT GCTGGCGATT 
GGTTATGCTC TGGTTGCCTG GTCTGGTCAC GACGCCGGTA TCGTTTATAT GGGTATGGCG 
GCTATTGCGG TCGGTAACGG CCTGTTTAAA GCTAACCCGT CTTCTCTGCT TTCTACATGC 
TATGAGAAAA ACGACCCGCG TCTGGACGGT GCATTCACCA TGTACTACAT GTCCGTCAAC 
ATCGGCTCTT TCTTCTCTAT GATCGCCACC CCGTGGCTGG CCGCGAAATA CGGCTGGAGT 
GTTGCGTTTG CGTTGAGCGT TGTAGGCCTG CTGATCACTA TCGTTAACTT CGCCTTCTGC 
CAACGCTGGG TTAAACAGTA CGGTTCAAAA CCAGACTTCG AGCCTATCAA CTACCGTAAC 
CTGCTGCTGA CCATTATTGG TGTTGTGGCA CTGATCGCTA TCGCCACCTG GCTGCTGCAC 
AATCAGGAAG TTGCGCGTAT GGCGCTGGGC GTTGTTGCCT TCGGTATTGT GGTTATCTTC 
GGTAAAGAAG CCTTCGCGAT GAAAGGTGCT GCGCGTCGTA AAATGATCGT TGCCTTCATC 
CTGATGCTCG AAGCCATTAT CTTCTTCGTG CTGTACAGCC AGATGCCAAC GTCACTGAAC 
TTCTTTGCGA TTCGTAACGT TGAGCACTCC ATTCTGGGTC TGGCCGTAGA ACCTGAGCAG 
TATCAGGCAC TGAACCCGTT CTGGATCATC ATCGGTAGTC CGATTCTGGC CGCTATCTAT 
AACAAGATGG GCGATACCCT GCCGATGCCA ACCAAGTTTG CAATCGGCAT GGTGATGTGT 
TCTGGTGCGT TCCTGATTCT GCCGCTGGGT GCGAAATTCG CGTCTGACGC TGGTATCGTG 
TCTGTAAGCT GGCTGGTCGC GAGCTATGGC CTGCAGAGTA TCGGGGAACT GATGATCTCT 
GGTCTGGGTC TGGCAATGGT CGCACAACTC GTTCCGCAGC GTCTGATGGG CTTCATTATG 
GGTAGCTGGT TCCTGACCAC TGCCGGTGCA AACCTGATTG GTGGTTATGT TGCGGGTATG 
ATGGCTGTGC CGGATAACGT TACCGATCCG CTGATGTCAC TGGAAGTCTA TGGTCGCGTA 
TTCTTGCAGA TTGGTGTCGC TACTGCCGTT ATTGCAGTAC TGATGCTGCT GACCGCGCCG 
AAACTGCACC GCATGACGCA GGATGACGCT GCAGACAAAG CGGCGAAAGC TGCTGTAGCG 
TAA

Protein sequence

MSTANQKPTE SVSLNAFKQP KAFYLIFSIE LWERFGYYGL QGIMAVYLVK QLGMSEADSI 
TLFSSFSALV YGLVAIGGWL GDKVLGTKRV IMLGAIVLAI GYALVAWSGH DAGIVYMGMA 
AIAVGNGLFK ANPSSLLSTC YEKNDPRLDG AFTMYYMSVN IGSFFSMIAT PWLAAKYGWS 
VAFALSVVGL LITIVNFAFC QRWVKQYGSK PDFEPINYRN LLLTIIGVVA LIAIATWLLH 
NQEVARMALG VVAFGIVVIF GKEAFAMKGA ARRKMIVAFI LMLEAIIFFV LYSQMPTSLN 
FFAIRNVEHS ILGLAVEPEQ YQALNPFWII IGSPILAAIY NKMGDTLPMP TKFAIGMVMC 
SGAFLILPLG AKFASDAGIV SVSWLVASYG LQSIGELMIS GLGLAMVAQL VPQRLMGFIM 
GSWFLTTAGA NLIGGYVAGM MAVPDNVTDP LMSLEVYGRV FLQIGVATAV IAVLMLLTAP 
KLHRMTQDDA ADKAAKAAVA