Gene EcHS_A1247 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1247
Symbol	pepT
ID	5593353
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1248263
End bp	1249489
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	50%
IMG OID	640920407
Product	peptidase T
Protein accession	YP_001457969
Protein GI	157160651
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2195] Di- and tripeptidases
TIGRFAM ID	[TIGR01882] peptidase T

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAAAC TACTTGAGCG ATTTTTGAAC TACGTGTCTC TGGATACCCA ATCAAAAGCA 
GGGGTGAGAC AGGTTCCCAG CACGGAAGGC CAATGGAAGT TATTGCATCT GCTGAAAGAG 
CAGCTCGAAG AGATGGGGCT TATCAATGTG ACCTTAAGTG AGAAGGGCAC TTTGATGGCG 
ACGTTACCGG CTAACGTCCC TGGCGATATC CCGGCGATTG GCTTTATTTC TCATGTGGAT 
ACCTCACCGG ATTGCAGCGG CAAAAATGTG AATCCGCAAA TTGTTGAAAA CTATCGCGGT 
GGCGATATTG CGCTGGGTAT CGGCGATGAA GTTTTATCAC CGGTTATGTT CCCGGTGCTG 
CATCAGCTAC TGGGTCAGAC GCTGATTACT ACCGATGGTA AAACCTTGTT AGGTGCCGAT 
GACAAAGCCG GTATTGCAGA AATCATGACC GCGCTGGCGG TATTGCAACA GAAAAACATT 
CCGCATGGTG ATATTCGCGT CGCCTTTACC CCGGATGAAG AAGTGGGCAA AGGGGCGAAA 
CATTTTGATG TTGATGCCTT CGATGCCCGC TGGGCTTACA CTGTTGACGG TGGTGGCGTA 
GGCGAACTGG AGTTTGAAAA CTTCAACGCC GCATCGGTCA ATATCAAAAT TGTCGGTAAC 
AATGTTCATC CGGGCACGGC GAAAGGAGTG ATGGTAAATG CGCTGTCGCT GGCGGCACGT 
ATTCATGCGG AAGTTCCGGC GGATGAAAGC CCGGAAATGA CAGAAGGCTA TGAAGGTTTC 
TATCACCTGG CGAGCATGAA AGGCACCGTT GACCGAGCCG ATATGCACTA CATCATCCGT 
GATTTCGACC GTAAACAGTT TGAAGCGCGT AAACGTAAAA TGATGGAGAT CGCCAAAAAA 
GTGGGCAAAG GGTTACATCC TGATTGCTAC ATTGAACTGG TGATTGAAGA CAGTTACTAC 
AATATGCGCG AGAAAGTGGT TGAGCATCCG CATATTCTCG ATATCGCCCA GCAGGCGATG 
CGTGACTGCG ATATTGAACC GGAACTGAAA CCGATCCGCG GTGGTACCGA CGGCGCGCAG 
TTGTCGTTTA TGGGATTACC GTGCCCGAAC TTGTTCACTG GCGGTTACAA CTATCATGGT 
AAGCATGAGT TTGTGACTCT GGAAGGTATG GAAAAAGCGG TGCAGGTGAT CGTCCGTATT 
GCCGAGTTAA CGGCGCAACG GAAGTAA

Protein sequence

MDKLLERFLN YVSLDTQSKA GVRQVPSTEG QWKLLHLLKE QLEEMGLINV TLSEKGTLMA 
TLPANVPGDI PAIGFISHVD TSPDCSGKNV NPQIVENYRG GDIALGIGDE VLSPVMFPVL 
HQLLGQTLIT TDGKTLLGAD DKAGIAEIMT ALAVLQQKNI PHGDIRVAFT PDEEVGKGAK 
HFDVDAFDAR WAYTVDGGGV GELEFENFNA ASVNIKIVGN NVHPGTAKGV MVNALSLAAR 
IHAEVPADES PEMTEGYEGF YHLASMKGTV DRADMHYIIR DFDRKQFEAR KRKMMEIAKK 
VGKGLHPDCY IELVIEDSYY NMREKVVEHP HILDIAQQAM RDCDIEPELK PIRGGTDGAQ 
LSFMGLPCPN LFTGGYNYHG KHEFVTLEGM EKAVQVIVRI AELTAQRK