Gene EcE24377A_1290 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_1290
Symbol	pepT
ID	5586690
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	1291617
End bp	1292846
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	50%
IMG OID	640924987
Product	peptidase T
Protein accession	YP_001462396
Protein GI	157156938
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2195] Di- and tripeptidases
TIGRFAM ID	[TIGR01882] peptidase T

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAAAC TACTTGAGCG ATTTTTGAAC TACGTGTCTC TGGATACCCA ATCAAAAGCA 
GGGGTGAGAC AGGTTCCCAG CACGGAAGGC CAATGGAAGT TATTGCATCT GCTGAAAGAG 
CAGCTCGAAG AGATGGGGCT TATCAATGTG ACCTTAAGTG AGAAGGGCAC TTTGATGGCG 
ACGTTACCGG CTAACGTCCC TGGCGATATC CCGGCGATTG GCTTTATTTC TCATGTGGAT 
ACCTCACCGG ATTGCAGCGG CAAAAATGTG AATCCGCAAA TTGTTGAAAA CTATCGCGGT 
GGCGATATTG CGCTGGGTAT CGGCGATGAA GTTTTATCAC CGGTTATGTT CCCGGTGCTG 
CATCAGCTAC TGGGTCAGAC GTTGATTACC ACCGATGGTA AAACCTTGTT AGGTGCCGAT 
GACAAAGCAG GTATTGCAGA AATCATGACC GCGCTGGCGG TATTGCAACA GAAAAACATT 
CCGCATGGTG ATATTCGCGT CGCCTTTACC CCGGATGAAG AAGTGGGCAA AGGGGCGAAA 
CATTTTGATG TTGATGCCTT CGATGCCCGC TGGGCTTACA CTGTTGACGG TGGTGGCGTA 
GGCGAACTGG AGTTTGAAAA CTTCAACGCC GCATCGGTCA ATATCAAAAT TGTCGGTAAC 
AATGTTCATC CGGGCACGGC GAAAGGAGTG ATGGTAAATG CGCTGTCGCT GGCGGCACGT 
ATTCATGCGG AAGTTCCGGC GGATGAAAGC CCGGAAATGA CAGAAGGCTA TGAAGGTTTC 
TATCACCTGG CGAGCATGAA AGGCACCGTT GAACGGGCCG ATATGCATTA CATCATCCGT 
GATTTCGACC GTAAACAGTT TGAAGCGCGT AAACGTAAAA TGATGGAGAT CGCCAAAAAA 
GTGGGCAAAG GGTTACATCC TGATTGCTAC ATTGAATTGG TGATTGAAGA CAGTTACTAC 
AATATGCGCG AGAAAGTGGT TGAGCATCCG CATATTCTCG ATATCGCCCA GCAGGCGATG 
CGTGACTGCG ATATTGAACC GGAACTGAAA CCGATCCGCG GCGGTACCGA CGGCGCGCAG 
TTGTCGTTTA TGGGATTACC TTGCCCGAAC CTGTTCACTG GCGGTTACAA CTATCATGGT 
AAGCATGAGT TTGTGACTCT GGAAGGTATG GAAAAAGCGG TGCAGGTGAT CGTCCGTATT 
GCCGAGTTAA CGGCGCAACG GAAGTCGTGA

Protein sequence

MDKLLERFLN YVSLDTQSKA GVRQVPSTEG QWKLLHLLKE QLEEMGLINV TLSEKGTLMA 
TLPANVPGDI PAIGFISHVD TSPDCSGKNV NPQIVENYRG GDIALGIGDE VLSPVMFPVL 
HQLLGQTLIT TDGKTLLGAD DKAGIAEIMT ALAVLQQKNI PHGDIRVAFT PDEEVGKGAK 
HFDVDAFDAR WAYTVDGGGV GELEFENFNA ASVNIKIVGN NVHPGTAKGV MVNALSLAAR 
IHAEVPADES PEMTEGYEGF YHLASMKGTV ERADMHYIIR DFDRKQFEAR KRKMMEIAKK 
VGKGLHPDCY IELVIEDSYY NMREKVVEHP HILDIAQQAM RDCDIEPELK PIRGGTDGAQ 
LSFMGLPCPN LFTGGYNYHG KHEFVTLEGM EKAVQVIVRI AELTAQRKS