Gene ECD_01125 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_01125
Symbol	pepT
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	1189212
End bp	1190438
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	50%
IMG OID
Product	peptidase T
Protein accession	ACT43019
Protein GI	253977349
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.671932
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAAAC TACTTGAGCG ATTTTTGAAC TACGTGTCTC TGGATACCCA ATCAAAAGCA 
GGGGTGAGAC AGGTTCCCAG CACGGAAGGC CAATGGAAGT TATTGCATCT GCTGAAAGAG 
CAGCTCGAAG AAATGGGGCT TATCAATGTG ACCTTAAGTG AGAAGGGCAC TTTGATGGCG 
ACGTTACCGG CTAACGTCCC TGGCGATATC CCGGCGATTG GCTTTATTTC TCATGTGGAT 
ACCTCACCGG ATTGCAGCGG CAAAAATGTT AATCCGCAAA TTGTTGAAAA CTATCGCGGT 
GGCGATATTG CGCTGGGTAT CGGCGATGAA GTTTTATCAC CGGTTATGTT CCCGGTGCTG 
CATCAGCTAC TGGGTCAGAC GTTGATTACC ACCGATGGTA AAACCTTGTT AGGTGCCGAT 
GACAAAGCCG GTATTGCAGA AATCATGACC GCGCTGGCGG TATTGCAACA GAAAAACATT 
CCGCATGGTG ATATTCGCGT CGCCTTTACC CCGGATGAAG AAGTGGGCAA AGGGGCGAAA 
CATTTTGATG TTGATGCCTT CGATGCCCGC TGGGCTTACA CTGTTGACGG TGGTGGCGTA 
GGCGAACTGG AGTTTGAAAA CTTCAACGCC GCATCGGTCA ATATCAAAAT TGTCGGTAAC 
AATGTTCATC CGGGCACGGC GAAAGGAGTG ATGGTAAATG CGCTGTCGCT GGCGGCACGT 
ATTCATGCGG AAGTTCCGGC GGATGAAAGC CCGGAAATGA CAGAAGGCTA TGAAGGTTTC 
TATCACCTGG CGAGCATGAA AGGCACCGTT GACCGAGCCG ATATGCACTA CATCATCCGT 
GATTTCGACC GTAAACAGTT TGAAGCGCGT AAACGTAAAA TGATGGAGAT CGCCAAAAAA 
GTGGGCAAAG GGTTACATCC TGATTGCTAC ATTGAACTGG TGATTGAAGA CAGTTACTAC 
AATATGCGCG AGAAAGTGGT TGAGCATCCG CATATTCTCG ATATCGCCCA GCAGGCGATG 
CGTGACTGCG ATATTGAACC GGAACTGAAA CCGATCCGCG GCGGTACCGA CGGCGCGCAG 
TTGTCGTTTA TGGGATTACC GTGCCCGAAC CTGTTCACTG GCGGTTACAA CTATCATGGT 
AAGCATGAGT TTGTGACTCT GGAAGGTATG GAAAAAGCGG TGCAGGTGAT CGTCCGTATT 
GCCGAGTTAA CGGCGCAACG GAAGTAA

Protein sequence

MDKLLERFLN YVSLDTQSKA GVRQVPSTEG QWKLLHLLKE QLEEMGLINV TLSEKGTLMA 
TLPANVPGDI PAIGFISHVD TSPDCSGKNV NPQIVENYRG GDIALGIGDE VLSPVMFPVL 
HQLLGQTLIT TDGKTLLGAD DKAGIAEIMT ALAVLQQKNI PHGDIRVAFT PDEEVGKGAK 
HFDVDAFDAR WAYTVDGGGV GELEFENFNA ASVNIKIVGN NVHPGTAKGV MVNALSLAAR 
IHAEVPADES PEMTEGYEGF YHLASMKGTV DRADMHYIIR DFDRKQFEAR KRKMMEIAKK 
VGKGLHPDCY IELVIEDSYY NMREKVVEHP HILDIAQQAM RDCDIEPELK PIRGGTDGAQ 
LSFMGLPCPN LFTGGYNYHG KHEFVTLEGM EKAVQVIVRI AELTAQRK