Gene B21_01133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_01133
Symbol	pepT
ID	8114467
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	1188620
End bp	1189846
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	50%
IMG OID	644847387
Product	hypothetical protein
Protein accession	YP_002998960
Protein GI	251784656
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2195] Di- and tripeptidases
TIGRFAM ID	[TIGR01882] peptidase T

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.684564
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAAAC TACTTGAGCG ATTTTTGAAC TACGTGTCTC TGGATACCCA ATCAAAAGCA 
GGGGTGAGAC AGGTTCCCAG CACGGAAGGC CAATGGAAGT TATTGCATCT GCTGAAAGAG 
CAGCTCGAAG AAATGGGGCT TATCAATGTG ACCTTAAGTG AGAAGGGCAC TTTGATGGCG 
ACGTTACCGG CTAACGTCCC TGGCGATATC CCGGCGATTG GCTTTATTTC TCATGTGGAT 
ACCTCACCGG ATTGCAGCGG CAAAAATGTT AATCCGCAAA TTGTTGAAAA CTATCGCGGT 
GGCGATATTG CGCTGGGTAT CGGCGATGAA GTTTTATCAC CGGTTATGTT CCCGGTGCTG 
CATCAGCTAC TGGGTCAGAC GTTGATTACC ACCGATGGTA AAACCTTGTT AGGTGCCGAT 
GACAAAGCCG GTATTGCAGA AATCATGACC GCGCTGGCGG TATTGCAACA GAAAAACATT 
CCGCATGGTG ATATTCGCGT CGCCTTTACC CCGGATGAAG AAGTGGGCAA AGGGGCGAAA 
CATTTTGATG TTGATGCCTT CGATGCCCGC TGGGCTTACA CTGTTGACGG TGGTGGCGTA 
GGCGAACTGG AGTTTGAAAA CTTCAACGCC GCATCGGTCA ATATCAAAAT TGTCGGTAAC 
AATGTTCATC CGGGCACGGC GAAAGGAGTG ATGGTAAATG CGCTGTCGCT GGCGGCACGT 
ATTCATGCGG AAGTTCCGGC GGATGAAAGC CCGGAAATGA CAGAAGGCTA TGAAGGTTTC 
TATCACCTGG CGAGCATGAA AGGCACCGTT GACCGAGCCG ATATGCACTA CATCATCCGT 
GATTTCGACC GTAAACAGTT TGAAGCGCGT AAACGTAAAA TGATGGAGAT CGCCAAAAAA 
GTGGGCAAAG GGTTACATCC TGATTGCTAC ATTGAACTGG TGATTGAAGA CAGTTACTAC 
AATATGCGCG AGAAAGTGGT TGAGCATCCG CATATTCTCG ATATCGCCCA GCAGGCGATG 
CGTGACTGCG ATATTGAACC GGAACTGAAA CCGATCCGCG GCGGTACCGA CGGCGCGCAG 
TTGTCGTTTA TGGGATTACC GTGCCCGAAC CTGTTCACTG GCGGTTACAA CTATCATGGT 
AAGCATGAGT TTGTGACTCT GGAAGGTATG GAAAAAGCGG TGCAGGTGAT CGTCCGTATT 
GCCGAGTTAA CGGCGCAACG GAAGTAA

Protein sequence

MDKLLERFLN YVSLDTQSKA GVRQVPSTEG QWKLLHLLKE QLEEMGLINV TLSEKGTLMA 
TLPANVPGDI PAIGFISHVD TSPDCSGKNV NPQIVENYRG GDIALGIGDE VLSPVMFPVL 
HQLLGQTLIT TDGKTLLGAD DKAGIAEIMT ALAVLQQKNI PHGDIRVAFT PDEEVGKGAK 
HFDVDAFDAR WAYTVDGGGV GELEFENFNA ASVNIKIVGN NVHPGTAKGV MVNALSLAAR 
IHAEVPADES PEMTEGYEGF YHLASMKGTV DRADMHYIIR DFDRKQFEAR KRKMMEIAKK 
VGKGLHPDCY IELVIEDSYY NMREKVVEHP HILDIAQQAM RDCDIEPELK PIRGGTDGAQ 
LSFMGLPCPN LFTGGYNYHG KHEFVTLEGM EKAVQVIVRI AELTAQRK