Gene ECH74115_4845 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4845
Symbol	prlC
ID	6968071
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	4480529
End bp	4482571
Gene Length	2043 bp
Protein Length	680 aa
Translation table	11
GC content	55%
IMG OID	643388536
Product	oligopeptidase A
Protein accession	YP_002272964
Protein GI	209396642
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0339] Zn-dependent oligopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	0.88545
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAATC CGTTACTGAC TCCCTTTGAA TTGCCTCCGT TTTCTAAAAT TCTCCCGGAA 
CATGTCGTTC CAGCCGTGAC TAAGGCATTG AATGACTGCC GCGAAAATGT GGAGCGCGTA 
GTAGCGCAAG GAGCACCGTA CACCTGGGAA AATCTCTGCC AGCCGTTGGC GGAAGTGGAC 
GATGTGTTGG GGCGTATTTT CTCCCCGGTC AGCCACCTGA ACTCGGTGAA AAATAGCCCG 
GAATTGCGCG AAGCGTACGA ACAAACTCTG CCGCTGCTGT CGGAATACAG CACCTGGGTA 
GGGCAACATG AAGGGCTGTA TAAAGCGTAC CGCGACCTGC GCGATGGCGA TCATTACGCC 
ACGCTGAACA CGGCTCAGAA AAAAGCGGTT GATAACGCAC TGCGCGATTT TGAACTCTCA 
GGCATCGGTC TGCCGAAAGA GAAACAACAG CGTTACGGCG AAATTGCCAC TCGTCTTTCT 
GAACTGGGCA ACCAGTACAG CAACAACGTC CTTGATGCGA CGATGGGCTG GACTAAACTC 
GTTACCGACG AAGCGGAACT GGCGGGGATG CCAGAAAGCG CGCTGGCTGC GGCAAAAGCC 
CAGGCCGAAG CGAAAGAGCT GGAAGGCTAC CTGTTGACGC TGGATATCCC AAGCTACTTG 
CCGGTAATGA CCTACTGCGA CAACCAGGTC TTGCGTGAAG AGATGTATCG TGCTTACAGC 
ACCCGCGCTT CAGATCAAGG TCCAAACGCC GGTAAATGGG ATAACAGTAA GGTGATGGAA 
GAGATCCTCG CGCTGCGTCA CGAACTGGCG CAACTGCTGG GCTTTGAAAA CTACGCGTTT 
AAATCACTGG CTACCAAAAT GGCGGAAAAC CCGCAGCAGG TGCTTGATTT CTTAACCGAT 
CTGGCAAAAC GCGCGCGTCC GCAGGGCGAA AAAGAGCTGG CGCAACTGCG TGCCTTCGCC 
AAAGCCGAAT TTGGCGTGGA TGAGTTGCAA CCGTGGGATA TCGCATACTA CAGCGAAAAA 
CAAAAACAGC ACCTCTACAG CATCAGCGAC GAACAACTGC GTCCGTACTT CCCGGAAAAC 
AAAGCGGTTA ACGGCTTGTT TGAAGTGGTA AAACGTATTT ACGGCATCAC CGCTAAAGAG 
CGTAAAGATG TTGATGTCTG GCACCCGGAT GTACGTTTCT TCGAACTGTA TGACGAGAAC 
AACGAACTGC GCGGCAGTTT CTACCTCGAC CTGTATGCCC GTGAAAACAA GCGCGGCGGG 
GCGTGGATGG ATGACTGCGT AGGCCAGATG CGTAAAGCCG ATGGTTCGCT GCAAAAACCG 
GTCGCGTATC TGACCTGTAA CTTCAACCGC CCGGTGAATG GTAAACCGGC GCTGTTCACT 
CACGACGAAG TGATCACTCT GTTCCACGAG TTCGGTCACG GCCTGCACCA TATGCTGACC 
CGCATCGAAA CCGCCGGTGT TTCCGGTATC AGCGGTGTGC CGTGGGATGC GGTCGAACTG 
CCGAGTCAGT TTATGGAAAA CTGGTGCTGG GAGCCGGAGG CGCTGGCGTT TATCTCTGGT 
CACTACGAAA CCGGCGAACC GCTGCCGAAA GAGTTGCTGG ATAAAATGCT GGCGGCGAAG 
AACTACCAGG CGGCGCTGTT TATTCTGCGC CAGCTGGAGT TCGGCCTGTT CGATTTCCGC 
CTCCATGCCG AGTTCCGCCC GGATCAGGGA GCGAAAATCC TCGAAACTCT GGCAGAAATC 
AAGAAACTGG TTGCCGTAGT ACCGTCTCCA TCCTGGGGCC GTTTCCCGCA CGCTTTCAGC 
CATATTTTCG CCGGTGGTTA TGCCGCAGGT TACTACAGCT ACCTGTGGGC TGACGTACTG 
GCGGCAGATG CTTTCTCGCG CTTTGAGGAA GAGGGCATTT TCAACCGTGA AACCGGGCAG 
TCGTTCCTCG ACAACATTCT GAGCCGTGGC GGTTCAGAAG AGCCGATGGA TCTGTTCAAA 
CGCTTCCGTG GTCGTGAACC GCAGCTGGAT GCGATGCTGG AGCATTACGG CATTAAGGGC 
TGA

Protein sequence

MTNPLLTPFE LPPFSKILPE HVVPAVTKAL NDCRENVERV VAQGAPYTWE NLCQPLAEVD 
DVLGRIFSPV SHLNSVKNSP ELREAYEQTL PLLSEYSTWV GQHEGLYKAY RDLRDGDHYA 
TLNTAQKKAV DNALRDFELS GIGLPKEKQQ RYGEIATRLS ELGNQYSNNV LDATMGWTKL 
VTDEAELAGM PESALAAAKA QAEAKELEGY LLTLDIPSYL PVMTYCDNQV LREEMYRAYS 
TRASDQGPNA GKWDNSKVME EILALRHELA QLLGFENYAF KSLATKMAEN PQQVLDFLTD 
LAKRARPQGE KELAQLRAFA KAEFGVDELQ PWDIAYYSEK QKQHLYSISD EQLRPYFPEN 
KAVNGLFEVV KRIYGITAKE RKDVDVWHPD VRFFELYDEN NELRGSFYLD LYARENKRGG 
AWMDDCVGQM RKADGSLQKP VAYLTCNFNR PVNGKPALFT HDEVITLFHE FGHGLHHMLT 
RIETAGVSGI SGVPWDAVEL PSQFMENWCW EPEALAFISG HYETGEPLPK ELLDKMLAAK 
NYQAALFILR QLEFGLFDFR LHAEFRPDQG AKILETLAEI KKLVAVVPSP SWGRFPHAFS 
HIFAGGYAAG YYSYLWADVL AADAFSRFEE EGIFNRETGQ SFLDNILSRG GSEEPMDLFK 
RFRGREPQLD AMLEHYGIKG