Gene SbBS512_E3824 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E3824
Symbol	prlC
ID	6272216
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	3549935
End bp	3551977
Gene Length	2043 bp
Protein Length	680 aa
Translation table	11
GC content	56%
IMG OID	641727682
Product	oligopeptidase A
Protein accession	YP_001882117
Protein GI	187730439
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0339] Zn-dependent oligopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGAATC CGTTACTGAC TCCCTTTGAA TTGCCTCCGT TTTCTAAAAT TCTCCCGGAA 
CATGTCGTTC CAGCCGTGAC TCAGGCGCTG AACGATTGCC GCGAAAATGT GGAGCGCGTA 
GTAGCGCAAG GGGCACCGTA CACCTGGGAA AATCTCTGCC AGCCGTTGGC GGAAGTGGAC 
GATGTGTTGG GGCGTATCTT CTCCCCGGTC AGCCACCTGA ACTCGGTGAA AAATAGCCCG 
GAACTGCGTG AAGCCTACGA GCAAACCCTG CCGCTGCTGT CGGAATACAG CACCTGGGTA 
GGGCAACATG AAGGGCTGTA TAAAGCGTAC CGCGACCTGC GCGATGGCGA TCATTACGCC 
ACGCTGAACA CGGCGCAGAA GAAAGCGGTT GATAACGCCC TGCGTGATTT TGAACTCTCT 
GGCATAGGTC TGCCGAAAGA GAAACAGCAG CGTTACGGCG AAATTGCGAC CCGTCTTTCT 
GAACTGGGCA ACCAGTACAG CAACAACGTC CTCGATGCGA CAATGGGCTG GACCAAACTC 
GTTACCGACG AAGCGGAGCT GGCGGGGATG CCTGAAAGCG CGCTGGCTGC GGCAAAAGCC 
CAGGCCGAAG CGAAAGAGCT GGAAGGCTAC CTGCTGACGC TGGATATCCC AAGCTACCTG 
CCGGTAATGA CCTACTGCGA CAACCAGGCC TTGCGTGAAG AGATGTATCG CGCTTACAGC 
ACCCGCGCCT CCGATCAAGG CCCGAACGCC GGTAAATGGG ATAACAGCAA GGTGATGGAA 
GAGATCCTCG CTCTGCGTCA CGAACTGGCG CAACTGCTGG GCTTTGAAAA CTACGCCTTT 
AAATCCCTTG CCACTAAAAT GGCAGAAAAC CCGCAGCAGG TGCTGGATTT CTTAACCGAT 
CTGGCAAAAC GCGCGCGTCC GCAAGGCGAA AAAGAGCTGG CACAACTGCG CGCCTTCGCC 
AAAGCGGAAT TTGGCGTCGA TGAGTTGCAG CCGTGGGATA TCGCGTACTA CAGCGAAAAA 
CAAAAACAGC ACCTCTACAG CATCAGTGAC GAACAGCTGC GTCCGTACTT CCCGGAAAAC 
AAAGCGGTTA ACGGCCTGTT TGAAGTGGTG AAACGTATTT ACGGCATCAC CGCTAAAGAG 
CGTAAAGATG TTGATGTCTG GCATCCGGAT GTACGTTTCT TCGAACTGTA TGACGAGAAC 
AACGAACTGC GCGGCAGCTT CTACCTCGAT CTGTATGCCC GTGAAAACAA GCGCGGCGGG 
GCGTGGATGG ATGACTGCGT AGGCCAGATG CGTAAAGCTG ACGGTTCTCT GCAAAAACCG 
GTCGCGTATT TGACTTGTAA CTTCAACCGC CCGGTAAATG GTAAACCGGC GCTGTTCACT 
CACGACGAAG TGATCACCCT GTTCCACGAG TTCGGTCACG GCCTGCACCA TATGCTGACC 
CGCATCGAAA CCGCTGGTGT TTCCGGTATC AGCGGTGTGC CGTGGGATGC GGTCGAACTG 
CCGAGTCAGT TTATGGAAAA CTGGTGCTGG GAGCCGGAGG CGCTGGCGTT TATCTCTGGT 
CACTATGAAA CCGGCGAACC GCTGCCGAAA GAGTTGCTGG ATAAAATGCT GGCGGCGAAG 
AACTACCAGG CGGCGCTGTT TATTCTGCGC CAGCTGGAGT TCGGCCTGTT CGATTTCCGC 
CTCCATGCCG AGTTCCGCCC GGATCAGGGT GCGAAAATCC TCGAAACTCT GGCAGAAATC 
AAGAAACTGG TTGCCGTAGT ACCGTCTCCA TCCTGGGGCC GTTTCCCGCA CGCTTTCAGC 
CATATTTTCG CCGGTGGTTA TGCCGCAGGT TACTACAGCT ACCTGTGGGC TGACGTACTG 
GCGGCAGATG CCTTCTCGCG CTTTGAGGAA GAGGGCATTT TCAACCGTGA AACCGGGCAG 
TCGTTCCTCG ACAACATTCT GAGCCGTGGC GGTTCAGAAG AGCCGATGGA TCTGTTCAAA 
CGCTTCCGTG GTCGTGAACC GCAGCTGGAT GCGATGCTGG AGCATTACGG CATTAAGGGC 
TGA

Protein sequence

MTNPLLTPFE LPPFSKILPE HVVPAVTQAL NDCRENVERV VAQGAPYTWE NLCQPLAEVD 
DVLGRIFSPV SHLNSVKNSP ELREAYEQTL PLLSEYSTWV GQHEGLYKAY RDLRDGDHYA 
TLNTAQKKAV DNALRDFELS GIGLPKEKQQ RYGEIATRLS ELGNQYSNNV LDATMGWTKL 
VTDEAELAGM PESALAAAKA QAEAKELEGY LLTLDIPSYL PVMTYCDNQA LREEMYRAYS 
TRASDQGPNA GKWDNSKVME EILALRHELA QLLGFENYAF KSLATKMAEN PQQVLDFLTD 
LAKRARPQGE KELAQLRAFA KAEFGVDELQ PWDIAYYSEK QKQHLYSISD EQLRPYFPEN 
KAVNGLFEVV KRIYGITAKE RKDVDVWHPD VRFFELYDEN NELRGSFYLD LYARENKRGG 
AWMDDCVGQM RKADGSLQKP VAYLTCNFNR PVNGKPALFT HDEVITLFHE FGHGLHHMLT 
RIETAGVSGI SGVPWDAVEL PSQFMENWCW EPEALAFISG HYETGEPLPK ELLDKMLAAK 
NYQAALFILR QLEFGLFDFR LHAEFRPDQG AKILETLAEI KKLVAVVPSP SWGRFPHAFS 
HIFAGGYAAG YYSYLWADVL AADAFSRFEE EGIFNRETGQ SFLDNILSRG GSEEPMDLFK 
RFRGREPQLD AMLEHYGIKG