Gene SbBS512_E1702 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E1702
Symbol	dcp
ID	6272168
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	1548752
End bp	1550797
Gene Length	2046 bp
Protein Length	681 aa
Translation table	11
GC content	50%
IMG OID	641725782
Product	dipeptidyl carboxypeptidase II
Protein accession	YP_001880280
Protein GI	187732722
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0339] Zn-dependent oligopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0043073
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAACAA TGAATCCTTT CCTTGTGCAA AGCACACTAC CGTATCTGGC TCCCCATTTT 
GATCAAATTG CCAATCATCA CTATCGCCCG GCATTCGATG AGGGAATGCA GCAAAAGCGG 
GCAGAAATTG CTGCCATCGC GCTTAACCCG CAAACGCCTG ATTTCAACAA TACTATTCTG 
GCACTGGAAC AAAGCGGAGA ATTACTTACC CGCGTTACCA GCGTCTTTTT TGCGATGACT 
GCGGCGCATA CCAATGATGA ATTACAGCGT CTTGATGAAC AGTTTTCCGC TGAACTGGCG 
GAACTGGCTA ATGATATCTA TCTGAACGGT GAATTATTCG CGCGGGTAGA TGCTGTCTGG 
CAGCGCCGTG AATCCCTGGG GCTTGATAGT GAATCCATCC GCCTGGTGGA GGTGATTCAT 
CAACGTTTTG TCCTTGCCGG AGCCAAACTT GCGCAAGCTG ATAAAGCAAA ATTAAAAGTA 
CTGAATACAG AAGCTGCGAC CCTGACCAGC CAGTTTAACC AGCGATTACT GGCAGCAAAT 
AAATCCGGCG GTCTGGTTGT GAACGATATC GCGCAGCTGG CAGGAATGAG TGAGCAAGAG 
ATTGCGCTGG CGGCAGAGGC GGCTCGCGAG AAAGGTCTGG ATAACAAATG GCTGATTCCG 
CTGCTGAATA CCACCCAACA ACCGGCGCTT GCCGAGATGC GCGATCGTGC GACGCGTGAA 
AAACTGTTTA TTGCGGGCTG GACGCGAGCG GAAAAAAATG ATGCCAATGA TACCCGCGCT 
ATCATTCAAC GTCTGGTAGA GATTCGCGCA CAGCAGGCGA AACTGCTTGA TTTTCCTCAT 
TATGCCGCAT GGAAAATCGC CGATCAGATG GCAAAAACGC CAGAAGCAGC ACTCAACTTT 
ATGCGGGAAA TTGTTCCAGC GGCGCGTCAA CGTGCTAGCG ATGAATTAGC CTCCATACAG 
GCGGTTATCG ATAAGCAGCA AGGCGGGTTT AGCGCGCAGC CGTGGGACTG GGCATTTTAT 
GCCGAACAGG TACGGCGGGA GAAATTTGAT CTTGATGAGG CGCAGCTCAA GCCATATTTT 
GAATTAAACA CGGTGTTGAA TGAAGGTGTA TTCTGGACCG CGAATCAGCT CTTCGGTATT 
AAGTTTGTCG AACGTTTTGA TATTCCTGTC TACCATCCTG ACGTTCGTGT GTGGGAAATT 
TTTGATCATA ATGGCGTGGG ACTGGCGTTA TTTTACGGTG ATTTCTTCGC CCGTGATTCA 
AAAAGCGGCG GTGCATGGAT GGGCAATTTT GTTGAGCAAT CAACGCTTAA TGAAACGCAT 
CCGGTAATTT ATAACGTTTG CAATTATCAG AAACCCGCTG CCGGTGAGCC TGCGTTGTTA 
CTCTGGGATG ATGTCATAAC CTTATTCCAT GAATTTGGTC ATACGCTGCA CGGCCTTTTT 
GCCCGCCAGC GTTATGCCAC GCTTTCCGGC ACCAACACGC CGCGTGATTT TGTCGAATTT 
CCGTCGCAAA TCAACGAACA CTGGGCAACG CATCCGCAGG TATTCGCTCG CTACGCCCGG 
CATTATCAGA GCGGGGCAGC AATGCCTGAC GAACTGCAAC AGAAAATGCG TAATGCCAGC 
CTGTTCAACA AAGGGTATGA GATGAGCGAA CTGCTTAGCG CCGCACTTCT CGATATGCGC 
TGGCATTGCC TGGAAGAAAA CGAAGCAATG CAGGATGTCG ATGATTTTGA ATTGCGGGCG 
CTGGTGGCGG AAAATATGGA TCTTCCTGCT ATACCGCCAC GCTATCGCAG CAGTTATTTC 
GCCCATATTT TTGGTGGCGG ATATGCTGCA GGTTATTACG CTTATCTGTG GACGCAAATG 
TTGGCCGATG ATGGTTACCA GTGGTTTGTT GAGCAGGGCG GATTAACGCG TGAAAATGGG 
CAGCGTTTTC GCGAGGCGAT CCTTTCCAGA GGTAACAGCG AAGATCTGGA ACGCCTGTAT 
CGACAATGGC GCGGTAAGGC TCCTCAGATT ATGCCGATGC TGCAACATCG TGGCTTGAAT 
ATATAA

Protein sequence

MTTMNPFLVQ STLPYLAPHF DQIANHHYRP AFDEGMQQKR AEIAAIALNP QTPDFNNTIL 
ALEQSGELLT RVTSVFFAMT AAHTNDELQR LDEQFSAELA ELANDIYLNG ELFARVDAVW 
QRRESLGLDS ESIRLVEVIH QRFVLAGAKL AQADKAKLKV LNTEAATLTS QFNQRLLAAN 
KSGGLVVNDI AQLAGMSEQE IALAAEAARE KGLDNKWLIP LLNTTQQPAL AEMRDRATRE 
KLFIAGWTRA EKNDANDTRA IIQRLVEIRA QQAKLLDFPH YAAWKIADQM AKTPEAALNF 
MREIVPAARQ RASDELASIQ AVIDKQQGGF SAQPWDWAFY AEQVRREKFD LDEAQLKPYF 
ELNTVLNEGV FWTANQLFGI KFVERFDIPV YHPDVRVWEI FDHNGVGLAL FYGDFFARDS 
KSGGAWMGNF VEQSTLNETH PVIYNVCNYQ KPAAGEPALL LWDDVITLFH EFGHTLHGLF 
ARQRYATLSG TNTPRDFVEF PSQINEHWAT HPQVFARYAR HYQSGAAMPD ELQQKMRNAS 
LFNKGYEMSE LLSAALLDMR WHCLEENEAM QDVDDFELRA LVAENMDLPA IPPRYRSSYF 
AHIFGGGYAA GYYAYLWTQM LADDGYQWFV EQGGLTRENG QRFREAILSR GNSEDLERLY 
RQWRGKAPQI MPMLQHRGLN I