Gene YpsIP31758_3156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_3156
Symbol	pepD
ID	5386787
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	+
Start bp	3554042
End bp	3555502
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	49%
IMG OID	640866163
Product	aminoacyl-histidine dipeptidase
Protein accession	YP_001402116
Protein GI	153948494
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2195] Di- and tripeptidases
TIGRFAM ID	[TIGR01893] aminoacyl-histidine dipeptidase

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCTGAAC TGTCTCAACT TTCGCCTCAG CCGTTGTGGG ATATTTTTGC AAAAATTTGT 
TCTATCCCAC ATCCCTCTTA CCATGAAGAA GCGCTGGCAC AATATATTGT TACCTGGGCC 
AAAGAGAAAG GCCTGCACGC CGAGCGTGAT CAGGTCGGTA ATATCCTGCT GCGTAAACCT 
GCCACTAAAG GGATGGAAAA CCGCAAGCCT GTTGCACTGC AAGCGCATTT AGATATGGTG 
CCACAGAAAA ATAATGACAC GGTACATGAC TTTACCAAAG ATCCTATCCA GCCTTATATC 
GACGGCGAAT GGGTGAAAGC CCGTGGTACC ACATTAGGCG CAGATAATGG TATTGGTATG 
GCATCCGCTC TGGCAGTGTT ATCTGATGAT CGCGTTGAGC ATGGGCCACT AGAAGTGTTG 
TTAACCATGA CCGAAGAAGC CGGTATGGAT GGTGCCTTCG GCCTGCAACC TAATTGGCTG 
AAAGCCGATA TTCTGATCAA TACCGATTCT GAGCAGGAAG GCGAAATCTA CATGGGCTGT 
GCCGGTGGTA TTGATTTCAT CACCACCATG CCGCTACAGC GGGAAGCTAT CCCTGTGGGC 
TATCAAACAC TAAAATTGAC GATCAAAGGC CTAAAAGGCG GCCACTCAGG TGCGGATATC 
CATTTAGGTT TAGGTAACGC CAACAAACTG CTGGCCCGCT TCCTGTTTGA ACAAGCAAAA 
GATTTAGATC TGCGGGTGCT GGATCTGAAT GGCGGTACTT TACGTAACGC AATTCCACGG 
GAAGGTCACG TAACACTGGC TGTTGCCGCA GACAAAGTGG AACAGCTGAA AAACCTGAGC 
CAGAATTACC TGGCAACGTT GAAAGACGAG TTGATCGCGG TCGAAAAAAA TCTGACCCTA 
GTACTCGAAC CCGTCTCTAC CGAGACGAAA GCACTGACTA AAGAGACTCA ACAGCGTTTT 
GTCGCATTAC TGAATGCCAC GCCAAATGGT GTGATCCGCA TGAGTGATGC GGTTAAAGGT 
GTCGTAGAAA CCTCACTTAA CGTGGGTGTT GTTACGATGA ATGAGCATGA AGCAGAAATT 
GTCTGCCTGA TTCGTTCCCT GATCGACAGC GGTAAAGATT ACGTAGCCAG TATGCTGACC 
GCAATTGGTG AATTAGCGGG TGCCAAAACA TCGCCAAGCG GCGGCTATCC TGGCTGGCAA 
CCGGATCCAA CGTCACCGGT CATGGCACTG GTACGGGAAA CCTACCAAAA ACTGTTCAAC 
AAAACGCCTA ACATCATGGT TATCCATGCC GGTCTGGAAT GTGGTTTGTT CAAAAAACCC 
TATCCTAACA TGGACATGGT GTCGATTGGG CCAACCATGA CCGGCCCGCA TTCACCAGAT 
GAACAAGTTC ATATTGAGAG CGTTGGTCAA TATTGGCAGT TATTAACCGC CCTGCTGAAA 
GCGATACCTG AACGTACATA A

Protein sequence

MSELSQLSPQ PLWDIFAKIC SIPHPSYHEE ALAQYIVTWA KEKGLHAERD QVGNILLRKP 
ATKGMENRKP VALQAHLDMV PQKNNDTVHD FTKDPIQPYI DGEWVKARGT TLGADNGIGM 
ASALAVLSDD RVEHGPLEVL LTMTEEAGMD GAFGLQPNWL KADILINTDS EQEGEIYMGC 
AGGIDFITTM PLQREAIPVG YQTLKLTIKG LKGGHSGADI HLGLGNANKL LARFLFEQAK 
DLDLRVLDLN GGTLRNAIPR EGHVTLAVAA DKVEQLKNLS QNYLATLKDE LIAVEKNLTL 
VLEPVSTETK ALTKETQQRF VALLNATPNG VIRMSDAVKG VVETSLNVGV VTMNEHEAEI 
VCLIRSLIDS GKDYVASMLT AIGELAGAKT SPSGGYPGWQ PDPTSPVMAL VRETYQKLFN 
KTPNIMVIHA GLECGLFKKP YPNMDMVSIG PTMTGPHSPD EQVHIESVGQ YWQLLTALLK 
AIPERT