Gene YpAngola_A3827 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A3827
Symbol	pepP
ID	5802305
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	4061030
End bp	4062343
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	51%
IMG OID	641341625
Product	proline aminopeptidase P II
Protein accession	YP_001608136
Protein GI	162420135
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0000338921
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTCAGC AAGAATACCA GAACCGCCGT CAGGCACTGT TGGCGAAAAT GGCCCCTGGC 
AGTGCTGCTA TTATTTTTGC CGCACCAGAA GCCACACGCA GTGCAGATTC TGAATATCCT 
TATCGGCAGA ATAGTGATTT TAGCTATCTG ACGGGCTTCA ACGAGCCAGA AGCGGTGTTG 
ATTCTGGTTA AAAGCGATGA GACTCATAAC CACAGCGTGC TGTTTAACCG GATCCGGGAT 
TTAACCGCTG AGATCTGGTT TGGTCGTCGG TTAGGGCAAG AGGCCGCCCC CACGAAACTG 
GCAGTAGATC GCGCATTACC TTTCGATGAA ATCAACGAGC AGCTCTATTT GCTGCTTAAT 
CGCCTGGATG TGATTTATCA CGCTCAAGGG CAATATGCTT ACGCAGATAA TATTGTTTTT 
GCTGCACTGG AAAAATTACG TCATGGTTTT CGTAAAAATC TCCGAGCGCC AGCCACGTTA 
ACCGATTGGC GGCCTTGGTT GCATGAAATG CGTCTGTTTA AATCAGCCGA AGAGATCGCC 
GTGCTGCGCC GCGCAGGTGA AATCAGCGCA CTGGCCCATA CCCGTGCGAT GGAAAAATGC 
CGCCCCGGTA TGTTTGAATA TCAATTGGAA GGGGAAATTC TGCATGAATT TACCCGCCAT 
GGCGCGCGTT ATCCAGCGTA CAACACCATC GTTGGTGGGG GTGAAAACGG CTGCATTTTG 
CACTATACCG AGAATGAGTG TGAGCTGCGG GACGGGGATT TGGTCCTTAT CGACGCGGGT 
TGTGAATACC GTGGCTATGC CGGTGATATC ACTCGCACTT TCCCGGTAAA TGGCAAATTT 
ACCCCCGCTC AGCGGGCGGT TTATGACATC GTTCTGGCGG CTATCAATAA ATCGCTGACG 
TTGTTCCGCC CCGGTACCAG CATCCGTGAG GTCACGGAAG AAGTGGTGCG GATCATGGTC 
GTCGGTTTGG TGGAGTTGGG TATTCTGAAA GGTGATATCG AACAGTTGAT CGCTGAACAA 
GCCCATCGGC CATTCTTTAT GCATGGCCTA AGCCACTGGC TGGGGATGGA TGTCCATGAC 
GTCGGCGATT ACGGTAGCAG TGACCGTGGC CGTATCCTTG AACCGGGCAT GGTATTAACC 
GTGGAACCGG GCTTGTACAT TGCCCCAGAT GCCGATGTCC CGCCGCAATA CCGGGGCATT 
GGTATTCGTA TTGAAGATGA CATTGTGATT ACCGCCACGG GTAACGAAAA CTTGACCGCG 
AGCGTGGTTA AAGACCCTGA TGACATTGAA GCATTGATGG CATTGAATCA CTGA

Protein sequence

MTQQEYQNRR QALLAKMAPG SAAIIFAAPE ATRSADSEYP YRQNSDFSYL TGFNEPEAVL 
ILVKSDETHN HSVLFNRIRD LTAEIWFGRR LGQEAAPTKL AVDRALPFDE INEQLYLLLN 
RLDVIYHAQG QYAYADNIVF AALEKLRHGF RKNLRAPATL TDWRPWLHEM RLFKSAEEIA 
VLRRAGEISA LAHTRAMEKC RPGMFEYQLE GEILHEFTRH GARYPAYNTI VGGGENGCIL 
HYTENECELR DGDLVLIDAG CEYRGYAGDI TRTFPVNGKF TPAQRAVYDI VLAAINKSLT 
LFRPGTSIRE VTEEVVRIMV VGLVELGILK GDIEQLIAEQ AHRPFFMHGL SHWLGMDVHD 
VGDYGSSDRG RILEPGMVLT VEPGLYIAPD ADVPPQYRGI GIRIEDDIVI TATGNENLTA 
SVVKDPDDIE ALMALNH