Gene YpAngola_A4086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A4086
Symbol
ID	5802565
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	4353221
End bp	4355263
Gene Length	2043 bp
Protein Length	680 aa
Translation table	11
GC content	52%
IMG OID	641341865
Product	oligopeptidase A
Protein accession	YP_001608371
Protein GI	162420283
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0339] Zn-dependent oligopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.902618
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAACC CGCTGTTGAC TCCGTTCTCC CTGCCACCGT TTTCTGCTAT TCGGCCTGAA 
GATATCGTGC CTGCGGTGAA ATCCGCGCTG GATGAATGCC GTCAAGCGGT AGAGCGTGTG 
GTTGCCCAAT CAGGGCCGTT CACCTGGGAT AATCTGTGTC AGCCACTGGC CGAATCCGAT 
GACCGCTTAT CGCGCATTTG GTCACCCGTA GGCCACTTGA ACTCAGTAAA AAATAGCCCT 
GAGCTGCGTA CCGCTTATGA ACAAAGCTTG CCATTGCTGT CGGAATACGG CACTTGGGTG 
GGGCAGCATA AAGGTTTGTA TCAGGCGTAT GTCAGCCTGA AAGAGGGGCC GGGTTTTGCC 
GCCTTGACCG CACCGCAGCG CAAAGCGGTA GAAAATGCTC TGCGTGACTT CCAGCTATCC 
GGTATTGGTC TGGCGCCTGA ACAACAAAAG CGTTACGGCG AAATCGTGGC TCGCTTGTCG 
GAGCTTGGCT CGACTTACAG CAATAACGTG CTTGATGCCA CCATGGGGTG GAGCAAACTG 
ATTACCGATG TTGAGCAACT GAAAGGTTTG CCAGAAAGCG CGCTCGCAGC GGCCAAAGCC 
ATGGCAGAAG CCAAAGAGCA GGACGGCTGG TTGCTGACAC TGGATATGCC AAGCTATCTG 
CCGGTACTGA CTTATGCCGA TAACGTGGAA TTGCGCGAAG AGATGTACCG TGCATTTGCC 
ACCCGTGCTT CTGATCAGGG GCCAAACGCG GGGAAATGGG ATAACAGCGA GATCATGGCG 
GAAATTCTGA CACTGCGTCA TGAATTAGCG CAGTTGCTCG GTTTTAACAG TTATGCCGAT 
AAATCGCTGG CCACCAAAAT GGCAGAAAAC CCACAGCAGG TATTGGGCTT CCTGAACGAT 
CTGGCGAAGC GCGCCCGCCC GCAAGCAGAA GAAGAGCTGG CTCAGTTACG TGCTTTTGCT 
AAAGAGCATT ATGGTGTCAG TGAACTCCAG GCTTGGGATA TCACCTATTA TTCCGAGAAA 
CAGAAACAGC ATCTGTTTGC TATCAGTGAT GAACAACTTC GTCCTTATTT CCCGGAACAG 
CGGGTGGTGG AAGGTTTATT CGAAGTGGTG AAACGCATTT ATGGCATTAC AGCCAAAGAG 
CGCCATGATG TCGATACCTG GCATCCGGAT GTCCGCTTCT TCGATTTGTT TGATGCCGAT 
GGTGAACTGC GCGGTAGCTT CTACCTTGAT TTGTATGCGC GCGAAAACAA GCGTGGCGGA 
GCCTGGATGG ATGACTGCGT AGGTAGCCTG CGTTTGGCTA ATGGCCAACT GCAAAAACCA 
GTCGCTTATC TGACTTGCAA TTTTAACGGG CCCGTTGGCG GCAAACCGGC GCTGTTTACT 
CACAATGAAG TGACCACCTT GTTCCATGAG TTCGGCCATG GTTTACATCA TATGCTGACC 
AAAATTGATA CCGCAGGCGT TTCTGGTATC AATGGCGTGC CTTGGGATGC AGTCGAGCTG 
CCAAGTCAGT TTATGGAAAA CTGGTGCTGG GAGCCGGAGG CGCTGGCCTT TATTTCTGGT 
CATTACCAAA CTCATGAGCC TTTGCCGCAA GAGATGCTGG ATAAACTACT GGCGGCGAAA 
AACTATCAGG CGGCGTTGTT TATTCTGCGC CAACTGGAGT TTGGTCTGTT CGATTTCCGG 
ATGCATTATG AGTTCGACCC GCTGACCGGT GCGCAGATCC TGCCTATTTT GTATGAAGTG 
AAAAAACAGG TTGCTGTGGT GCCATCACCG GAATGGGGCC GCTTCCCTCA TGCCTTCAGC 
CATATTTTTG CTGGCGGTTA TGCGGCCGGT TATTACAGCT ATTTATGGGC TGAAGTGCTC 
TCGGCGGATG CGTTCTCACG CTTTGAAGAA GAAGGGATTT TTAATGCCGC TACCGGTCAG 
TCCTTCCTCG ACAACATTCT GTCTCAAGGT GGCTCAGAGG AGCCAATGAC ACTGTTCAAA 
CGCTTCCGTG GCCGTGAACC GCAGTTAGAT GCCATGTTGC GTCATTACGG TATTAAGGGC 
TAA

Protein sequence

MTNPLLTPFS LPPFSAIRPE DIVPAVKSAL DECRQAVERV VAQSGPFTWD NLCQPLAESD 
DRLSRIWSPV GHLNSVKNSP ELRTAYEQSL PLLSEYGTWV GQHKGLYQAY VSLKEGPGFA 
ALTAPQRKAV ENALRDFQLS GIGLAPEQQK RYGEIVARLS ELGSTYSNNV LDATMGWSKL 
ITDVEQLKGL PESALAAAKA MAEAKEQDGW LLTLDMPSYL PVLTYADNVE LREEMYRAFA 
TRASDQGPNA GKWDNSEIMA EILTLRHELA QLLGFNSYAD KSLATKMAEN PQQVLGFLND 
LAKRARPQAE EELAQLRAFA KEHYGVSELQ AWDITYYSEK QKQHLFAISD EQLRPYFPEQ 
RVVEGLFEVV KRIYGITAKE RHDVDTWHPD VRFFDLFDAD GELRGSFYLD LYARENKRGG 
AWMDDCVGSL RLANGQLQKP VAYLTCNFNG PVGGKPALFT HNEVTTLFHE FGHGLHHMLT 
KIDTAGVSGI NGVPWDAVEL PSQFMENWCW EPEALAFISG HYQTHEPLPQ EMLDKLLAAK 
NYQAALFILR QLEFGLFDFR MHYEFDPLTG AQILPILYEV KKQVAVVPSP EWGRFPHAFS 
HIFAGGYAAG YYSYLWAEVL SADAFSRFEE EGIFNAATGQ SFLDNILSQG GSEEPMTLFK 
RFRGREPQLD AMLRHYGIKG