Gene YpAngola_A2140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A2140
Symbol
ID	5800610
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	2236766
End bp	2237983
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	46%
IMG OID	641340048
Product	putative endopeptidase
Protein accession	YP_001606593
Protein GI	162421091
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.332227
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.318783
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGTAAAG AAAAAATTGA GCATTTAGAA GCAGTAAGCC GTAAAGCCCG CGTGGTCATG 
GAGCGTGAGG GGATTGATGC GCTGGTGGTG ACTGTTTGTG ACAATTTCTA TTATCTCACG 
GGTTTTGCCA GCTTCTTTAT GTATACCTTC CGGCATACCG GTGCGGCGGT TGCGATCATG 
TTTCGTGATG CGAATATCCC TTCACAAATC ATCATGAATG AATTTGAGGC TGCCAGTACG 
CATTTTGATA TGCCGAATAG TGTACTGAAA ACGTTTCCGG TGTGGGTTGA TGTTGATGAC 
CCGCGTAATC CGCATCATCA TTATAAAAAA CGTGATCGGC CTATTGGCCC ACCGGTGGAA 
GCGGTCTTTA GTTTAGTTAA AAACGCACTT GAAGATGCGG GAGTGCTGGA TAAGACGATT 
GCCATTGAAT TACAGGCGAT GTCAAACGGC GGTAAAGGTG TATTAGATAA AGTTGCACCT 
GGGCTGAAAT TAGTCGATTC AACGGCATTG TTCAATGAAA TAAGAATGAT TAAAAGCCCG 
TGGGAAATTG AACACCTACG AAAAAGAGCT GAAATCACTG AATATGGTAT TGCCAGCGCG 
GCTAAAAAAA TACGGGTAGG GTGTACGGCA GCTGAATTGA CTGCTGCATT TAAAGCGGCG 
GTAATGTCGT TCCCAGAAAC GAACTTTTCA CGCTTTAATC TGATCTCGGT GGGGGACAAT 
TTCTCACCAA AAATAATCGC AGATACGACA CCGGCAAAAG TGGGGGATTT GATTAAGTTT 
GACTGCGGGA TCGATGTTGC TGGCTACGGT GCTGATCTGG CAAGAACGTT TGTGCTCGGT 
GAGCCGGATA AACTGACGCA GCAGATATAT GACACCATCA GAACGGGTCA TGAGCATATG 
CTATCAATGG TGGCACCGGG GGTGAAATTA AAAGCGGTTT TTGACTCCAC GATGGCGGTG 
ATTAAGACGT CAGGTTTACC TCATTATAAC CGGGGCCATC TTGGGCACGG TGATGGTGTG 
TTTCTGGGCC TTGAAGAAGT GCCTTTTGTT AGCACACAGG CAACTGAAAC GTTTTGTCCC 
GGTATGGTCT TAAGCCTTGA AACGCCTTAT TACGGCATTG GGGTTGGCTC AATTATGTTA 
GAAGACATGA TCTTAATTAC TGACAGTGGC TTTGAGTTTT TAAGCAAACT GGATCGTGAC 
TTACGTCGGT ATTTCTAA

Protein sequence

MGKEKIEHLE AVSRKARVVM EREGIDALVV TVCDNFYYLT GFASFFMYTF RHTGAAVAIM 
FRDANIPSQI IMNEFEAAST HFDMPNSVLK TFPVWVDVDD PRNPHHHYKK RDRPIGPPVE 
AVFSLVKNAL EDAGVLDKTI AIELQAMSNG GKGVLDKVAP GLKLVDSTAL FNEIRMIKSP 
WEIEHLRKRA EITEYGIASA AKKIRVGCTA AELTAAFKAA VMSFPETNFS RFNLISVGDN 
FSPKIIADTT PAKVGDLIKF DCGIDVAGYG ADLARTFVLG EPDKLTQQIY DTIRTGHEHM 
LSMVAPGVKL KAVFDSTMAV IKTSGLPHYN RGHLGHGDGV FLGLEEVPFV STQATETFCP 
GMVLSLETPY YGIGVGSIML EDMILITDSG FEFLSKLDRD LRRYF