Gene YpAngola_A0185 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A0185
Symbol
ID	5798649
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	196310
End bp	197650
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	50%
IMG OID	641338206
Product	hypothetical protein
Protein accession	YP_001604812
Protein GI	162419886
COG category	[R] General function prediction only
COG ID	[COG4099] Predicted peptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.000162284
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.000128495
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCTAACAC GCCGGAAATT TTTGATGATG AGTGCCGGAG CAGGTCTTTT ACTCTCTGTA 
CCCATGTTGG CTCGAACCGG TGTTCAGCCT GCACAAGCTG CCACCGCCAT TACGCAAGTT 
TTTGGTGACG GGATCCGGCT AACCGCTGTT GCGGTCGAAT ATCCGACAGA AGTCAGCGCT 
GAAGGGCTAA ACCCCGCCGA CTTTCATGTT GAAGGGCGAA CAGTAACCGG TGTATGGACC 
AGCACTTCTA CTAATCCGGC AGATATAGCG CCCTCAGGAC GCTATATGAT TATAGCGCTA 
TCACCTGATG ACAAGAATGC AACGCTGGCC GAACAGGTGC AGCCAAATAG TAAAAACAAC 
AGCAACAAAT CTGCCAATGG AAGAGGCGGC CCCGGTAATG CAGGCGATAT TCCTGCCTAT 
GATACGGTTT ACCGGACAGC TCAAGCCACG GTACTGCGCC TTCCGTCAGT TCATACCGCC 
AGTGGTGATA CGCTTCCCGC TAGCGAGAAA GCGTTGACAA CCCAATATGT GGAAAACTTG 
ATCGTTGATG ATTTTCAGCA GCTTGAGTTT TATGATGAAA AAACAGGTAA AAAGCTGAAA 
TACAACCTTT TCATCCCCAA AGACTATAGC CCTGATAAGG CTTGGCCGCT GGTGTTATTC 
ATGCATGATG CTGGCGCCAC CAGCGATGTT ACACGCACCA CCCTGTATCA AGGCTTAGGC 
GCTATTGCTT GGGCAAGCCC AGAAGATCAG GCACAGCGCC CCTGCTTTGT TCTTGCACCT 
CAGTATGAAG AAATCATTGC CGATGATGAC TCAAAAACAT CTGACATGCT GGACACCACC 
ATTGATCTTA TCAATGTACT TTCAGAGCAG TACAACATTG ATAAGAGCCG TATCTATGCC 
ACAGGGCAGT CGGGTGGATG CATGATGACG ATAGCGATGA ACATCAAGTA TCCGGATTTC 
TTCGCGGCCT CTTTTTTGGT TGCGGGTCAG TGGGATCCCG CGTTGGTGAA ACCTCTTGCC 
CAGCAAAAAC TCTGGATTCT GGTTTCTCAG GATGATAACA AAGCCTGGCC AGGTCAGAAT 
GCCATCATTG ATGTTCTGGA AAAAGAGGGT GTCCAAATCA GCCGTGCAAT ATGGGACGGA 
ACATGGAATG AAGAGCAATT TCGTCAGGCT TTTGAACAAA TAGAGGCAGA AAAAAGCCCG 
ATTAACTATG TGGCATTTCG TGAAGGCACC GTGATTCCTG AGGGGCAATC CACCGAAGGT 
GCCAGCGGGC ATCGCAATAC CTGGCGAATT GCCTATACCA TCTCCCCCAT ACGCGAATGG 
ATTTTCAGGC AACAGCGCTA G

Protein sequence

MLTRRKFLMM SAGAGLLLSV PMLARTGVQP AQAATAITQV FGDGIRLTAV AVEYPTEVSA 
EGLNPADFHV EGRTVTGVWT STSTNPADIA PSGRYMIIAL SPDDKNATLA EQVQPNSKNN 
SNKSANGRGG PGNAGDIPAY DTVYRTAQAT VLRLPSVHTA SGDTLPASEK ALTTQYVENL 
IVDDFQQLEF YDEKTGKKLK YNLFIPKDYS PDKAWPLVLF MHDAGATSDV TRTTLYQGLG 
AIAWASPEDQ AQRPCFVLAP QYEEIIADDD SKTSDMLDTT IDLINVLSEQ YNIDKSRIYA 
TGQSGGCMMT IAMNIKYPDF FAASFLVAGQ WDPALVKPLA QQKLWILVSQ DDNKAWPGQN 
AIIDVLEKEG VQISRAIWDG TWNEEQFRQA FEQIEAEKSP INYVAFREGT VIPEGQSTEG 
ASGHRNTWRI AYTISPIREW IFRQQR