Gene YpAngola_A1961 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A1961
Symbol
ID	5800431
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	-
Start bp	2041111
End bp	2042538
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	49%
IMG OID	641339884
Product	hypothetical protein
Protein accession	YP_001606434
Protein GI	162419810
COG category	[S] Function unknown
COG ID	[COG5383] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.588491
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCCCC AACAGTTTGT GCATCCCGAT GAGATACGGG CCAAATTCTC CAGCGCTATG 
TCGGATATGT ATCAGACCGA AGTCCCTCTA TATAGCACAT TATTACGGCT CGTTGCGGAC 
ACGAATACAC AAGAGATGGT GCAAGATCAG AAACTTACCC GTCATTTGCA GCAAACTGGG 
GAAATTGAAC GCCTAACGAT GGAAAGACAT GGCGCCATCC GCGTCGGGAC AGCCGAAGAA 
CTCAAGATGC TGCGGCGCTT GTTTGCAGTC ATGGGAATGG TGCCGGTCGG TTATTATGAT 
TTAGCACCAG CGGGTGTCCC GGTTCACTCC ACCGCCTTCC GTGCGGTGCA TGAAACCTCA 
CTGCAAGCCT GCCCTTTCAG AGTCTTCACC TCATTACTGC GTCTGGAGTT GATTGAGCAA 
CCTACACTAC GGCAACTGGC TGCGGATATT CTGGCGAAAA GAACAATTTT CACCCCACAG 
GCGATTAAAC TAATTGTTCA GCATGAAACA TCGGGGGGGC TCAATCGCCA TCAAGCCGAT 
GATTTCATTG CTCAGTCGCT GGAAACATTT CGCTGGCATC ATCAGGCAAC GGTCAGCACT 
GAAACCTACC AACAGCTACA CGATCAACAC CGTCTGATTG CTGATGTGGT CGCTTTCAAA 
GGTCCGCATA TTAACCACCT AACTCCACGG ACCTTAAATA TCGACGTCGT ACAAACAGCA 
ATGGCAGAGC ATAATATGAT GCCCAAAGCC GTTATCGAAG GGCCACCCCC CCGCCACTGC 
CCAATACTGT TACGCCAAAC CAGCTTCAAG GCGCTGGAGG AAAAAATCGC GTTTGTATCA 
AATGGTGGGC AAATAATACC AGGCCACCAT ACGGCCCGCT TCGGGGAGAT AGAGCAACGA 
GGAGCCGCTT TGACGGCCAA AGGCCGTAAT CTGTATGACC ACTTACTGCA AAGCGCACAG 
GATCAATTGA ACGTTCCTGT AAATGAGAAC AATGCGGCGC AATATAGCGC GATCCTGAGC 
GAGAAATTTA GTCAATTCCC TGATGATTAC CCAACAATGC GAGCAGAGAA ACTCGCCTTC 
TTCCGCTATT TTCCTACAGA AAAAGGCCTT ATCACTGCAT CAATACAGGA AATACAGGAA 
ATACAGGAAA TACAGGAAAT GACATTAGAC GAACTTATTG ATAACGGCTT TATTCAATAT 
GAACCGTTGG TTTATGAAGA TTTCCTGCCA GTCAGCGCCG CTGGAATATT CCAGTCAAAC 
TTAGGCGAGA AAGGGCAGAG TCACTTTACC GGGCACTCCA ATAAAGCAGA CTTCCAGCGG 
GATTTGGGGA TTGCGGTTAT TGATGAACTG CAACTCTACG AAGCAACCCA GCAACGTTCC 
GTTGCTGAAT GTGCAGCCGC CCTCAAACTA ACGTTGTTAA GCCAATAA

Protein sequence

MPPQQFVHPD EIRAKFSSAM SDMYQTEVPL YSTLLRLVAD TNTQEMVQDQ KLTRHLQQTG 
EIERLTMERH GAIRVGTAEE LKMLRRLFAV MGMVPVGYYD LAPAGVPVHS TAFRAVHETS 
LQACPFRVFT SLLRLELIEQ PTLRQLAADI LAKRTIFTPQ AIKLIVQHET SGGLNRHQAD 
DFIAQSLETF RWHHQATVST ETYQQLHDQH RLIADVVAFK GPHINHLTPR TLNIDVVQTA 
MAEHNMMPKA VIEGPPPRHC PILLRQTSFK ALEEKIAFVS NGGQIIPGHH TARFGEIEQR 
GAALTAKGRN LYDHLLQSAQ DQLNVPVNEN NAAQYSAILS EKFSQFPDDY PTMRAEKLAF 
FRYFPTEKGL ITASIQEIQE IQEIQEMTLD ELIDNGFIQY EPLVYEDFLP VSAAGIFQSN 
LGEKGQSHFT GHSNKADFQR DLGIAVIDEL QLYEATQQRS VAECAAALKL TLLSQ