Gene YpAngola_A2546 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A2546
Symbol
ID	5801017
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	2663442
End bp	2664722
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	51%
IMG OID	641340416
Product	hypothetical protein
Protein accession	YP_001606958
Protein GI	162419298
COG category	[S] Function unknown
COG ID	[COG4950] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR01926] uncharacterized peroxidase-related enzyme

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGCAAT TTCGTAGGAG AAATAATGCC CATTGGTATC ATGAGACTCA GTGTAGCGGC 
AGCCTGGAGC ATTGTAGCGG TAGCCCAGTG AATATTTCCA CGACAGTGAA TGTTCCCACG 
ACAGTGAATA ATGAAACCCC CCCTGTTGAT ATTCGGCCAC GTGATCCCAG CGAGAGTGAC 
AACATGAGCA CTGGCAGTAA TATAACTGAA CAGAGCATCA TAACTGAACA GGGCATCTTT 
CTACTTGGCG TGACAGAAAA CATCGCTCCT ACATTACAAG ACACCCTCTA CCATGAGCAG 
CCTATTCTTA CTGCCTCCGA CGCCATGTAT CAGGCCCTGT TCCCAACGAT TATCGAGATC 
AACCACACCA ATACCTTCTC ACTTTATGAT CGGTTAAGTA CTGCGCTGAC GGTCGCTCAG 
GTTACCGGGA TTCAGCGGCT ATGTAGCCAC TATGCTCTCC GTCTCGCGCC GCTCCCCAGC 
CCGGATGCCT CAAGGGAAAG CAATATTAGG CTAACGCAAA TTACGCAATA TGCCCGCCAA 
TTGGCCAGCC AACCTACGTT GATCGATAGG CATGCTTTAG CGCAATTGCA TGACGTGGGT 
TTAACTGATA GCGATATCAT TATTTTATCG CAAATTATTG GATATGTGGG ATATCAAGCC 
CGAGTGGTCG CTGGCATCTC TGCACTGGCT GGTTACCCTA CCGTGATGCT CCCCGGTTTC 
CCCCGCATGG AAGATGCCGC CCCCAGCCCA TTACCAGATG TCATGCCCAA TTGGCAAGGT 
TGGCTACCGT CTCATGCGGC AAACGACGAT CAACCCGATA AAGAACCTGA CGAAACGGCC 
AGCACACTGA CTGAACTGTT GGGCCATCAC CAGCAAAGTT TGCTCGCTTA TCACGCCATT 
ACCACTCACC AGCCCAACTC ACCTCAATTG CAACGTGACT GGCTGGAACT GGTGGCATTG 
GTCAGCGCAC GAATCAATGG CAGCCTCTAC TGCCAAGCCC GTCACAGGCA ACATTTACAG 
CAACTGACGG AGCCGCCCCT GTTGGTCACT GAGCTGTTAA AAGGGATTGA TCACGCGTTA 
TTCTTGTTAC CCGAACAACA AATACCCCAT CAGCTAATCA GTGTAACCGC CGAGCTCACT 
CGCGCCCCGG AACGCTTTAA TCATCAGCAT GTTAAACGTC TACAGACCCT TGGCGTCAGT 
GATACTCAAG TCATGCGAAT TATTTTCAGT ATCGCCATTA CTGGTTGGAC CAACCGCCTA 
CGACATACGT TAGGAAAATA G

Protein sequence

MVQFRRRNNA HWYHETQCSG SLEHCSGSPV NISTTVNVPT TVNNETPPVD IRPRDPSESD 
NMSTGSNITE QSIITEQGIF LLGVTENIAP TLQDTLYHEQ PILTASDAMY QALFPTIIEI 
NHTNTFSLYD RLSTALTVAQ VTGIQRLCSH YALRLAPLPS PDASRESNIR LTQITQYARQ 
LASQPTLIDR HALAQLHDVG LTDSDIIILS QIIGYVGYQA RVVAGISALA GYPTVMLPGF 
PRMEDAAPSP LPDVMPNWQG WLPSHAANDD QPDKEPDETA STLTELLGHH QQSLLAYHAI 
TTHQPNSPQL QRDWLELVAL VSARINGSLY CQARHRQHLQ QLTEPPLLVT ELLKGIDHAL 
FLLPEQQIPH QLISVTAELT RAPERFNHQH VKRLQTLGVS DTQVMRIIFS IAITGWTNRL 
RHTLGK