Gene YpAngola_A0649 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A0649
Symbol	hmuS
ID	5799111
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	-
Start bp	652242
End bp	653279
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	51%
IMG OID	641338650
Product	hemin transport protein
Protein accession	YP_001605231
Protein GI	162421334
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3720] Putative heme degradation protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.626507
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCAT CATTATACCA ACAATATGTA CAGGCTAAAG CAGAGCACCC TGGCAAATAT 
GCCCGTGATT TAGCCACCCT GATGGGGATT TCAGAAGCAG AGCTGACCCA CAGCCGCGTC 
GGGCATGATG CAAAACGTTT ACAAAGTGAT GCTCGTGCAT TATTGGCCGC ATTGGAATCC 
GTCGGCGAAG TCAAAGCCAT TACCCGCAAC ACCTATGCAG TTCATGAGCA AGTGGGCCGC 
TATGAGAACC AACACTTAAA TGGTCATGCA GGGTTAATCC TCAATCCACG CGCCTTGGAC 
CTCCGGTTAT TCCTGAATCA GTGGGCAAGC GCCTTTACAC TGACCGAAGA GACCCGCCAC 
GGCGTGCGCC ATAGCATCCA ATTTTTCGAC CATCAGGGCG ATGCATTACA CAAAGTGTAT 
GTGACAGAAC AGACAGATAT GTCTGCCTGG GAAGCCTTGC TGGCACAATT TATCATCCCG 
GAAAACCCGG CATTGCAGTT AGAACCTTTG AGCACCCCAG AAGCGGTAGA ACCTACAGCC 
GATGATGCAA CCGTGGATAG CGAATGGCGT GCCATGACCG ATGTACACCA GTTCTTCCAA 
CTGCTTAAAC GCAATAATCT GACCCGTCAG CAGGCGTTCC GCGCTGTTGG TGATGATCTG 
GCTTACCAGG TCGATAACAA CTCACTGACT CAGCTGTTGC ACATCGCCCA GCAAGATCAG 
AACGAGATCA TGATTTTTGT CGGCAACCGC GGCTGTGTAC AAATTTTCAC CGGCCTGATT 
GAAAAAGTCA CACCACACAA CGAATGGATT AATGTCTTCA ATCAGCGCTT TACACTGCAT 
CTGATCGAAA CGGCCATTGC CGAAAGCTGG ATCACCCGCA AACCAACAAA AGACGGTTTT 
GTCACCAGCC TAGAACTGTT TGCTGCTGAT GGTACTCAAC TTGCCCAACT CTACGGCCAG 
CGCACCGAAG GGCAGCCAGA ACAAAACCAA TGGCGTGAAC AGATTGCCCG CCTAATCAAC 
AAGGATATCG CCGCATGA

Protein sequence

MNASLYQQYV QAKAEHPGKY ARDLATLMGI SEAELTHSRV GHDAKRLQSD ARALLAALES 
VGEVKAITRN TYAVHEQVGR YENQHLNGHA GLILNPRALD LRLFLNQWAS AFTLTEETRH 
GVRHSIQFFD HQGDALHKVY VTEQTDMSAW EALLAQFIIP ENPALQLEPL STPEAVEPTA 
DDATVDSEWR AMTDVHQFFQ LLKRNNLTRQ QAFRAVGDDL AYQVDNNSLT QLLHIAQQDQ 
NEIMIFVGNR GCVQIFTGLI EKVTPHNEWI NVFNQRFTLH LIETAIAESW ITRKPTKDGF 
VTSLELFAAD GTQLAQLYGQ RTEGQPEQNQ WREQIARLIN KDIAA