Gene YpsIP31758_3802 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_3802
Symbol	hmuS
ID	5388269
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	+
Start bp	4287263
End bp	4288300
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	50%
IMG OID	640866826
Product	hemin transport protein HmuS
Protein accession	YP_001402756
Protein GI	153948965
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3720] Putative heme degradation protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.157449
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCAT CATTATACCA ACAATATGTA CAGGCTAAAG CAGAGCACCC TGGCAAATAT 
GCCCGTGATT TAGCCACCCT GATGGGGATT TCAGAAGCAG AGCTGACCCA CAGCCGCGTC 
AGGCATGATG CAAAACGTTT ACAAAGTGAT GCTCGTGCAT TATTGGCCGC ATTGGAATCC 
GTCGGCGAAG TCAAAGCCAT TACCCGCAAC ACCTATGCAG TTCATGAGCA AGTGGGCCGC 
TATGAGAACC AACACTTAAA TGGTCATGCA GGGTTAATCC TCAATCCACG CGCCTTGGAC 
CTCCGGTTAT TCCTGAATCA GTGGGCAAGC GCCTTTACAC TGACCGAAGA GACCCGCCAC 
GGCGTGCGCC ATAGCATCCA ATTTTTCGAC CATCAGGGCG ATGCATTACA CAAAGTGTAT 
GTGACAGAAC AGACAGATAT GTCTGCCTGG GAAGCCTTGC TGGCACAATT TATCATCCCG 
GAAAACCCGG CATTGCAGTT AGAACCTTTG AGCACCCCAG AAGCGGTAGA ACCTACAGCC 
GATGATGCAA CCGTGGATAG CGAATGGCGT GCCATGACCG ATGTACACCA GTTCTTCCAA 
CTGCTTAAAC GCAATAATCT GACCCGTCAG CAGGCGTTCC GCGCTGTTGG TGATGATCTG 
GCTTACCAGG TCGATAACAA CTCACTGACT CAGCTGTTGC ACATCGCCCA GCAAGATCAG 
AACGAGATCA TGATTTTTGT CGGCAACCGC GGCTGTGTAC AAATTTTCAC CGGCCTGATT 
GAAAAAGTCA CACCACACAA CGAATGGATT AATGTCTTCA ATCAGCGCTT TACACTGCAT 
CTGATCGAAA CGGCCATTGC CGAAAGCTGG ATCACCCGCA AACCAACAAA AGACGGTTTT 
GTCACCAGCC TAGAACTGTT TGCTGCTGAT GGTACTCAAC TTGCCCAACT CTACGGCCAG 
CGCACCGAAG GACAGCCAGA ACAAAACCAA TGGCGTGAAC AGATTGCCCG CCTAATCAAC 
AAGGATATCG CCGCATGA

Protein sequence

MSASLYQQYV QAKAEHPGKY ARDLATLMGI SEAELTHSRV RHDAKRLQSD ARALLAALES 
VGEVKAITRN TYAVHEQVGR YENQHLNGHA GLILNPRALD LRLFLNQWAS AFTLTEETRH 
GVRHSIQFFD HQGDALHKVY VTEQTDMSAW EALLAQFIIP ENPALQLEPL STPEAVEPTA 
DDATVDSEWR AMTDVHQFFQ LLKRNNLTRQ QAFRAVGDDL AYQVDNNSLT QLLHIAQQDQ 
NEIMIFVGNR GCVQIFTGLI EKVTPHNEWI NVFNQRFTLH LIETAIAESW ITRKPTKDGF 
VTSLELFAAD GTQLAQLYGQ RTEGQPEQNQ WREQIARLIN KDIAA