Gene Dshi_0574 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_0574
Symbol	hmuS
ID	5712027
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	563756
End bp	564787
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	66%
IMG OID	641266476
Product	hemin transport protein hmuS
Protein accession	YP_001531921
Protein GI	159043127
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3720] Putative heme degradation protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.790836
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAGATG CAAAAGAGAT CCGGGAGGCG CGCACCCACA AGGCCGGGCG CGCGCGCGAC 
ATAGCCCAGG CGCTCGGGCT GCCGGAGGCC GCGCTGGTCG CGGCGCAGGT CGGGCATGAT 
GCCGTGGCGC TGCGCCCGCA TCCAAACGAC CTGATCCCGG CCCTCGGGGC CCTCGGCCCG 
ATGATGGCGC TCACGCGCAA CGACGCCTGC GTCATCGAAA AGGATGGGGA ATATACCGAC 
TACCACGGGG GCGATCACGC GACGATGACC CTCAACGAGG GGATCGATTT GCGGATGTTT 
CCGCGCCACT GGGTGCATGC CTTCGCGGTC TCCGAGCAGG TCAAGAGCGG TCTGCGCCAC 
AGCGTGCAGG TGTTCGACGC CGCAGGCGAT GCGGTGCACA AGGCCTATCT GCGCGACGGC 
GCGGACATGG CGGCCTGGAC ACGGCTGCAA TCGGACCTCG CCCTGCCCGC GCAAACCGAC 
ACCTTGGCCC TGAAGGATCG GGAGCCGCCC GAGGGCGCGC GGATCAATCT CGACAAGCGC 
GACATCCTGC TCAAGGAGTG GGCACGGCTC ACCGACACTC ACCAATTCCT GCGCCTCTGC 
GCCAAGCTGA AAATGAACCG GTTGGGCGCC TATCGGATTG CGGAACCCCC CTTCGTGCGG 
CCGCTTGCGC CTTCGGCAGT GGACACGATG TTGCGCGCGA TACAGGTTGC GGGATTCGAG 
ATCATGCTGT TCGTCGGCAA TCGCGGCTGC ATCGAAATCC ACACCGGCCC CCTTCGGCGG 
ATAGAGCCGA TGGGCCCCTG GGTGAACGTG CTGGACCCGG ACTTCAACCT CCATCTGCGC 
GGCGACAAGG TCGCGGAGGT CTGGCAGGTC GAAAAGCCGA CACAACGCGG CCCGGCTGTC 
TCGGTCGAGG CGTTCGACGC CGACGGTGTC CTGATCCTTC AGGCGTTCGG CGTTCCGAAG 
GAAGGCAAGG ATACCCGCAC CGCGTTCACC GAGATCGTCA ACGGCTTGCC GACACAGGAG 
ACCACGGCAT GA

Protein sequence

MLDAKEIREA RTHKAGRARD IAQALGLPEA ALVAAQVGHD AVALRPHPND LIPALGALGP 
MMALTRNDAC VIEKDGEYTD YHGGDHATMT LNEGIDLRMF PRHWVHAFAV SEQVKSGLRH 
SVQVFDAAGD AVHKAYLRDG ADMAAWTRLQ SDLALPAQTD TLALKDREPP EGARINLDKR 
DILLKEWARL TDTHQFLRLC AKLKMNRLGA YRIAEPPFVR PLAPSAVDTM LRAIQVAGFE 
IMLFVGNRGC IEIHTGPLRR IEPMGPWVNV LDPDFNLHLR GDKVAEVWQV EKPTQRGPAV 
SVEAFDADGV LILQAFGVPK EGKDTRTAFT EIVNGLPTQE TTA