Gene Shewmr4_2248 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_2248
Symbol	hemH
ID	4252819
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	-
Start bp	2689382
End bp	2690428
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	53%
IMG OID	638118873
Product	ferrochelatase
Protein accession	YP_734376
Protein GI	113970583
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0276] Protoheme ferro-lyase (ferrochelatase)
TIGRFAM ID	[TIGR00109] ferrochelatase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000320467
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.140516
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAGCCT GCCGAGGTAT TTGGCTGATA AAAGGTACCA CATTGACTTC TCCCTCTCCT 
GCGTTTGGCG TGTTATTGGT CAATCTCGGC ACGCCCGATG AACCCACTCC CAAAGCGGTT 
AAGCGATTCC TCAAACAGTT TTTAAGTGAT CCTCGGGTCG TCGATTTGTC CCCTTGGCTG 
TGGCAGCCGA TTTTGCAGGG GATAATCCTT AACACCCGAC CCGCCAAGGT GGCCAAACTT 
TATCAGAGCG TGTGGACGGA GCAGGGCTCG CCGCTGATGG TGATAAGCGA GCAGCAGGCG 
CAGAAGTTAG CCACGGATCT GAGCGCGACC TTTAATCAAA CCATTCCGGT GGAACTGGGC 
ATGAGCTATG GCAATCCTTC GATTGATAGC GGCTTTGCCA AACTTAAGGC CCAAGGCGCC 
GAACGTATCG TGGTACTGCC GCTGTATCCG CAATATTCCT GCTCGACCGT CGCCAGTGTG 
TTCGATGCGG TGGCGCAGTA TTTTACCCAA GTGCGTGACA TTCCTGAGCT GCGTTTCAGC 
AAACAGTATT TTGACCATGA CGCCTATATC GCGGCCTTAG CGCATTCGGT TAAGCGCCAT 
TGGAAAACCC ATGGGCAGGC CGATAAGTTG ATTTTATCCT TCCACGGTAT TCCGCTGCGT 
TATGCCACCG AAGGCGATCC CTATCCTGAG CAGTGCCGCT CGACGGCTAA GTTATTGGCG 
CAGGCGCTGG AGTTAACCGA CGGACAATGG CAGGTGTGTT TCCAATCCCG CTTCGGTAAA 
GAAGAGTGGT TAACCCCCTA TGCCGATGAG CTGCTGGCCG ATTTACCCCG CCAAGGCGTA 
AAAAGTGTCG ATGTCATTTG CCCAGCCTTT GCCACCGATT GCCTTGAAAC TTTAGAAGAA 
ATTTCCATTG GCGGTAAAGA GACTTTCCTG CATGCGGGCG GCGAGGCCTA TCACTTTATT 
CCCTGTTTAA ATGATGATGA GCTCCATATC GAGCTGCTCA GGCAACTGGT GCAAGAACAA 
GCTCAACCTT GGATATGCGC AGAGTGA

Protein sequence

MLACRGIWLI KGTTLTSPSP AFGVLLVNLG TPDEPTPKAV KRFLKQFLSD PRVVDLSPWL 
WQPILQGIIL NTRPAKVAKL YQSVWTEQGS PLMVISEQQA QKLATDLSAT FNQTIPVELG 
MSYGNPSIDS GFAKLKAQGA ERIVVLPLYP QYSCSTVASV FDAVAQYFTQ VRDIPELRFS 
KQYFDHDAYI AALAHSVKRH WKTHGQADKL ILSFHGIPLR YATEGDPYPE QCRSTAKLLA 
QALELTDGQW QVCFQSRFGK EEWLTPYADE LLADLPRQGV KSVDVICPAF ATDCLETLEE 
ISIGGKETFL HAGGEAYHFI PCLNDDELHI ELLRQLVQEQ AQPWICAE