Gene Noc_1545 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1545
Symbol
ID	3705803
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1715002
End bp	1716108
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	54%
IMG OID	637738030
Product	ferrochelatase
Protein accession	YP_343559
Protein GI	77165034
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0276] Protoheme ferro-lyase (ferrochelatase)
TIGRFAM ID	[TIGR00109] ferrochelatase

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAATTTTA AAGGTTATTC GGATTACCGC CATGATACGG TTGCCCGTAT CGGCGTTTTG 
GTGGCCAGTC TAGGAACACC AGAAGCGCCT ACGGCATCTG CGGTGCGGCG CTTTTTAGCT 
AGCTTCTTAT CTGATCCGCG TGTGGTGGAG TTGCCCCGTC CTTTATGGTG GCTTATTCTC 
CATGGCATTA TTTTGCGTAT TCGGCCATCC CCAGTGGCTC GTCTGTATCA AAGTATCTGG 
CGGGAAGATG GATCTCCACT GCTGAGTTTT GCCCGGCGTG TGGGACAAAG CCTGCAAGCT 
GAATTGGATA GCCGGGGAAG GTCTATTGAA ATAAGGTTAG GAATGCGTCA CGGCTCGCCT 
TCCATCGAAA CGGCGCTGGA GGAACTGCGC CAGTCGGGAG CCCAGCGGCT ATTGGTTTTT 
CCTCTTTATC CCCAGTACTC GGGAAGTACT ACCGGCTCTA CCTTTGATGC GGTAGCCCAA 
GTGCTTTCCA CTTGGCGCTG GGTGCCGGAA TTGCGGATGA TTGCTCAATA CCATGATCAT 
TCCGGCTACC TTGAGGCATT GGCGGAGACG ATTCGGCGTA GCTGGAAAGA GGCGGGGCGG 
GGAGAGCGCT TGCTTATTTC TTTCCATGGC CTGCCGAAAC GGTACTTACT AGCCGGCGAT 
CCCTATCATT GCCAGTGCCA AAAAACCGCT CGCCTTTTGG CAGAGCGATT AGGATTAAAA 
GAGGGCGAAT GGCAAATAGC TTTTCAGTCC CGTTTTGGCC GTGAAGAATG GCTTAAGCCC 
TATGCTGATC ACCTCTTGCA AGCCTGGGCC GAAGCCGGAA TAAAACGGGT GGATGTCGTT 
TGCCCTGGGT TTGCTGTCGA TTGTTTAGAA ACTCTGGAAG AGATGGCCCA GCGTAACAGG 
GAACTGTTTT TACACGCAGG AGGAGAAGAG TATCGCTATA TTCCCGCGCT TAACGATGAG 
TCTGCCCATA TCCGTGCTTT GACCGATCTG GTTGAGCAAC ATATCCAAGG GTGGTCCGAA 
GCCGATTTAG GTGGGGGGCG GGAGGCGACG GGTCAAGCCG CCGAGAGAAG CCGTCAACGG 
GCTTTGGCGC TTGGCGCTAA GCAATAA

Protein sequence

MNFKGYSDYR HDTVARIGVL VASLGTPEAP TASAVRRFLA SFLSDPRVVE LPRPLWWLIL 
HGIILRIRPS PVARLYQSIW REDGSPLLSF ARRVGQSLQA ELDSRGRSIE IRLGMRHGSP 
SIETALEELR QSGAQRLLVF PLYPQYSGST TGSTFDAVAQ VLSTWRWVPE LRMIAQYHDH 
SGYLEALAET IRRSWKEAGR GERLLISFHG LPKRYLLAGD PYHCQCQKTA RLLAERLGLK 
EGEWQIAFQS RFGREEWLKP YADHLLQAWA EAGIKRVDVV CPGFAVDCLE TLEEMAQRNR 
ELFLHAGGEE YRYIPALNDE SAHIRALTDL VEQHIQGWSE ADLGGGREAT GQAAERSRQR 
ALALGAKQ