Gene Saro_3336 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3336
Symbol
ID	3915983
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	3558219
End bp	3559232
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	67%
IMG OID	640446121
Product	ferrochelatase
Protein accession	YP_498605
Protein GI	87201348
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0276] Protoheme ferro-lyase (ferrochelatase)
TIGRFAM ID	[TIGR00109] ferrochelatase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCGCC CCGCAGACCA CCCCACTGTT CTCACCGGCA AGGTCGGGGT GCTTCTGGTC 
AACCTCGGCA CGCCCGATGC GCCCGATGCG GGCGCGGTGA AGCGCTATCT CAAGGAGTTC 
CTGTCCGACC GCCGTGTGGT GGAAATTCCC GCGCTCGTCT GGCAGCCGAT CCTGCGTGGC 
ATCATCCTGA ACACGCGCCC CCGGAAATCA GCGCACGCCT ACGCCCAGGT ATGGACGGAT 
GAGGGATCGC CGCTGGCCGC GATCACGGCC GCGCAGGCAC GCGCGCTTCA GGCACGGCTG 
GGCGAAAGCG CGATCGTGCG GCACGCAATG CGCTACCAAT CGCCCGCCAT GGCGAAAGAG 
CTGGACGCGC TGCTGCAGGC CGGGTGCGAG CGCATTCTCG TCGCGCCGCT CTACCCGCAC 
TATTCGGGGG CGACGACGGC TTCCGCGCTC GATGCGGTGG CAGACTGGAT CAAGGCGCGT 
CGCCGCCTTC CCGCACTGCG CACCCTGCCG CCTTATCACG ACGATCCGGC CTATATCGGC 
GCGCTTCACG CCGACCTCTC GCGCCAGATC GACGCTCTCG ACTTCGCGCC CGAACTGCTG 
CTGCTGAGTT ATCACGGCAT GCCCGAACGG ACGCTGCACT TGGGCGACCC CTACCACTGC 
CACTGCCGCA AGACCTCGCG CCTGCTGGGC GAGCGTTTTG CGCAGAGCAA TCCGGCGCTG 
CGGCTGGAGA CCACGTTCCA GTCGCGTTTC GGCAAGGCAA AGTGGCTCGA GCCTGCAACC 
GATGCCGTGC TGGTCGACGA AGCTCGCAAG GGCACGCGCC GCATCGCCAT CGCCGCGCCC 
GGGTTTTCCG CCGATTGCCT GGAAACGCTC GAGGAACTGG CGATCCGCGG CAAGGAAGAT 
TTCGTCGCGG CGGGTGGTAC GCACTTCGCC TCGCTCGCCT GTCTCAATGC GGGCGACGAC 
GGCATGGACA TGATCGAGGC GCTGGTCCGG CGCGAGCTTT CGGGCTGGAT CTGA

Protein sequence

MQRPADHPTV LTGKVGVLLV NLGTPDAPDA GAVKRYLKEF LSDRRVVEIP ALVWQPILRG 
IILNTRPRKS AHAYAQVWTD EGSPLAAITA AQARALQARL GESAIVRHAM RYQSPAMAKE 
LDALLQAGCE RILVAPLYPH YSGATTASAL DAVADWIKAR RRLPALRTLP PYHDDPAYIG 
ALHADLSRQI DALDFAPELL LLSYHGMPER TLHLGDPYHC HCRKTSRLLG ERFAQSNPAL 
RLETTFQSRF GKAKWLEPAT DAVLVDEARK GTRRIAIAAP GFSADCLETL EELAIRGKED 
FVAAGGTHFA SLACLNAGDD GMDMIEALVR RELSGWI