Gene Sare_3904 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3904
Symbol
ID	5704977
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4444717
End bp	4446057
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	71%
IMG OID	641273329
Product	kynurenine 3-monooxygenase
Protein accession	YP_001538686
Protein GI	159039433
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGCGG ACCACGACGA CGAGGTCGCC GTCGTCGGCG CCGGGCTCTC CGGATGCTTG 
CTCGCTGCCT TCCTCGCCCG GCGCGGCTAC CCGGTCACCC TCTACGAACG CCGGCCCGAC 
CCCCGGACCG GTCGGGTCGA CCGGGGTCGC TCCATCAACC TGGCGCTCTC CGAACGCGGG 
CTGGACGCGT TGCGCCGGAT CGGCCTGGAC GCACGGGTGA TGGCCGAGGC GTTGCCGATG 
CGTGGCCGGA TGATCCACCC GGTTGACGGC GAGCCGCAGT TCCAGGCGTA CAGCGCGGCC 
GGGGACCGGG CGATCAACTC GATCAGCCGG GGGGCGTTGA ACAACGCCCT GCTGACCGAG 
GCCGCCGCGC TGCCGGGCGT ACAGGTCGCC TTCGACCACC GGCTGGTCGA CCTCGACCCG 
GGTACTGGGG AGATGACCTT CGAGACTCCG CAGGGCAAGG TCACCGCTAC CGCGCCAGTG 
GTCCTGGGCG CGGACGGGGC CGGCTCGGCG GTCCGTGGGC AGTTGCTCGG CCACGGGCTG 
CTGCGGGAGA GCCTGGACTT TCTCGACTAC GGCTACAAGG AGCTGACCAT TCCGCCGTTG 
GGCGGAAACT TCGCGCTCGA CCCGGAGGCA CTGCACATCT GGCCGCGGGG TACCTCGATG 
ATGATCGCGC TGCCGAACCC GGACCGCTCC TTCACCTGCA CGCTTTTCTG GCCCACCCAC 
GGCACGGCGA GTTTCGCCTC GCTGGGCAGC CCGGCGGCGA TCGAGCGGCA CTTCGCGCAG 
CACTACCCCG ACCTGCTCCC GCTCGCGCCG AACCTGGTCG ACGAGTATCT GCACAACCCG 
GTCGGGGTGC TCGGTACCGT CCGTTGCGAC CCCTGGCAGG TGAACGGGAC CGTCGGGCTG 
CTCGGCGACG CGGCGCACGC CATCGTGCCG TTCTACGGGC AGGGCGCCAA CTGTGCCTTC 
GAGGACGTGG TGGAACTGGA CCGCTGCCTC GACGAGTGTG CCGACGACTG GTCCGCCGCC 
CTCCCGTTGT ACCAGCACCG CCGACAGGGC AACGCCGAGG CGATCGCCCA GATGGCGCTG 
GCCAACTTTG TCGAGATGCG GGACCGGGTC GCCTCGCCGC TGTTCCAGCT CGGCCGAAGG 
GTGGAGCACA CGCTGGAGCG GGCGTTGCCC GGCCGGTACG TGTCCCGGTA CGAGCTGGTG 
TCCTTCTCGA CCACCCCATA CGCCGAGGTG CGCCGTCGGG TCCGCTATCA ACACCAGGTG 
CTCGGTGCGG TGGTCGGGGG TGCGGCGGCC CTGCTGGCCG GCGCGGTCGG GGCGGCGCTC 
CGGCGACGGA GGCGCGGATG A

Protein sequence

MSADHDDEVA VVGAGLSGCL LAAFLARRGY PVTLYERRPD PRTGRVDRGR SINLALSERG 
LDALRRIGLD ARVMAEALPM RGRMIHPVDG EPQFQAYSAA GDRAINSISR GALNNALLTE 
AAALPGVQVA FDHRLVDLDP GTGEMTFETP QGKVTATAPV VLGADGAGSA VRGQLLGHGL 
LRESLDFLDY GYKELTIPPL GGNFALDPEA LHIWPRGTSM MIALPNPDRS FTCTLFWPTH 
GTASFASLGS PAAIERHFAQ HYPDLLPLAP NLVDEYLHNP VGVLGTVRCD PWQVNGTVGL 
LGDAAHAIVP FYGQGANCAF EDVVELDRCL DECADDWSAA LPLYQHRRQG NAEAIAQMAL 
ANFVEMRDRV ASPLFQLGRR VEHTLERALP GRYVSRYELV SFSTTPYAEV RRRVRYQHQV 
LGAVVGGAAA LLAGAVGAAL RRRRRG