Gene Franean1_4331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4331
Symbol
ID	5672686
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5173712
End bp	5175067
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	75%
IMG OID	641243204
Product	monooxygenase FAD-binding
Protein accession	YP_001508621
Protein GI	158316113
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.143503
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGGATCG TCTGTGTAGG CGGGGGCCCG GCCGGGCTCT ACTTCGCCAT CTCCGCCAAG 
CGCCGGGACG CCGGCCACGA GATCACCATC ATCGACCGCG ACCCGCCCGG CGCCACCTAC 
GGCTGGGGTG TCGTCTACTG GGACAACCTG CTCGACGTCC TGTTCCGCAA CGATCCCGAC 
AGCGCGCGGG AGATCCGCGG CGCGTCCACG CTCTGGCAGG AGCAGGACAT CAGCCTGGGC 
AGCGAACGGG CGGCGCACTT CGCCGGCTAC GGCTTCAGCG TGCAGCGCGC GGCCCTGCTC 
GACATCCTCA CCCGGCGCGC CGAGGAGCTC GGCGTGCGGG TCGAGCACGA CCGCGAGGTC 
GCCGACCTCA CCGACCTGGC GGACCTGGGG TGCCTCGGCG GCCTCGGCGC GCACGCCGAC 
GCCGACCTTG TGATCGCCGC CGACGGCGCG AACAGCCAGG TGCGCAGCAT GTTCGCGGAC 
CGGTTCGGCA CCCGGGTCGA CACCGGTGGC AACCGCTACA TCTGGCTGGG CACGCCCCGG 
CGCTTCGAGC GCTTCACGTT CGCGTTCGAG CCGACCCCGG CCGGCTGGGT GTGGTTCCAC 
GCCTACCCGT CCGGGGCGGA GGTGAGCACC TGCATCGTCG AGTGCGCGCC GCGGACCTGG 
GACGCGCTCG GCCTCGGCAC GGACGACGGC GAGGGACTAC GCCTGCTCGG GAAGATCTTC 
GCTGGCCCGC TGGCCGGCGA GGGCCTGATC GACCAGCTGC GCCGGCCCGC CCGCTGGCAG 
CGGTTCGGCC AGGTCAGCAA CCGTAGCTGG TACTGGGACA ACATGGTGCT GCTGGGCGAC 
GCCGCCCACA CCACCCACTT CACGCTCGGC TCCGGCACGG CCCTGGCCAT GATGGATGGC 
GTCATGCTCG CCCAGATGCT CTACGAGCAC GGCGAGGTCC CGGTGGCGCT GGCCGAGTTC 
GACCGGGCCG GCCGGGCCGC GCTGGCCCCG CTGCAGGCCC GGGCCCGGAC GAGCATGGCC 
TGGTTCGAGC GGATCGACGG CCAGCTCGAC CGGGCCAGGC CGGCCACCGG CGGCGACCCC 
GACCCGGTGG CCTTCGCCTA CGCGATGGCC ACCCGGCAGG GCGACCAGCC GCCATGGCGG 
TACCAGGCAC ACCGGGCGAT GCAGGTCGGG GCCGTCCGGC GGCTGCGCCG TGAGGTCGAC 
TCGTCGGTGC GCTGGTACCT GGCCCGCCGG CGCGGCGAAC CGGCCCGGCC CGCCGGCCGG 
CCGGCGCCGG CCGGCACCCC CACGCCCGCA GGCCCGGCCG GCCGGGCCCT GGCGGGCGCG 
GGTTCCGGGT CCGCCGCGCA CCGCTCCCGC GGTTAG

Protein sequence

MRIVCVGGGP AGLYFAISAK RRDAGHEITI IDRDPPGATY GWGVVYWDNL LDVLFRNDPD 
SAREIRGAST LWQEQDISLG SERAAHFAGY GFSVQRAALL DILTRRAEEL GVRVEHDREV 
ADLTDLADLG CLGGLGAHAD ADLVIAADGA NSQVRSMFAD RFGTRVDTGG NRYIWLGTPR 
RFERFTFAFE PTPAGWVWFH AYPSGAEVST CIVECAPRTW DALGLGTDDG EGLRLLGKIF 
AGPLAGEGLI DQLRRPARWQ RFGQVSNRSW YWDNMVLLGD AAHTTHFTLG SGTALAMMDG 
VMLAQMLYEH GEVPVALAEF DRAGRAALAP LQARARTSMA WFERIDGQLD RARPATGGDP 
DPVAFAYAMA TRQGDQPPWR YQAHRAMQVG AVRRLRREVD SSVRWYLARR RGEPARPAGR 
PAPAGTPTPA GPAGRALAGA GSGSAAHRSR G