Gene Franean1_3055 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3055
Symbol
ID	5671434
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	3593125
End bp	3594351
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	64%
IMG OID	641241953
Product	monooxygenase FAD-binding
Protein accession	YP_001507373
Protein GI	158314865
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTTCGT CGCAGATCAG CACCCGGGTC GTCATCGTCG GCGCTGGCCC GGTCGGAATG 
GTGTGCGCAC TGGCGCTGAA CCGGCAGGGC ATCCCGGTCA CCGTGCTCGA GTCGGAGCCC 
GTACCGGTGA AGGATCAGCG CGCCGCGACC ATTCATCCGA GCACTCTGGA GATGCTTGAC 
GAATTGGGCA TCACCGAGAA GATCACGCCG CACGGCCTGG TTTCGAGCAC CTATCGCTTC 
CACGACCGGC CGACCGGCGA GTTGGTGGCG GAGTTCGATC TCGCCCGACT CAAAGACGAG 
ATCCGGTTTC CCTATGTGCT GCAGTACGAG CAGTACAAAC TGACCGCTTC CATCGCCGAG 
GAATACGCCA ACGGATCCGA CTTCGACATG CGGTTCTCCC ACGCCCTCAC CGGCCTCACC 
GTGGCCGCGA ACGGCATCGA GGTGGAGTAC GCCTCCCCCG CGGGCACGGG GCGCATGACG 
GCGGCCTATG TCATCGGCTG CGACGGCGGC CGGTCAACAG TGCGCAAGCT CGCCGGCATC 
GAGTTCGAAG GGTTCACGTA TCCGGAGCGG TTCATCAAGA TCGCGACCAG ATTCGACTTC 
AAGACCGTGA AGTCGAATCT GTCACTGCGC AACTACTTCT CCGACCCCTA CGAGTGGGCC 
AACCTGTTCA AGGTGCGCGG GGAGACGCCC GAAGGACTCT GGCGGCTGAT CCTGCCGATC 
GGCCAGAACG AGGACGACAC CACCGCACTG TCGGCAGCGC GTGTCGAGCG GCGGCTGCAG 
AAGTTCTTCC CCAAGGCGGA CCCCTACCAC GTCGAGTACG CCAGGGTCTA CAGGGTCAAT 
CAGCGCGTGG CCGGGACCTT CCATAAAGGC CGCATCTTGC TGGCCGGAGA CAGCGCGCAC 
GTCAACAACC CGATCGGCGG CATGGGCATG AACGGCGGCA TCCATGATGC CATCAACCTT 
GCGGAGAAGC TCCCCCAGGT GATCCACGGT CGGGACGGTG ACGATCTACT CGACCTCTAC 
AGCCGCCAGC GCCGTCACGC CGCGCTGAAC TACGTTCAAG CCCAGACAAT CGCCAACAAG 
CGAATGCTGG AGGAACGCGA CCCCGCCGTG CGGCGACAGA ACCTCGATCA GTTGCGCTGC 
ACGGCCGAGA ACCTCGATAG TGCGCGCGCC TATATGCGCC GCGCGGCCCT GTTCGACAGC 
CTGCACGACG CCGCCTCCAT CACCTGA

Protein sequence

MISSQISTRV VIVGAGPVGM VCALALNRQG IPVTVLESEP VPVKDQRAAT IHPSTLEMLD 
ELGITEKITP HGLVSSTYRF HDRPTGELVA EFDLARLKDE IRFPYVLQYE QYKLTASIAE 
EYANGSDFDM RFSHALTGLT VAANGIEVEY ASPAGTGRMT AAYVIGCDGG RSTVRKLAGI 
EFEGFTYPER FIKIATRFDF KTVKSNLSLR NYFSDPYEWA NLFKVRGETP EGLWRLILPI 
GQNEDDTTAL SAARVERRLQ KFFPKADPYH VEYARVYRVN QRVAGTFHKG RILLAGDSAH 
VNNPIGGMGM NGGIHDAINL AEKLPQVIHG RDGDDLLDLY SRQRRHAALN YVQAQTIANK 
RMLEERDPAV RRQNLDQLRC TAENLDSARA YMRRAALFDS LHDAASIT