Gene Franean1_6338 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6338
Symbol
ID	5674656
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	7698385
End bp	7699899
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	71%
IMG OID	641245190
Product	monooxygenase FAD-binding
Protein accession	YP_001510585
Protein GI	158318077
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATCTG AGGTGGTCGA GACACCCGTG CTGATCGTCG GCGGCGGCCC GGCCGGGCTG 
ACCGCATCCC TGCTGCTGTC CCGCCACGGC CTAGGCTCCC TGCTGATCGA CAAGCGCCTC 
GACGCGTCAC CGCTGCCCCG CGCCCGTGGC GTGCACTCAC GGGCGATGGA GATCCTGCGC 
GTCTGCGGCG TCGAACCGGA TCTGCGCAAG GTGGAGCTAC CGATCACCCC AGGCGCGGAA 
TGGCGAGCCG ATCTGACCAG CCCGCCGCTG CGCGAGGACG TACCGTCGGC CGGTCCCACC 
ACTGTGAGCC CATGCGAGGG ACTGTCGGTC TCGCAGGACG TGTTCGAGGC GGTCCTGCGA 
GACCACGCCC ACAGCTACGC ACACGCGCAG CTGCGACCGG GCACGCTGCT GGACTCGTTC 
CACACCGCCG GTGACGGTGT CCTGGCCACC GTGGTCGAAC GGGCGTCCGG ACACCGCGTC 
GAGGTGCGGG CCCGGTGGAT GATCGCCGCC GATGGTGCCC GCAGCGACAT ACGCCGGCAC 
CTGCGGATCG GCATGAACGG CCCGGACGAC CTCGGCCAGC AGACGATGAT CGCCTTCCGG 
GCCGACCTGA GCGCATTGAC CGGTTCGCGT CCCCGAGGGA TCTACTTCCT CACCGCCACC 
GGCGCAGCGC TGATCTGGAC CCACCACGAC GACCGCTGGG TGATCAGCCA ACCCGGCCCC 
ATCGCCGCCG ACGATGATCC CGCCGCCATC GTCCGGCGGA TCCTCGGCCT TGCCGATCTG 
ACCGTGCAGG TGCTGGCCAC CAGCCCCTGG ACGGCCGCGG CGCAGTCGGC CGCCCAGTAC 
GCGCAAGGCC CTGTGTTCCT GGCCGGCGAC GCCGCCCATC GCTTCCCGCC CGCCGGCGCG 
ACCGGGGTCA GCGCGGCGAT GCACGACGTG CACAACCTCG CCTGGAAGAT CGCCGCCGTC 
GCCCACGGCC ACAGCGGCCA GAAGCTGCTG GACAGTTACG CCGCCGAACG AGAACCGGTC 
GGGCAGCGCA CCGCCGACGA GACCGGCGCC GCATGGACGC GGATCTTCAA CGGGAACGCC 
GCGCCGTTCA GCGGACGCAG CCTTGCCCAG ATCGATATGG GCTACCACTA CACGTCACCG 
GTCGTCGTCG ACGACGGCAG CCCCGACGCC GACCCGCCTG GCGCCGGCTA CCAGCCGACC 
GCTACACCCG GCTGCCGGGC GCCCCATCTG TGGCTGGCCG ACGGCACGTC CACCATCGAC 
CTGTTCGACC AGCGCTTCGT CCTGCTGACC GCCGAACCCG GCCACGCCTG GCGCGACGCC 
GCCGCCCACG CCACCGGGGC ACTCGTCGAC AGCCACGTCA TCGCAGAACC GAACTGGCCG 
AGCCTGTACG GCGTCGCCCC CGACGGGGCG GTCCTCGTTC GCCCCGACGG GCATGTCGCG 
TGGCGCAGCC GGACCTCATC CACCGATCCG GTGACGGACA TCCAGACCGC CCTGACCACC 
AGCACCGGAA GCTGA

Protein sequence

MASEVVETPV LIVGGGPAGL TASLLLSRHG LGSLLIDKRL DASPLPRARG VHSRAMEILR 
VCGVEPDLRK VELPITPGAE WRADLTSPPL REDVPSAGPT TVSPCEGLSV SQDVFEAVLR 
DHAHSYAHAQ LRPGTLLDSF HTAGDGVLAT VVERASGHRV EVRARWMIAA DGARSDIRRH 
LRIGMNGPDD LGQQTMIAFR ADLSALTGSR PRGIYFLTAT GAALIWTHHD DRWVISQPGP 
IAADDDPAAI VRRILGLADL TVQVLATSPW TAAAQSAAQY AQGPVFLAGD AAHRFPPAGA 
TGVSAAMHDV HNLAWKIAAV AHGHSGQKLL DSYAAEREPV GQRTADETGA AWTRIFNGNA 
APFSGRSLAQ IDMGYHYTSP VVVDDGSPDA DPPGAGYQPT ATPGCRAPHL WLADGTSTID 
LFDQRFVLLT AEPGHAWRDA AAHATGALVD SHVIAEPNWP SLYGVAPDGA VLVRPDGHVA 
WRSRTSSTDP VTDIQTALTT STGS