Gene Franean1_5474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5474
Symbol
ID	5673805
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	6618714
End bp	6619940
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	71%
IMG OID	641244329
Product	putative oxygenase subunit protein
Protein accession	YP_001509735
Protein GI	158317227
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.72272
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAAGA TCCTGATCGT CGGCGCGGGC CAGTCGGGCC TGCAGCTGGC CCTGACCCTG 
CGCGAGCACG ACTACGACGT GACGGTGATG TCCGCGCGCT CCCCCGAGGA GATCCGCCGG 
GGCCGGGTGA TGTCGACCCA GGCGATGTTC CACAGCGCGC TGCAGGCCGA GCGCGACCAC 
GGGCTCAACC TCTGGGAGGA CGACACCGTC CGCATCGAGG GCCTCGGGGT CTCGATCGCG 
GGGCCGGACG GCAGCCGGCC TCTCGACTGG TTCTCCCCGC TGGACCACTA CGCGCAGTCG 
GTCGACCAGC GGGTCAAGAT GGCCGGCTGG GCCGAGCTGT TCGAGGAGCG CGGCGGCAAG 
CTCATCCTGC ACGGTGTCAC CACGGCCGAC CTGAACGGGC TCGCCGAGCT CTACGACCTC 
GTCGTGGTCG CCGCCGGCAA GGGCGAGCTG GTCGGCCTGT TCGACCGCGA CGCCGCCCGC 
TCGCCGTACA CCTCACCCCA GCGCGCGCTG TCACTCGCGT ACGTGCACGG CCTGGCGCCC 
AGGCCGGAGC ATCCCACCGC GCCGGGCGTG CGATTCAACA TCATCCCCGG CGTCGGCGAG 
CTGTTCATGA TCCCGGCTTA CACGCTGAGC GGGAACTGCG ACATCCTCTT CTTCGAGGGG 
ATCCCGGGCG GTCCGCTGGA CTGCTGGGAC GACCACCCGA AGCCCGACGA GCACCTGCGC 
CGCATCCTGG ACCTCATCGA GCGGTTCCTG CCCTGGGAGT ACGAGCGCTG CGCGAAGGTC 
GAGCTCACCG ACGCCCACGC GACCCTCTCC GGCGGGTACA CGCCCGTCGT GCGGCGGCCG 
GTGGGCAACC TGCCGTCGGG CGGGGCGGTG CTCGGGATGG CCGACGTCGT CGTGGCGAAC 
GACCCGATCA CCGGCCAGGG CTCGAACAAC GCCGCGAAGT GCGCCGCGTC CTACCTGGAC 
AGCATTCTCG AGCACGGTGC CAAGCCGTTC GACCAGGCGT GGATGCAGGC CGCCTTCGAC 
CGCTACTGGG CGAGCGCGCA GGACGTCACG GTCTGGACGA ACGCCCTGCT GCAGCCCCCG 
CCGCCGCACG TGCAGCAGAT CCTCGGCGCC GCGCAGGCGA ACCCCACGGT CGCCCGGCGG 
TTCGTGAACG GCTTCGACAA TCCGTCCGAC TTCCAGGACT GGTTCCTCGA CCCGGAGAAG 
GCGGCGGCCT ACCTGGCCTC CGCCTGA

Protein sequence

MRKILIVGAG QSGLQLALTL REHDYDVTVM SARSPEEIRR GRVMSTQAMF HSALQAERDH 
GLNLWEDDTV RIEGLGVSIA GPDGSRPLDW FSPLDHYAQS VDQRVKMAGW AELFEERGGK 
LILHGVTTAD LNGLAELYDL VVVAAGKGEL VGLFDRDAAR SPYTSPQRAL SLAYVHGLAP 
RPEHPTAPGV RFNIIPGVGE LFMIPAYTLS GNCDILFFEG IPGGPLDCWD DHPKPDEHLR 
RILDLIERFL PWEYERCAKV ELTDAHATLS GGYTPVVRRP VGNLPSGGAV LGMADVVVAN 
DPITGQGSNN AAKCAASYLD SILEHGAKPF DQAWMQAAFD RYWASAQDVT VWTNALLQPP 
PPHVQQILGA AQANPTVARR FVNGFDNPSD FQDWFLDPEK AAAYLASA