Gene Franean1_2017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2017
Symbol
ID	5670418
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	2423015
End bp	2424382
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	72%
IMG OID	641240938
Product	putative FMNH2-utilizing oxygenase
Protein accession	YP_001506360
Protein GI	158313852
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0632006
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.1646
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGCC CGACCAGGCA GATCCACCTC GCCGCGCACT TCCCGGGCGT GAACAACACG 
ACCGTGTGGA GCGACCCGCG CTCGGGCAGC CACATCGCGT TCGAGTCGTT CGTCCATTTC 
GCCCGGACGG CGGAACGGGC GAAGTTCGAC TTCCTGTTCC TGGCGGAGGG GCTGCGGCTG 
AGGGAGCAAC GCGGGCGCAT CCATGACCTG GACGTCGTCG GGCGTCCAGA CACGTTCACC 
GTGCTCGCGG CGCTGGCGGC GGTGACCGAC CGGTTGGGCC TGGCCGGGAC CATCAACTCG 
ACGTTCAACG AGCCGTACGA GGTGGCCCGC CAGTTCGCCA GTCTCGACCA TCTCTCCGAC 
GGGCGCGCCG CGTGGAACGT CGTCACCTCC TGGGACGCGT TCACCGGGGA GAACTTCCGC 
CGCGGTGGCT TCCTGGCCGA GGAGCAGCGC TACGAGCGCG CCGAGCTGTT CCTGCGGACG 
GCCAGCGAGC TGTTCGACTC CTGGCGGGGG GACGAGATCG TCGCGGACAA GGAGTCCGGC 
GTCTTCCTGG CCGATGCCAA GGCGGGGGCG TTCGAGCACC ACGACGCCCA CTTCGACATC 
AGCGGGCAGT TCACGGTGCC GCGCAGCCCG CAGGGCCGGC CGGTGATCTT CCAGGCCGGT 
GACTCCGACG CGGGCCGGGA GTTCGCCGCC CGGTCCGCCG ACGCGATCTT CAGCCGGCAC 
AGCACGTTCG ACGCCGGGCA GGCGTTCCAC GCGGACGTCA AGCGCCGCCT CGCCCGCTAC 
GGCCGTGCGC CCGAGGATCT CCTCGTCCTG CCGGCGGCGA CGTTCGTCCT CGGCGACACC 
GACGCGCAGG CGCGGGAGCG GGCCGAGGAG GTCCGCCGCC AGCAGGTCAG CGGCGCCACC 
GCGATCCAGT TCCTCGAGCA GGTGTGGAAC CGCGACCTCG GTGACCACGA TCCGGACGGG 
CCGCTGCCCG AGGTCGACCC CGTACCCGGG GAGAACACCG TCGCCCAGGG CAGGGCGAGC 
GTGCGGATGT ACGAGGACCG GCTGGCCACC GCCCGCCGCT GGCGCGAGAT CGCCGAGGCG 
GGGAAGCTCA CCACCCGCGA GCTGGTCATT GAGGTCAGCG GGCGGCAGGC GTTCGTCGGC 
AGCCCGGCGA CCGTCGCGGA CACGATCAAC CGGTTCGTAC AGGCCCGCGC GGCGGACGGG 
TTCATCCTCG TCCCGCACAT AACCCCCGCC GGCCTGGACG AGTTCGCGGA CACGGTCGTC 
CCGCTGCTCC AGGAGCGCGG CGTGTTCCGG GCCGACTACA CGGGGACGAC GCTGCGCGAC 
CATCTCGGCC TCGCCCCGGT GCCAGGATGG CCGGTTCACG CGGTCTGA

Protein sequence

MSSPTRQIHL AAHFPGVNNT TVWSDPRSGS HIAFESFVHF ARTAERAKFD FLFLAEGLRL 
REQRGRIHDL DVVGRPDTFT VLAALAAVTD RLGLAGTINS TFNEPYEVAR QFASLDHLSD 
GRAAWNVVTS WDAFTGENFR RGGFLAEEQR YERAELFLRT ASELFDSWRG DEIVADKESG 
VFLADAKAGA FEHHDAHFDI SGQFTVPRSP QGRPVIFQAG DSDAGREFAA RSADAIFSRH 
STFDAGQAFH ADVKRRLARY GRAPEDLLVL PAATFVLGDT DAQARERAEE VRRQQVSGAT 
AIQFLEQVWN RDLGDHDPDG PLPEVDPVPG ENTVAQGRAS VRMYEDRLAT ARRWREIAEA 
GKLTTRELVI EVSGRQAFVG SPATVADTIN RFVQARAADG FILVPHITPA GLDEFADTVV 
PLLQERGVFR ADYTGTTLRD HLGLAPVPGW PVHAV