Gene Franean1_5399 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5399
Symbol
ID	5673730
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6513548
End bp	6514984
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	69%
IMG OID	641244254
Product	FAD linked oxidase domain-containing protein
Protein accession	YP_001509660
Protein GI	158317152
COG category	[C] Energy production and conversion
COG ID	[COG0277] FAD/FMN-containing dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGCAC AGGTTCTCAC GCTGGAAGGC CAGCGGCAGA GACTCTCGGA CGAGACGGTC 
GAGGAGATCC GTGCGATCTT CCACGGGCAG GTTCTGACCT CGGACGACGT CGGGTACGAC 
GACGTCCGGG TCATCCAGAA CGCCATGCTC GACCGCAGGC CAGGTCTGAT CATCCGGTGT 
ACCGGGGCCG CCGACGTCGT CGACGCCGTC CGCCTCGCCG CAACGCGAAA CCTGCTCGTC 
GCCGTCCGCG GCGGCGGCCA CAGCATCGCC GGGACCTCCA CAGCCGACGA CAGCTTGATG 
ATCGACCTGT CGGCGATGCG GGGCGTCTGG GTCGATCCGG AACAGCGGCG TGTGCGGGTG 
GCCGGTGGTG CGACCTGGGG CGACGTCGAC CGTGAGACGC AGCTGTATGG GCTCGCGGTA 
CCCGGGGGAG TGGTGTCGAC CACGGGTGTG GCTGGTCTGA CGCTCGGTGG CGGAATCGGC 
TGGTTGCACC GCAAGTACGG GCTGGCCTGC GATGCGCTGC GTGCGGCCGA GGTCGTGACG 
GCCAGCGGCG ACGTCGTGCG GTGTAGCGCC TCCGAGCGCG AGGACCTGTT CTGGGCGCTG 
CGTGGCGGGG GCGGCAACTT CGGTGTGGTG GTGTCCTTCG AGTTCGAGGC CTATCCGCTC 
GGTCCGGTCG TCTGGAACAG CATGGTCGTC TACCCGATCG ACGCCGCTGC CGAGTTGCTC 
CCCCGCTGGC GGGACTGGAC GTCCACCGTC CCCGACGAGG TCACCAGCCG TGCCATGCTG 
TGGTCGCTGC CGGCGGTGCC GGCACTCCCG CCCGCCGTAC ACAACCGCGA CGTGTTCATC 
ACAGCCGCCT TGTACGCGGG CGACCCGGAC GAGGGTCAGC GGGCGTGTCG GGCGCTTGCC 
GAGTTCGGCG CGCCGCTCGC CGACATGAGC CAGGCCCTGT CGTACCGGAC AGCGCAGTCC 
TCCCTCGACC CGTTCTTCCC GAAGGGCGGG CTGCAGAGCT ACTGGAAGTC CGTCTACCTG 
GACCGACTCG ACGAGGATGC GACCGCGTTC GTGGTCCGCG TCGGCCAGGA CCGCCCGCAC 
CCGATGACCT TGGTGCACGT GCCTCTACTG GGAGGCGCCA TGTCGCGGGT CGGGGCGACG 
GAAACCGCGT TCGGCGATCG CAGCGCCCGG TACATGCTGA GCCTCGACGG AAACTGGCTG 
GACCCGGCCG ACGACGACGC GAACATCCGT TGGGTGCGCG ATGCCTACGA CGAGGCTGTC 
ACGCTGCGGG CCGCGTCGGG CACCTACCTC AACTTCGGCG GCGACGCCGA TCTCGACGAC 
GCCGCCCGGG CGCGAGCCTG GGGACGCAAC GTCGAGCGCC TTCGACAGGT CAAGCGCAGC 
TACGACCCGG AAAACCGCTT CCGGCTCAAC CCCAACATCC CCCCCGCTGA GAGCTGA

Protein sequence

MSAQVLTLEG QRQRLSDETV EEIRAIFHGQ VLTSDDVGYD DVRVIQNAML DRRPGLIIRC 
TGAADVVDAV RLAATRNLLV AVRGGGHSIA GTSTADDSLM IDLSAMRGVW VDPEQRRVRV 
AGGATWGDVD RETQLYGLAV PGGVVSTTGV AGLTLGGGIG WLHRKYGLAC DALRAAEVVT 
ASGDVVRCSA SEREDLFWAL RGGGGNFGVV VSFEFEAYPL GPVVWNSMVV YPIDAAAELL 
PRWRDWTSTV PDEVTSRAML WSLPAVPALP PAVHNRDVFI TAALYAGDPD EGQRACRALA 
EFGAPLADMS QALSYRTAQS SLDPFFPKGG LQSYWKSVYL DRLDEDATAF VVRVGQDRPH 
PMTLVHVPLL GGAMSRVGAT ETAFGDRSAR YMLSLDGNWL DPADDDANIR WVRDAYDEAV 
TLRAASGTYL NFGGDADLDD AARARAWGRN VERLRQVKRS YDPENRFRLN PNIPPAES