Gene Franean1_5730 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5730
Symbol
ID	5674056
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6963956
End bp	6965017
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	72%
IMG OID	641244583
Product	luciferase family protein
Protein accession	YP_001509986
Protein GI	158317478
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.859618
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGTCG GAGTGGTGCT GCAGACCAAC CCGCCCGCGT CTCGGGTGGT CGAACTCGCC 
CGGCAGGCCG AGACGCTCGG CTTCAGCCAC GTGTGGACCT TCGACTCTCA CCTCCTGTGG 
GAGGAGCCGT TCGTCATCTA CAGCCAGATC CTCGCGGCCA CCCGCAAGGT CAAGGTCGGC 
CCGATGGTCA CCAACCCGGC GACCCGCGAC TGGACGGTCA CCGCCTCCCT GTTCGCCACG 
CTCAACGAGA TGTTCGGCAA CCGCACGATC TGCGGGATCG GCCGCGGCGA CAGCGCCGTC 
CGGGTCCTCA ACGGCCGGCC GACGACGCTG GCCACCCTGC GCGAGTGCGT CGCCGTCGTC 
CGCGCCCTCG CCAACGGGCG GGAGGCGGAG GTGAACGGCG CGAAGCTGCG CTTCCCATGG 
GGCACCGACA GCCGGCTGGA CGTCTGGATC GCCGCCTACG GCCCGAAAGC CCTGGCCCTG 
GCCGGCGAGA TCGGCGACGG ATTCATCCTG CAGCTAGCCG ACCCCGACAT CGCCGCGTGG 
ACCATCCGGG TGGTGCGCGA GGCCGCCGAG AAGGCCGGCC GTGACCCGGC GTCGGTGCGG 
TTCTGCGTCG CCGCGCCCGC CTACGTCGGC GACGCCGACC CGCTGTCCCT CGCCCACCAG 
CGCGACCAGT GCCGCTGGTT CGGCGGGATG GTCGGCAACC ACGTCGCCGA CCTCGTCGCC 
CGCTACGGCA CCCCGACCGC GGCCGGCCCT GTTCCGGCAG GCGGCACGGC GCTGCCGTCA 
GCCCTGACCA GTTACATCAC CGGCCGCCAC GGCTACGACT ACAACGAGCA CGGTCGCGCC 
GGGAACACCC ACACCGACTT CGTCCCCGAC GAGGTCATCG ACCGGTTCTG CCTGCTCGGC 
CCGCCGGCAG CGCACATCGA GCGGCTCACC GAGCTCGCTG GCCTGGGCGT CGACCAGTTC 
GCGGTCTACC TCCAGCACGA CGCCAAGCGC GCCACCCTGG AGGCCTACGG CGAGACCGTC 
ATCCCGGCGG TCAGCGCCAC CATCCAGGCG AAAACACGCT GA

Protein sequence

MDVGVVLQTN PPASRVVELA RQAETLGFSH VWTFDSHLLW EEPFVIYSQI LAATRKVKVG 
PMVTNPATRD WTVTASLFAT LNEMFGNRTI CGIGRGDSAV RVLNGRPTTL ATLRECVAVV 
RALANGREAE VNGAKLRFPW GTDSRLDVWI AAYGPKALAL AGEIGDGFIL QLADPDIAAW 
TIRVVREAAE KAGRDPASVR FCVAAPAYVG DADPLSLAHQ RDQCRWFGGM VGNHVADLVA 
RYGTPTAAGP VPAGGTALPS ALTSYITGRH GYDYNEHGRA GNTHTDFVPD EVIDRFCLLG 
PPAAHIERLT ELAGLGVDQF AVYLQHDAKR ATLEAYGETV IPAVSATIQA KTR