Gene Franean1_1675 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1675
Symbol
ID	5670077
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2003644
End bp	2004579
Gene Length	936 bp
Protein Length	311 aa
Translation table	11
GC content	72%
IMG OID	641240593
Product	luciferase family protein
Protein accession	YP_001506019
Protein GI	158313511
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03560] probable F420-dependent oxidoreductase, Rv1855c family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.381566
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCTGC GGATATTCGT CGAGCCCCAG CAGGGCGCCT CCTACGCGCG CCAGCTAGCC 
ATGGCCAAGG CGTCCGAGGA AGGCGGATTC GACGCCTTCT TCCGCTCCGA CCACTACCTG 
CGGATAGGGC CGGGCAGCCC GCTGCCGGGC CCGACCGACT CCTGGGTCAC GCTGGCCGGC 
ATCGCCCGCG AGACGTCCAC GATTCGCCTG GGCACCCTGG TGACGAGCGC GACCTTCCGG 
CTGCCCGGGC CGCTCGCCAT CGCCGTCGCC CAGGTCGACG AGATGAGCGG CGGGCGAGTC 
GAGCTCGGTC TCGGCGCCGG CTGGTTCACC GCGGAGCACT CCGCCTACGG GATCCCGTTC 
CCACCGGTCG GCGAACGGTT CGAGCGGCTG ACCGAACAGC TCGCGATCAT CGAGGGACTG 
TGGCGTACCC CAGCGGGCGA GACGTTCTCC CACCAGGGCA GCCACTACAC CCTGACCGAC 
AGCCCGGCGC TGCCCAAGCC CGTCCAGCGC CCGCATCCGC CGATCATCAT CGGCGGTCAC 
GGGCCGCGGC GCACGCCGGC GCTCGCCGCG CGCCACGCCG CCGAGTTCAA CCTCGCGTTC 
GCCCCGCCGG CACAGGTGTC GGCGCAGTTC GGGCTGGTCC GCAAGGCCGC CGCCGCGATC 
GACCGGGACC CGGATGATCT CGTCTACTCG GTGGCGCTCG TGGTGTGCTG CGGCCGGGAC 
GACGCCGAGC TCAAGCACCG CGCCGAGCGG ATCGGGCGTG ACCTCGACGA GCTGCGTGAG 
AACAGCCTGG CCGGCACCCC GGCCGAGGTG ATCGAGAAGC TCGCCGTCTA CGGCCCGGAC 
GGCGCCGGAG CGAGCCGGGT GTACCTGCAG GTCCTCGACC TGGACGACCT CGACCACGTG 
GCGTTGCTCG CCGCCGAGGT CCTCCCCCAG GTCTGA

Protein sequence

MDLRIFVEPQ QGASYARQLA MAKASEEGGF DAFFRSDHYL RIGPGSPLPG PTDSWVTLAG 
IARETSTIRL GTLVTSATFR LPGPLAIAVA QVDEMSGGRV ELGLGAGWFT AEHSAYGIPF 
PPVGERFERL TEQLAIIEGL WRTPAGETFS HQGSHYTLTD SPALPKPVQR PHPPIIIGGH 
GPRRTPALAA RHAAEFNLAF APPAQVSAQF GLVRKAAAAI DRDPDDLVYS VALVVCCGRD 
DAELKHRAER IGRDLDELRE NSLAGTPAEV IEKLAVYGPD GAGASRVYLQ VLDLDDLDHV 
ALLAAEVLPQ V