Gene Franean1_4308 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4308
Symbol
ID	5672663
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5146673
End bp	5147629
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	74%
IMG OID	641243181
Product	luciferase family protein
Protein accession	YP_001508598
Protein GI	158316090
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03564] F420-dependent oxidoreductase, MSMEG_4879 family

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.502996
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGGGTCG GCGTGATGAT CGGACCGGAG CGGGGTGACT CCGCGCGCAA GGTCGGGCGG 
ATGATCGACG ACGTGTTGTG GGCCGAGAGC GCGGGGATGG ACACCGCCTG GATCCCCCAG 
GTGCCCTCGG ACTTCGACGC CCTGATCGCC GTCTCGCTGA TGGGCGCGCG CACGGAGCGG 
ATCGAGCTGG GCACGGCAGT CGTCCCGCTG CAGGCCCAGC ACCCGGTGGC GCTGGCGCGC 
CAGACGCTGT CAGCGCAGGC GGCGACCAAC GGGCGGCTGG CGCTGGGCGT CGGGCCGTCG 
CACCACTGGA TCGTGCGGGA CATGCTCGGC CTGCCCTACG ACAAGCCGGC GGCGTTCACC 
CGCGACTACC TCGAGGTCCT CAACGTCGCA CTGCACGGGC CCGGCCCGGT GGACGTCGAG 
AACGACACCT TCCGGGTGCA CAACCCGCTC GAGATCGGCC CGATCGCCCC GCTGCCCGTG 
TTCATCGCCG CGCTCGGCCC GGTGATGCTG CGCATCGCCG GCGAGCACGC CGACGGGACG 
GTGCTGTGGC TGGCCGACGA GCGCGCGGTC GCCGACCACG TGGCGCCGCG GATCACCAAG 
GCCGCCCAGG AGGCGGGCCG CCCGGCGCCG CGGATCGTGG CGGGCATCCC GGTCTGCCTG 
TGCGCGCCGG CCGATGTCGA CAAGGCCCGG GAGCGGGCGA ACCGCATCCT CGGCGAGGCC 
GAGGTCTCCC CGAACTACCA GCGGCTGCTC GACCAGGGCG ACGCCACGAG CGTCGGCGAC 
CTGTGCGCGG CCGGCGACGA GGCGGCGATC CTGGCCCGGT TCCGGCAGTT CGCCGACGCG 
GGCGTCACCG ACCTGTCGGT GCGGCTGCTG CCCATCGGCG ACAACCGGGA CGAGCTGGTC 
GCCTCCAAGC GCCGCACCCG GGAAGTGATC GCCGCCCTCG CGGCGGAAGT GAGATGA

Protein sequence

MRVGVMIGPE RGDSARKVGR MIDDVLWAES AGMDTAWIPQ VPSDFDALIA VSLMGARTER 
IELGTAVVPL QAQHPVALAR QTLSAQAATN GRLALGVGPS HHWIVRDMLG LPYDKPAAFT 
RDYLEVLNVA LHGPGPVDVE NDTFRVHNPL EIGPIAPLPV FIAALGPVML RIAGEHADGT 
VLWLADERAV ADHVAPRITK AAQEAGRPAP RIVAGIPVCL CAPADVDKAR ERANRILGEA 
EVSPNYQRLL DQGDATSVGD LCAAGDEAAI LARFRQFADA GVTDLSVRLL PIGDNRDELV 
ASKRRTREVI AALAAEVR