Gene Franean1_3480 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3480
Symbol
ID	5671851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4138224
End bp	4139264
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	75%
IMG OID	641242368
Product	luciferase family protein
Protein accession	YP_001507788
Protein GI	158315280
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03558] luciferase family oxidoreductase, group 1

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.275139
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.078624
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACGCC CCGCCGGTCT GCCCCTGTCC GTTCTCGACG TCGTACCCGT CTTCGAGGGC 
GGCAGCGCCA CCCGGGCGCT GCGCGACACC GTCACGCTCG CGCCCCGGGT GGAGGAGCTC 
GGCTACCACC GGTACTGGGT GGCCGAGCAC CACAACACCC CGAGCCTGGC CACCTCGACA 
CCGGCTGTGC TCGCCGGCCG GATCGCCGCG GCGACCAGCA CGCTGCGGGT CGGCTCGGGC 
GGGGTGCTGC TGCCCAACCA CGCACCGCTC GTCGTCGCCG AGCAGTTCGG CACGCTGGAG 
GCGTTCTTCC CGGGCCGGGT CGACCTCGGG CTGGGCCGGG CGCCCGGCAC CGATCCGACC 
ACCGCCCGGG CGCTGCGCCG CGCGCCCGGC GGCGACGACG GCTTCGAAGG CCAGCTACGG 
GAGCTCTCCG GCTACTTCGC CCCGACCGAC CCAGGCAGCC GGGTGCTCGC GGTGCCCGCC 
GCCGACAGCC GGCCGGAGCT GTGGCTGCTC GGTTCCAGTC CGGCCAGTGC CGGGCTCGCC 
GCCGCCCTCG GCCTTCCCTA CGCCTTCGCC CACCACATCA ACCCGCACGC GAGCGCGGCG 
GCGCTGCGCC ACTACCGGGC GGCGTTCCAG CCCTCGGCCC ACCTCGACCG GCCGTACGCG 
CTGATCAGCG TGATCGCGAC GGTCGCCGAC AGCGACCAGG CCGCGGCGCG GGCCGCCGCC 
CCCTACCTGC TCGGCAAGAT CTGGATGCGC ACCATCGGCG CCTTCGACGC GTTCCCCTCC 
GCCGACACCG AGCGCGCGCA CGCCTACAAC CAGGCCGAGC GGGCCTTCCT CGCGGACCTC 
GCCGCCCCCC AGGTCATCGG CGGCGTGGAC ACGGTGCGCC GGCAGCTGGC CGGGCTGGTC 
GAGGCCACCG GCGCGGACGA GCTGATGGCG CTCACCGTGG TGCCCAACCA GGCCGACCGT 
CTGCGGTCCT TCGAGCTGCT CGCCAGCGCG GCGGCGACGG TAAGTCCAGC CACCGAGCCA 
GGGATTTCAG CGCGGCTTTA G

Protein sequence

MTRPAGLPLS VLDVVPVFEG GSATRALRDT VTLAPRVEEL GYHRYWVAEH HNTPSLATST 
PAVLAGRIAA ATSTLRVGSG GVLLPNHAPL VVAEQFGTLE AFFPGRVDLG LGRAPGTDPT 
TARALRRAPG GDDGFEGQLR ELSGYFAPTD PGSRVLAVPA ADSRPELWLL GSSPASAGLA 
AALGLPYAFA HHINPHASAA ALRHYRAAFQ PSAHLDRPYA LISVIATVAD SDQAAARAAA 
PYLLGKIWMR TIGAFDAFPS ADTERAHAYN QAERAFLADL AAPQVIGGVD TVRRQLAGLV 
EATGADELMA LTVVPNQADR LRSFELLASA AATVSPATEP GISARL