Gene Franean1_1544 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1544
Symbol
ID	5669947
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	1844780
End bp	1845937
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	73%
IMG OID	641240463
Product	luciferase family protein
Protein accession	YP_001505889
Protein GI	158313381
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03558] luciferase family oxidoreductase, group 1

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.496178
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCGTC AGGCCCACAT CCCTGTCAAC TCGGCCGGGC CGGGCCGGGA TCATTCGTCG 
CGGGGCGGGC CTGCGGACGG CGCGTTCGTG GCTGACGAGG GAATGCCCGT GGACGGCCGG 
GACATTGACC CTGAGGTGGA TGTCGTTGAG GGTTCGCTTC CGCTGGCGGT GCTGGACTTC 
GTCGGGATCG AGCACGGTGA GAGTCCGAGC GCGGCGATCG CCGGGGCGGT GGCCGTCGCC 
CGCACCGCCG AGACGGCCGG ATACCGGCGG TACTGGGTCT CCGAGCATCA CAACATGACC 
AGCCTGGCGT GCAGCTCCCC CGAGCTGCTG ACCGCGCACG TCGGGGCGCA GACGTCCCGG 
ATCAGGGTCG GCGCGGCCGG GATCATGCTG CCCAACCACG CGCCGATGAA GGTCGCCGAG 
ACGTTCCGGA CACTGCTGGC GATGTACCCG GGGCGGGTCG ATCTCGCGCT CGGCCGGGCG 
CCGGGAACCG ACCCGCTGAC CGCGCACGTG CTGCGCCGCG GGGCGTCCGC CGACGCGGGC 
GCGGAGTTCC CCGGGCAGGT CGGCGAGCTC CTCGCGTTCC TCGGTGACGG TTTCCCGGCC 
GGTCATCCCT ACGCGCAGCT GGTGGCAGCG CCGGTGATCG ACGAGCGCCC GGAGATGTTC 
GTTCTCGGGT CGAGCCCGTA TGGCCCCAGA TTCGCCGCCG TCAACGGCCT GAGCGCGGTG 
TTCGCCCACC ACATGAGCCC TGAGCTGGCG TTCGACGCGC TGCGGGCCTA CCGGCGCGAG 
TTCACCCCGC GGGCCGAGGG CACGCAGCCG TACTCCGCGA TGTCCGTGCT CGCCTTCGCC 
AGTGAGGACG AGGAGGCCAC GCTCGACTTC GAGGCGGCCT GGACCCTCAC CATCCAGAAC 
ATCAGCCGCG GGGTGCGCGA GCCGCTGCGG CCGGAGGACA TCCGCGGCTA TGCCCGTTCG 
GAGCGGTTCC GGGCCGCCCG GCGCCCCGAC GACGGCCGGA TGGTGACCGG CGAGCCGAAG 
GCCGTGGCCG AGCGGCTGCT GGAGATGAAG CAGCAGGCCC AGGTCGACGA GATCGTCATC 
GTCACGCCGA GCCTGGACCG GGCCCGCCGC CAGGGCAGCT TCGCCGCGCT GGCCGAGGCC 
TGGCGCCAGG CGGCCTGA

Protein sequence

MTRQAHIPVN SAGPGRDHSS RGGPADGAFV ADEGMPVDGR DIDPEVDVVE GSLPLAVLDF 
VGIEHGESPS AAIAGAVAVA RTAETAGYRR YWVSEHHNMT SLACSSPELL TAHVGAQTSR 
IRVGAAGIML PNHAPMKVAE TFRTLLAMYP GRVDLALGRA PGTDPLTAHV LRRGASADAG 
AEFPGQVGEL LAFLGDGFPA GHPYAQLVAA PVIDERPEMF VLGSSPYGPR FAAVNGLSAV 
FAHHMSPELA FDALRAYRRE FTPRAEGTQP YSAMSVLAFA SEDEEATLDF EAAWTLTIQN 
ISRGVREPLR PEDIRGYARS ERFRAARRPD DGRMVTGEPK AVAERLLEMK QQAQVDEIVI 
VTPSLDRARR QGSFAALAEA WRQAA