Gene Franean1_3467 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3467
Symbol
ID	5671838
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4097712
End bp	4098776
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	75%
IMG OID	641242355
Product	luciferase family protein
Protein accession	YP_001507775
Protein GI	158315267
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0478174
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGTCG GACTGGGATA TCTGAACATG GCCCCGGCGG GCGACGCCCC GACCGCCCGG 
GCCCTCTACG CCGACTTCCT GCACGACGCC CGGTGGGCGC AGGCCGCGGG CTTCGCCGGC 
ATCTGGGTCA CCGAGCACCA CTTCTCCACC TACAGCCTGA CCTCGTCGCC GCTGCTCCTG 
CTGGCACAGG CGGCGGTCGT CGCGCCCACG CTCCGGCTGG GCACGTCGAT CCTGGTGCTG 
CCCTTCTGGG ACCCGGTGCG GCTGGCCGCC GACCTGCTCA CCCTGGACGC GCTGTCCGGT 
GGGCGGCTCG ACGTCGGCAT CGGCCGCGGG TACCAGCCGC ACGAGTTCCA CGGGTTCGGC 
CGGGACCCGG CGGACAGCCG GGCCGCCTTC ACCGAGGCGG TCGACCTCCT CCAGCAGCTG 
TTCACCGGCC ACGACGAGCG GTTCGCGGGC CGCTTCCACC GGATCGACAC GCCGGTCACC 
CTGCTGCCCC GCCCGACCCA GCGGCCCCAC CCGCCGATCT GGACGTCGGC CACCAGCCCG 
GAGTCGCTGC GCTTCGCCGC GGACCGGGGC TTCCACTTCA TGCTGCCCGC CGGCACGACG 
TTCCCGCAGG TCGTGGAGCG CCGGCGCTGG ATCGAGGAGG CCGGCGGGCT GCCGGCCGGG 
CGTGAGTTCC AGGTCAACCG GTTCGTGTAC CTGGGCGACG AGGAGGGCCG GGCGGCGGTC 
GTCCGGGAGA TCGCCCGCCA GTTGCAGACC TCGGCCGCGC TGACGGAGGG GACGGGCCCG 
GTGGCGGGCG CCGCTCCCGC TCCCGAGCGG CCGGATCCCG CGATGGAGGA GAAGGCGCGC 
GAGGTCCTCA TCACCGGGTC CGCGTCGGAG GTGCTCGAGC AGTTCCTGGC CCTGGCCGAG 
ACGGGCATCA CCTACGTCAT CGCCAGCTTC GCCTTCGGGT ATCTCGACCT TCGGGTCAGC 
CGGCGCTCCC GGGAGCGGTT CGCCGCCGAG GTGCTGCCCC GTCTCCCGGT GCCGGGGTCG 
GCCCCGGCCG CGCTGCCGCC GCCGGCCCTG CCCGCGGCCC GGTGA

Protein sequence

MRVGLGYLNM APAGDAPTAR ALYADFLHDA RWAQAAGFAG IWVTEHHFST YSLTSSPLLL 
LAQAAVVAPT LRLGTSILVL PFWDPVRLAA DLLTLDALSG GRLDVGIGRG YQPHEFHGFG 
RDPADSRAAF TEAVDLLQQL FTGHDERFAG RFHRIDTPVT LLPRPTQRPH PPIWTSATSP 
ESLRFAADRG FHFMLPAGTT FPQVVERRRW IEEAGGLPAG REFQVNRFVY LGDEEGRAAV 
VREIARQLQT SAALTEGTGP VAGAAPAPER PDPAMEEKAR EVLITGSASE VLEQFLALAE 
TGITYVIASF AFGYLDLRVS RRSRERFAAE VLPRLPVPGS APAALPPPAL PAAR