Gene Franean1_0487 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0487
Symbol
ID	5668907
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	570804
End bp	571682
Gene Length	879 bp
Protein Length	292 aa
Translation table	11
GC content	67%
IMG OID	641239417
Product	luciferase family protein
Protein accession	YP_001504855
Protein GI	158312347
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03619] probable F420-dependent oxidoreductase, Rv2161c family

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.372075
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGACT CTATGGTACG AGGCATGGAT ATAGGGATCT TCACCGGTAT CACCGACGAG 
CAGATCAGGC CGGCCCTGCT CGCACGGGCA GTCGAGGAGC GGGGGTTCGA GTCACTGTTC 
GTCGCCGAGC ACACCCACAT CCCGGTCCGC CGGGAGACGC CGTATCCCGA AGGTGGCGAC 
CTTCCCCGCG ACTACTATCG CACCCTCGAT CCCTTCATAA GCCTGACGAC CGCCGCGGCC 
GTGACGACCC GATTGCGACT CGGCACCGCG ATAGCGCTGG TGGTACAGCG GGATCCGATC 
CTGTTGGCGA AGGAGACCGC CACCCTCGAC CTGGTCAGCG ACGGCCGATT CGAGCTGGGC 
ATCGGCGCCG GCTGGCTGCG CGAGGAGATG CGCAACCACG GCACCGACCC GGAAACCCGG 
GTGCCGCTGA TGCGGGAACG GCTGGCCGCG ACGAAAGCGC TCTGGACGTC GGAGCAGGCG 
GAGTTCCACG GTCGCTTCGT CGACTTCGAT CCGATCTTCC AATGGCCGAA ACCGGTGCAG 
CGGCCGCATC CACCGGTGTG GATCGGAGGC TGGGGTCCGA CCACATTCCA CCGGATCGTC 
ACCGACGGCG ACGGCTGGCT CGCTCCTCCC ATACCGGTCG ACGCCTTGGC CCGCGGGGTC 
GAGGAACTAG CCGAGGTGGC GAACCGGGCC GGGACGGCCG CACCACCGGT GACCGCGATC 
CTGCTGAACC CTGACGAGGC AGCGACCGAG AAAGCTGCGC TCCTCGGTGT CCGTCGCATC 
CTGTTCGGGC TGTTTCCCGT CACCGATGCC GACACGACAC TGCGCACTCT GGACCACCTG 
GGCACCCTGG CCCAGCGCAC GGTCCTGGCT CGGGGCTAA

Protein sequence

MSDSMVRGMD IGIFTGITDE QIRPALLARA VEERGFESLF VAEHTHIPVR RETPYPEGGD 
LPRDYYRTLD PFISLTTAAA VTTRLRLGTA IALVVQRDPI LLAKETATLD LVSDGRFELG 
IGAGWLREEM RNHGTDPETR VPLMRERLAA TKALWTSEQA EFHGRFVDFD PIFQWPKPVQ 
RPHPPVWIGG WGPTTFHRIV TDGDGWLAPP IPVDALARGV EELAEVANRA GTAAPPVTAI 
LLNPDEAATE KAALLGVRRI LFGLFPVTDA DTTLRTLDHL GTLAQRTVLA RG