Gene Franean1_4973 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4973
Symbol
ID	5673312
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	5968024
End bp	5969106
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	71%
IMG OID	641243827
Product	luciferase family protein
Protein accession	YP_001509243
Protein GI	158316735
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.844261
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACTCGGA CAACGAGCGA TCAGAGCGAC GAAAGCGACC GCGCGGGCAG GACGCCCTCC 
GGCGGACAAG GCGCCAGCCC CGCCCCAGCC GGGACCGTCA CCGGCCAGGA TCCGGCCTCG 
TCCGGAACTG GCCGCTGGGG GATGACGATT CCGCTGGCCG ATGCGCCCCT GACGGACCTG 
CCCGCACTGT GCGGGCGACT GGCGGACGCC GGCTACACCG ACGTCTGGTC GTCCGAGGCA 
ACCACGACGG ACGGGATCGT CCCGCTGGCG CTCGCCGCCG GCGAACCACG GCTGCGGCTC 
GGCAGCGCGA TCGTGTCGGC CTACACCCGC GGCCCGGCGC TGCTCGCCCA GACCGCGGCG 
ACAATGGCCG CCGCCGCGCC GGGCCGGTTC GTCCTCGGAC TCGGCACGTC GTCGGATGTG 
ATCGTTTCGA ACTGGAACTC CATCCCGTTC AGCCGCCCGT ACCAGCGGAT GCTGGACACC 
GTCCGGTTCC TGCGCCGGGC CTTCGCCGGC GAGAAGATCA GCGAGGAGTT CCCGTCCTTC 
ACGGTCCGCG GCTTCCGGCT CGGCGTCGCA CCGTCCGCCC CGCCGAAGAT CATGGTCGCC 
GCACTGCGAC CTCGGATGCT CGAGTTCGCC GGCCGCGAGG CGGACGGAGT GATCCTTAAC 
TGGCTTTCGC CGGCCGACTG CGGCACCGTC CTGCCGCACG TGCGTGAACA CAACTCTGAC 
GCCGAGGTGG TCGCCCGGAT CTTCGTGTAC GTGCACGACG ACCCGGCAGC CGCCCGCCCT 
CTACTCAGGA AGATGATCGC CGCCTACCTG ACGGTGCCGG TGTACCGGGA GTTCCACCTG 
TGGCTCGGCC GCCAGGCGGC ACTGGAGGGC ATGTGGAGCG CGTGGGCGGC CGGCGATCGC 
AAGGCCGCCC TGGCCGCGAT CCCGGACGAG GTCGTGGACG AGCTGATCGT GCACGGGACG 
GTCGAGAAGT GCCGGGCCGG CCTGCGACGG TACGTCGAAC ACGGGGTGAC CACCCCGGTC 
CTCTCGATCG TGAACGGCGG CCCCAACCCG ATGGACCTCG CGTCCGCGCT CGCCGCGGAC 
TAA

Protein sequence

MTRTTSDQSD ESDRAGRTPS GGQGASPAPA GTVTGQDPAS SGTGRWGMTI PLADAPLTDL 
PALCGRLADA GYTDVWSSEA TTTDGIVPLA LAAGEPRLRL GSAIVSAYTR GPALLAQTAA 
TMAAAAPGRF VLGLGTSSDV IVSNWNSIPF SRPYQRMLDT VRFLRRAFAG EKISEEFPSF 
TVRGFRLGVA PSAPPKIMVA ALRPRMLEFA GREADGVILN WLSPADCGTV LPHVREHNSD 
AEVVARIFVY VHDDPAAARP LLRKMIAAYL TVPVYREFHL WLGRQAALEG MWSAWAAGDR 
KAALAAIPDE VVDELIVHGT VEKCRAGLRR YVEHGVTTPV LSIVNGGPNP MDLASALAAD