Gene Franean1_4809 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4809
Symbol
ID	5673150
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5740854
End bp	5741846
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	70%
IMG OID	641243665
Product	aldo/keto reductase
Protein accession	YP_001509081
Protein GI	158316573
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.419234
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.447394
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAGTACG TCAAGCTGGG GTCGACCGGC CTGGAGGTCT CCCGGGTCTG CCTGGGCTGC 
ATGAGCTACG GCACCCCGGG GGAGGGGAAC TGGCCGTGGT CTCTTGACGA GGACGCGTCG 
CGGCCGTTCT TCCGGCGTGC GATCGAGGCG GGGATCAACT TCTTCGACAC CGCGAACGTC 
TACTCGCTGG GCCGCAGCGA GGAGATCACC GGCCGGGCGC TGAAGGACTT CGCCCGCCGG 
GACGAGATCG TGCTGGCCAC CAAGGTCCAC TCCCGGATGC GGTCCGGCCC GAACGGGGCC 
GGCCTCTCCC GCAAGGTGAT CATGCACGAG ATCGACGCGA GCCTGCGGCG CCTCGGCACG 
GACTACGTCG ACCTCTTCCA GATCCACCGC TGGGACGAGA CGACGCCGAT CGAGGAGACG 
CTCGAGGCGC TGCACGACGT CGTGAAGGCC GGCAAGGCCC GTTACATCGG CGCCTCGTCG 
ATGTACGCCT GGCAGTTCAC CAAGGCGTTG TTCATCTCCG AGCGGCACGG CTGGACCCGT 
TTCGCGACGA TGCAGAACCA CTACAACCTG CTCTACAGGG AGGAGGAGCG GGAGATGCTC 
CCGCTGTGCG CGGACCAGGG GATCGGCGTG ATCCCGTGGA GCCCGCTGGC CCGCGGCCGC 
CTCACCCGCG ACTGGGACGC CACCACGACC CGCGCCGAGT CCGACCCCTT CGCCCGCGCC 
TTCTACCAGG ACGACGACCG GCTGATCGTC GAGGAGGTCG CCCGCATCGC CGACGAGCGC 
GGCGTGAGCC GGGCCCAGGT GGCGCTGGCC TGGGTGTCAC GCAATCCCGT CGTCACCGCG 
CCGATCGTCG GCGCCACAAA GCCCGGGCAC CTCGACGACG CGCTCGCCTC CCTGGAGCTG 
ACCCTCACCG ACGACGAGGC CGCCCGGCTG GAGGCCCCGT ACCGCCCACG GCCCGTCGCC 
GGTATCCAGG TGCCGCAGCG GCGACGGCTC TGA

Protein sequence

MEYVKLGSTG LEVSRVCLGC MSYGTPGEGN WPWSLDEDAS RPFFRRAIEA GINFFDTANV 
YSLGRSEEIT GRALKDFARR DEIVLATKVH SRMRSGPNGA GLSRKVIMHE IDASLRRLGT 
DYVDLFQIHR WDETTPIEET LEALHDVVKA GKARYIGASS MYAWQFTKAL FISERHGWTR 
FATMQNHYNL LYREEEREML PLCADQGIGV IPWSPLARGR LTRDWDATTT RAESDPFARA 
FYQDDDRLIV EEVARIADER GVSRAQVALA WVSRNPVVTA PIVGATKPGH LDDALASLEL 
TLTDDEAARL EAPYRPRPVA GIQVPQRRRL