Gene Franean1_3378 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3378
Symbol
ID	5671749
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4003346
End bp	4004359
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	65%
IMG OID	641242266
Product	aldo/keto reductase
Protein accession	YP_001507686
Protein GI	158315178
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTGGATG AGGACATGGA GTACACCCGG CTGGGATCAT CAGGATTGAA GGTCAGCCGC 
ATCGCGCTCG GCTGCATGAG CTTTGGTAAG CCCAACACCG GGCGGGGCTG GGCGCTCGAC 
ACGGATGCGG CGGAGCCGCT CTTCCGGCAG GCGGTCGAGC TCGGCATCAC GCTCTGGGAC 
ACCGCGAACA TCTACGGTGT GGGCACCTCC GAGGAGATCA CCGGAGAGGC GATCGGGCGC 
TACACGAGCC GTGACCAGGT CGTCATTGCC ACAAAGCTGT TCGCCCCGAT GAGTCAGGGG 
CCTGGCGGAG GCGGTCTTTC CCGCCGCGCG GTGTTCGAGC AGATCGACGC CTCCCTGCGC 
CGCCTCGGCA CCGACTATGT CGACCTGTAC CAGATCCACA GGTTCGATCC GGAGACGCCG 
GTCGAGGAGA CAATGGAAGC TCTCCACGAC ATCGTGAAGG CGGGGAAGGT TCGCTATCTG 
GGCGCCTCGT CGATGTGGGC CTGGCAGTTC TCCAAGATGC AGTACACCGC TGAGCTGCAC 
GGCTGGACCA AATTCATTTC GATGCAGGAT CAGTACAGTC TTGTGGCGCG CGAGGAGGAG 
CGCGAGATGT TCGGGCTGCT CGCCGACCAG GGCGTGGGCA GCCTTCCGTG GAGCCCGCTC 
GCCGCGGGAC TCCTCACCCG GCCGTGGGGT GATGTGAGCA CGACTCGTGG GTCGTCCAAT 
CCGACGACCG ACGGATCGGG CAGGCCCCTT TTCTTCGACA GCGACCGAGG CACGGTCGAC 
GCGGTGCAGC AGATCGCGGA GACGCGAGGC GTCTCCATGG CACAGATCGC GATGGCCTGG 
GTGCTGAAGA ATCCCGTCGT CACCGCGCCG ATCGTCGGCG CGACGAAACC ACACCACCTG 
GCGGACGCGG TCGCTGCCCT GGACATCGAC CTCAGCGACA AGGAAGTAGC CGCGCTCGAG 
GAGCACTACT CCCCGCGTCA GCCTACCTAC TACGGGTCGA AGTCCGGTTA CTGA

Protein sequence

MLDEDMEYTR LGSSGLKVSR IALGCMSFGK PNTGRGWALD TDAAEPLFRQ AVELGITLWD 
TANIYGVGTS EEITGEAIGR YTSRDQVVIA TKLFAPMSQG PGGGGLSRRA VFEQIDASLR 
RLGTDYVDLY QIHRFDPETP VEETMEALHD IVKAGKVRYL GASSMWAWQF SKMQYTAELH 
GWTKFISMQD QYSLVAREEE REMFGLLADQ GVGSLPWSPL AAGLLTRPWG DVSTTRGSSN 
PTTDGSGRPL FFDSDRGTVD AVQQIAETRG VSMAQIAMAW VLKNPVVTAP IVGATKPHHL 
ADAVAALDID LSDKEVAALE EHYSPRQPTY YGSKSGY