Gene Franean1_5066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5066
Symbol
ID	5673402
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	6065049
End bp	6066149
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	73%
IMG OID	641243917
Product	alcohol dehydrogenase
Protein accession	YP_001509332
Protein GI	158316824
COG category	[C] Energy production and conversion
COG ID	[COG1062] Zn-dependent alcohol dehydrogenases, class III
TIGRFAM ID	[TIGR03451] mycothiol-dependent formaldehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0364575
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGATG GCCCGCAGGC AGTGACGGTG GAGGCGGTCG TCGCGGTCGA GAAGGGCGCG 
CCGGTGGCGC TGACGCGGAT CATCGTGCCG CCGCCGGGCC CCGGGGAGGC CCGGGTCCGG 
GTGCAGGCGT GCGGGGTGTG CCACACCGAC CTGCACTACC GCGAGGGCGC GATCAACGAC 
GACTACCCGT TCCTACTCGG CCACGAGGCG GCCGGGACGG TCGAGTCCGT CGGCGATGGG 
GTCACCTCGG TCGTCCCGGG TGACTACGTG GTGCTGGCCT GGCGGGCGCC GTGCGGGACG 
TGCCGGTCGT GCCTGCGCGG GGCGCCCTGG TACTGCTTCG ACTCCCGCAA CGCCGTCAAC 
CCGATGACGC TGCAGGACGG CACCCCGCTC TCCCCCGCTC TGGGCATCGG CGCCTTCACG 
CCGCTGACAC TCGTGGCCGC CGGGCAGTGC GTCAAGGTCG ACCCGGCCGT TCCGCCGCAG 
GCGGCGGGCC TGATCGGCTG TGGGGTCATG GCCGGCTTCG GCGCCGCGGT GAACACCGGA 
CGGGTAACCC GCGGCGAGAC GGTCGCCGTC TTCGGCTGCG GCGGGGTCGG CGACGCGGCC 
ATCGCCGGCG CGTCGGTCGC CGGCGCGCGC CGGATCATCG CCGTCGATGT GGACGACCGC 
AAGCTCGAGT GGGCCCGCGG GTTCGGCGCG ACCCATGTCG TGAACTCCCG GAACGAGGAC 
CCGGTGGAGG CCGTGCGGGC GCTGACCGAC GGCAACGGGG CGGACGTCGT GATCGAGGCG 
GTCGGCCGCC CCGAGACCTA CCGGCAGGCA TTCTTCTCCC GCGACCTGGC CGGACGGCTG 
GTGCTCGTCG GCGTGCCCGA CCCGTCGATG ACCGTCGAGC TGCCGCTCAT CGAGGTGTTC 
AGCCGCGGCG GCTCGCTGGC GTCGTCCTGG TACGGCGACT GCCTCCCGAC CAGGGATTTC 
CCGATCATCA TCGACCTGCA CCGCGGTGGC CGGCTCGACC TGGCCGCGTT CGTCACCGAG 
ACGGTCGGCA TCGGGGACGT CGAGCGGGCC TTCGAGCGGA TGCGGCGCGG TGACGTGCTG 
CGCAGCGTGG TCCTGATCTG A

Protein sequence

MTDGPQAVTV EAVVAVEKGA PVALTRIIVP PPGPGEARVR VQACGVCHTD LHYREGAIND 
DYPFLLGHEA AGTVESVGDG VTSVVPGDYV VLAWRAPCGT CRSCLRGAPW YCFDSRNAVN 
PMTLQDGTPL SPALGIGAFT PLTLVAAGQC VKVDPAVPPQ AAGLIGCGVM AGFGAAVNTG 
RVTRGETVAV FGCGGVGDAA IAGASVAGAR RIIAVDVDDR KLEWARGFGA THVVNSRNED 
PVEAVRALTD GNGADVVIEA VGRPETYRQA FFSRDLAGRL VLVGVPDPSM TVELPLIEVF 
SRGGSLASSW YGDCLPTRDF PIIIDLHRGG RLDLAAFVTE TVGIGDVERA FERMRRGDVL 
RSVVLI