Gene Francci3_1449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1449
Symbol
ID	3903181
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1740260
End bp	1741348
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	72%
IMG OID	637878786
Product	zinc-binding alcohol dehydrogenase
Protein accession	YP_480555
Protein GI	86740155
COG category	[C] Energy production and conversion
COG ID	[COG1062] Zn-dependent alcohol dehydrogenases, class III
TIGRFAM ID	[TIGR03451] mycothiol-dependent formaldehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0465334
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGCGC AGACGGTGGA AGCGGTGGTG GCCCGGGAGA AGGGCGCCGC GGTCTCGCTG 
GAGCAGATCG TTGTTCCAGA TCCGGGTCCA GGCGAGGCAC GGGTACGGGT GCGCGCCTGC 
GGCGTATGCC ATACCGACCT GCACTACCGC GAGGGCGCGA TCAACGACGA CTATCCGTTC 
CTGTTGGGGC ACGAGGCGGC CGGCACCGTC GAATCGGTGG GCGAGGGCGT GGTGGGTCTG 
GCCCCGGGTG ACTACGTGGT GCTGGCCTGG CGGGCCCCCT GCGGAACCTG CCGGGCCTGT 
CGGCGCGGCA TGGCCTGGTA CTGCTTCGAC TCCCGCAACG CGCGAAATCC GATGACCCTG 
GCGGACGGGA CGCCGCTGGC GCCGGCGCTG GGCATCGGCG CGTTCACGCC GCTGACCCTG 
GTCGCCGCGG GCCAGTGCGT GCCGGTGGAC CCCGCGGCCC GGCCAGAGGC GGCCGGGCTG 
ATCGGCTGCG GGGTGATGGC CGGTTTCGGT GCCGCCGTGA ACACCGGCAG GGTCACCCGG 
GGTGAGACGG TGGCGGTGAT CGGCTGCGGC GGGGTCGGCG GCGCGGCGAT CGCCGGCGCC 
TCGATCGCGG GAGCGCGGAA GATCATCGCG GTCGATGTCG ACGACCGGAA GCTCACCTGG 
GCCCGACGCT TCGGTGCCAC CGATGTCGTG AATGCCACGG CAGACGATCC GGTGGCGGCC 
ATCCGGGCGC TCACCGACGG CTTCGGCGCC GATGTGGTCA TCGATGCGGT GGGCCGCCCG 
GAGACCTACC GCCAGGCCTT CGACGCCCGC GACCTGGCGG GGCGGCTGGT CCTGGTGGGT 
GTACCCGACC CGACGATGAC CGTGGAGCTG CCGCTCGCCG AGGTCTTCGG CCGCGGCGGT 
CACCTGTCGT CGTCCTGGTA CGGCGACAGC CTGCCGAGCC GCGACTTCCC GATCCTCATC 
GACCTCTATC GCCGGGGCCG ACTCGACCTC GACGCCTTCG TCACCGAGAC CATCGGGATC 
GGCGACGTCG AGGAGGCGTT CACCCGGATG CAGCGCGGCG ACGTGTTGCG CAGCGTCGTC 
ATCCTCTGA

Protein sequence

MGAQTVEAVV AREKGAAVSL EQIVVPDPGP GEARVRVRAC GVCHTDLHYR EGAINDDYPF 
LLGHEAAGTV ESVGEGVVGL APGDYVVLAW RAPCGTCRAC RRGMAWYCFD SRNARNPMTL 
ADGTPLAPAL GIGAFTPLTL VAAGQCVPVD PAARPEAAGL IGCGVMAGFG AAVNTGRVTR 
GETVAVIGCG GVGGAAIAGA SIAGARKIIA VDVDDRKLTW ARRFGATDVV NATADDPVAA 
IRALTDGFGA DVVIDAVGRP ETYRQAFDAR DLAGRLVLVG VPDPTMTVEL PLAEVFGRGG 
HLSSSWYGDS LPSRDFPILI DLYRRGRLDL DAFVTETIGI GDVEEAFTRM QRGDVLRSVV 
IL