Gene Francci3_4322 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_4322
Symbol
ID	3907291
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	5163738
End bp	5164688
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	72%
IMG OID	637881650
Product	zinc-binding alcohol dehydrogenase
Protein accession	YP_483397
Protein GI	86742997
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID	[TIGR02824] putative NAD(P)H quinone oxidoreductase, PIG3 family

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTGGT CGACGGTGGC GGACCCTCCT GCCCCGGGGC CGGGCGAGGT TACCCTGGAG 
GTGGTCGCGA CGGCGGTGAA CCGCGCGGAC CTGCTCCAGC GGCAAGGTTT CTACCCGCCG 
CCGCCCGGTG CCTCTGAGAT CATCGGGATG GAGTGCTCCG GGCGGGTGGC GGTTCTCGGC 
GCCGGCGTGG ACCGGGTTGA GGTCGGGGCC GAGGTGTGCG CGCTGCTCAG TGGGGGCGGC 
TACGCGAGTC GGGTGAACGT GCCGGTCGGC CAGGTGCTGC CGGTCCCGGC CGGGGTCGAC 
CTCATCACGG CGGCCGCTCT GCCCGAGGTC GCCTGCACGG TGTACTCCAC GGTGTTCGGC 
ATCGCCGGTC TGCGTGACCG CGAGGTCTTC CTCGTGCACG GCGGGGCGTC CGGCATCGGG 
ACCTTCGCGC TCCAGGCGGT CCGCGCGCTG CGTCCGAACG CGCTGGTCGC GACCACCGCC 
GGCACCGCGG CCAAACTGGC CAGGGTGCGG GAGCTCGGCG CCCACATCGC GGTCTCCTAC 
CGTGACGACG ACTTCGTCGC CAGGATCCGC GAGGCCACCG ACGGCCATGG GGCGGACGTC 
ATCCTCGACA ACATGGGTGC GGCGTATCTC GCCCGCAACG TCGCCGTGCT GGCCGTGGGA 
GGCCGTCTGG TCGTCATCGG CCTGCAGGGC GGGGTGAAAG GGGAGCTCAA CCTCGGCGCC 
CTGCTCACCA AGCGGGCGGC GGTCCACGCC GCGTCGCTGC GCGGGCGGCC GGTCGAGGAG 
AAGGCCGACA TCGTGACCGG TGTCCGCGGC GACTTCTGGC CGGCGATCGA GGCGGGGGCG 
ATCCGGCCGG TCATCGATCG GGTGCTGTCG ATCACCGAGG TCGCGCGGGC GCACCAGCAT 
GTGGCTGATT TCGGACATGT CGGAAAGGTG GTACTCACGA TCCCGGAATG A

Protein sequence

MTWSTVADPP APGPGEVTLE VVATAVNRAD LLQRQGFYPP PPGASEIIGM ECSGRVAVLG 
AGVDRVEVGA EVCALLSGGG YASRVNVPVG QVLPVPAGVD LITAAALPEV ACTVYSTVFG 
IAGLRDREVF LVHGGASGIG TFALQAVRAL RPNALVATTA GTAAKLARVR ELGAHIAVSY 
RDDDFVARIR EATDGHGADV ILDNMGAAYL ARNVAVLAVG GRLVVIGLQG GVKGELNLGA 
LLTKRAAVHA ASLRGRPVEE KADIVTGVRG DFWPAIEAGA IRPVIDRVLS ITEVARAHQH 
VADFGHVGKV VLTIPE