Gene Francci3_1547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1547
Symbol
ID	3904779
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1855936
End bp	1856955
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	74%
IMG OID	637878884
Product	zinc-binding alcohol dehydrogenase
Protein accession	YP_480652
Protein GI	86740252
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.135035
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACGCCTG CCGCGGACAT CGCGGACATC GCGGAGGTCT CGACGCGGTG GGACAGCCGC 
GGCGGGACGG CCAGGGAAAC GGCGAAGGGA ACGGTGGTTG TGGTGCCGAA GGCTTACGTC 
TACAACGACC ACGGCGGTCC GGAGGTGGAG GCGTTCGCTG ACCTCCCGAT CCCGGTGGCC 
GGGCCGGGTC AGCTCACGAT CGCGGTACGC GCCGCCGGGG TCAACCCCGT GGACTGGAAG 
CTGCGGGGCG GCCTGCGGCT GCCGGCCGCC CCGCCGGCCG TGTTTCCGGT CGTGCTCGGA 
GTGGAGGCCT CCGGCGTGGT GACGCAGGTG GGCCCGGACG TCAACGGATT CGCCGTCGGC 
GACGAGGTGT TCGGCAGCGC GCCGGGCGGT GGCTACGCCG AGTACACGGT GCTGACCGCC 
AGGGAGAGCG CGCGCAAGCC GGCCGCGGTG TCCTTCGTGG CCGCGGCGAC GCTTCCGGTC 
GCGGCGGCGA CCGCCTACGA CGGCGTGCAC CAGCTGGCCC TGCCGCCCGG CGCCACCCTG 
CTGATCATCG GTGTGGGTGG CGGCGTGGGA GTGGCCGCCG CGCAGATCGC CCGGCATGCG 
GGCCTGACGG TCGTCGGCAC CGCGAGCGCC GGCAAGAAGG ACTTCGTCGA GGCCCTCGGC 
GTGGCGCACG TCGAGCCGGG CCCCGATGTC GCGGACCGGG TGCGGGCCGC CGCGTCCCGG 
GGGGTCGACG GAATCTACGA TCTCGTCGGG GGCGAGACGC TGGACGACGT CGTCGAGGTC 
CTCGCGGACC GGTCGAAGCT CGTCACGGCC TTGTCTGGGG CGAGCGACCG GTACGGCGGG 
ACGACGGTCC AGCGGGCCCG GGACAGCCGC GTGCTCGACG CGGTCGCCCA GCTGGTCGTG 
GACGACGCGC TGGACCCGCT CGTGACCGCG ACCTTCCCGC TGGACCAGGC CCCGGCGGCG 
CTGCGCGCGG TGGAGAACGG CCACGCCCGC GGCAAGATCG TGATCAAGGT CGCCGCGTGA

Protein sequence

MTPAADIADI AEVSTRWDSR GGTARETAKG TVVVVPKAYV YNDHGGPEVE AFADLPIPVA 
GPGQLTIAVR AAGVNPVDWK LRGGLRLPAA PPAVFPVVLG VEASGVVTQV GPDVNGFAVG 
DEVFGSAPGG GYAEYTVLTA RESARKPAAV SFVAAATLPV AAATAYDGVH QLALPPGATL 
LIIGVGGGVG VAAAQIARHA GLTVVGTASA GKKDFVEALG VAHVEPGPDV ADRVRAAASR 
GVDGIYDLVG GETLDDVVEV LADRSKLVTA LSGASDRYGG TTVQRARDSR VLDAVAQLVV 
DDALDPLVTA TFPLDQAPAA LRAVENGHAR GKIVIKVAA