Gene Francci3_3750 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3750
Symbol
ID	3906034
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4497869
End bp	4498849
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	73%
IMG OID	637881076
Product	zinc-binding alcohol dehydrogenase
Protein accession	YP_482830
Protein GI	86742430
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.220765
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTAGCCG CCGCCGCCAT GTCCCTCCAC CCCGATTCCC CGCTCGACGG CCTGGCCATC 
GGGGAGCAGC CCGAACCCGC GCCGCTCGAC GGGTGGGTCA CCGTCACGGT GCGGGCCGCC 
TCGCTCAACC ATCACGACCT GTTCAGCCTG CGTGGAGTGG GCCTGCCGGC GGATCGGCTC 
CCGATGATCC TCGGCTGTGA CGCCGCCGGG GTGACCCCCG ACGGGCAGGA GGTCATCGTC 
CACAGCGTGA TCGGTGATCC GGCAGCGGGC GGGGGGGACG AGACGCTGGA CCCGAAGCGG 
ACCCTGCTGT CCGAGCTGTA CCCGGGAACC CTTGCCGAGC GGGTCGCCGT GCCGCGGCGC 
AACCTGATCC CGAAGCCCGC AGGGTTGTCG TGGGAGGAGG CCGCCTGCCT GCCGACCGCC 
TGGCTCACCG CCTACCGGAT GGTCGTCTCC CGGGCGGGGC TGCCCGCCGG GGGCGGCGGC 
ACCGTGCTCA TCCAGGGAGC CGGTGGGGGG GTGGCCACCG CGGCGCTGCT GATCGCCAAG 
GCCGCCGGGC ACACCGTTTT CGTGACCTCG CGGGACGAGA CCAAGCGGAA GCGGGCGGCC 
GCCCTCGGCG CCGACGAGGT TCTCGAACCC GGTGCCCGGC TGCCGCGCCG GGTCGACGCG 
GTCATCGAGA CCGTCGGCGC CGCCACCTGG GGTCACTCGG TGAAGGCAGT GCGCCCCGGC 
GGGCGCATCG TGGTCTCGGG CGCCACCAGT GGTCCGAACC CGCCGGCGGA CCTCACCCGG 
ATCTTCTTTC TCCAGCTGTC GGTGATCGGT TCCACCATGG GGAGCCGGGA CGAGCTAGTC 
GATCTCGTTG CATTCGTGGA ACGGACCGGG GTGCGGCCGC TGATCCACGA GGTGCGCCCG 
TTGGCCGATG CCCGGGCCGC CTTCGAGCAG CTGCTCGGCG GTGAGTTCTT CGGCAAGTTG 
ATACTCCGCC CCCCCGCCTA G

Protein sequence

MLAAAAMSLH PDSPLDGLAI GEQPEPAPLD GWVTVTVRAA SLNHHDLFSL RGVGLPADRL 
PMILGCDAAG VTPDGQEVIV HSVIGDPAAG GGDETLDPKR TLLSELYPGT LAERVAVPRR 
NLIPKPAGLS WEEAACLPTA WLTAYRMVVS RAGLPAGGGG TVLIQGAGGG VATAALLIAK 
AAGHTVFVTS RDETKRKRAA ALGADEVLEP GARLPRRVDA VIETVGAATW GHSVKAVRPG 
GRIVVSGATS GPNPPADLTR IFFLQLSVIG STMGSRDELV DLVAFVERTG VRPLIHEVRP 
LADARAAFEQ LLGGEFFGKL ILRPPA