Gene Franean1_6571 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6571
Symbol
ID	5674886
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7995180
End bp	7996256
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	76%
IMG OID	641245422
Product	alcohol dehydrogenase zinc-binding type 2
Protein accession	YP_001510814
Protein GI	158318306
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID	[TIGR02822] zinc-binding alcohol dehydrogenase family protein

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGGCCT GGCAGGTCAC TCGCCCCGCG CCGGTGGCCA CGGCGCCACT GCGCGCGGTC 
GAGCTGCCCA TCCCCGAGCC CGGTCCCGGT CAGGTCCGTC TGAAGGTCGC CGCCTGCGGC 
GTCTGCCGGA CGGACCTGCA CCTGGCCGAG GGCGACCTCC CGCCGCACCG GCCGCTCACC 
GTGCCCGGTC ACGAGGTCGT CGGGTACGTC GACGCGCTCG GTCCCGGGGT CCACGGGGTT 
TCCGGGCCAG CCGGGCCAGC CGGTGCGGCC GGCTCCCGGC GACCCGATCC GGCCCCGGCG 
GCCCCGATCC GGCTGGGTGA CCGGCTCGGC ATCGCCTGGC TCGCCGGAAC GGATCAGACG 
TGCGCCTACT GCCGGCGCGG CGCCGAGAAC CTCTGCCCCG CGTCGCTCTA CACAGGCTGG 
GACGCCGACG GCGGGTACGC CCAGTACGCC GTCGTCGACG CGGACTACGC CTACCGCCTG 
CCCGCCGGCT ACAGCGACGG CGAGCTGGCC CCGTTGCTGT GCGCCGGGAT CGTCGGCTAC 
CGGGCGCTGC TGCGCGCCGA GCTTCCGCCC GGCGGCCGGC TGGGCGTCTA CGGGTTCGGC 
GCGTCCGCGC ATCTCGCCGC GCAGGTGGCG ATCGCCCAGG GCGCGACGGT GCACGTCATG 
ACCAGGTCCG CCCGGGCCCG CCGCCTCGCC CTCGAGCTCG GCGCGGCGTC CGCGACCGGC 
GCCTACGACT TCCCACCCGA GCCGCTCGAC GGGGCGGTCC TGTTCGCACC GGTCGGCGAT 
CTGGTCCCGG TCGCGCTCGC CGCGCTGGAC AGGGGCGGCA CCCTCTCGAT CGCCGGGATC 
CACCTCACCG ACGTCCCGGT CCTGAACTAC CGTCGGCACC TGTTCCAGGA GCGCTCGGTG 
CGCAGCACGA CCGCGAACAC CCGCGCCGAC GGCCGCGAGT TCCTGGAGAT CGCCGGGCGC 
CACCGGCTCG CGGTGACAAC CACCCCGTAC CCGCTGACGG CCGCCGACCA GGCGCTCGAG 
GACCTCGCAC GCGACCGGGT GGACGGCGCC GCCGTGCTGT TCCCGGACGG CGTCTGA

Protein sequence

MLAWQVTRPA PVATAPLRAV ELPIPEPGPG QVRLKVAACG VCRTDLHLAE GDLPPHRPLT 
VPGHEVVGYV DALGPGVHGV SGPAGPAGAA GSRRPDPAPA APIRLGDRLG IAWLAGTDQT 
CAYCRRGAEN LCPASLYTGW DADGGYAQYA VVDADYAYRL PAGYSDGELA PLLCAGIVGY 
RALLRAELPP GGRLGVYGFG ASAHLAAQVA IAQGATVHVM TRSARARRLA LELGAASATG 
AYDFPPEPLD GAVLFAPVGD LVPVALAALD RGGTLSIAGI HLTDVPVLNY RRHLFQERSV 
RSTTANTRAD GREFLEIAGR HRLAVTTTPY PLTAADQALE DLARDRVDGA AVLFPDGV