Gene Lferr_1744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lferr_1744
Symbol
ID	6877726
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidithiobacillus ferrooxidans ATCC 53993
Kingdom	Bacteria
Replicon accession	NC_011206
Strand	+
Start bp	1720783
End bp	1721790
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	58%
IMG OID	642789613
Product	zinc-binding alcohol dehydrogenase family protein
Protein accession	YP_002220173
Protein GI	198283852
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID	[TIGR02822] zinc-binding alcohol dehydrogenase family protein

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0255685
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATGCCA TGGTTCTGGA AGAGGTGGGT AGGCCTTTGG TGCCCACTGA ATTGCCGCGA 
CCGCGGCCAC AGCCGGGCCA GGTCCTGGTA AAAATACTGG CGTGCGGAGT GTGCCGTACC 
GATCTGCATG TAGTGGACGG TGAATTGCCC AACCCCAAAC TACCACTCGT TCCCGGCCAT 
GAAGTAGTCG GCCAGATAGA ATCGGTGGGA AGCCCCGATA TTTCCTTACA GACCGGTCAG 
ATGGTGGGAA TTCCCTGGCT CGCATGGACC TGCGGTGCCT GCGAATATTG TCGAGCAGGA 
CGGGAGAATC TTTGTGACCA GGCGCGTTTT CATGGCTACA CCGTGGATGG CGGTTACGCC 
GAGTATATGG TCGCCGATGC GCGTTACTGC TTCCCTCTTC CAGACATTTA CGCCAATCCG 
GAAGGTGCCC CGCTGTTGTG TGCGGGGCTC ATCGGCTTTC GGGCCTTACG TTTTGCCGCG 
GGAAGACGAC GCCTGGGTCT TTATGGATTC GGCGCTGCCG CGCATTTACT GATTCAGGTA 
GCGCGTTATC AAGGCATGGA GGTCTATGCA TTTACCCGCC CGGGCGATAG CAAGGCACAG 
GATCTAGCGA TCAAATTGGG GGCTGTGTGG GTAGGTGGAT CGGAGGTCCT GCCGCCACAA 
CCGCTGGATG CGGCAATTTT GTTTGCACCG GTTGGAGCCC TGATACCTAT TGCTCTTCAG 
GCGGTCAAGA AAGGGGGTGT TGTGATCAGT GCGGGGATTC ACATGTCGGA TATCCCAGCT 
TTCCCCTATT CCTTACTCTG GGAGGAGCGA CAGGTGCGAT CGGTTGCCAA CCTGACGCGC 
AAAGATGCCG AGGACTATTT CCCACTGGCA CGACGGGTCC CGGTGCAAAG CCATATCACG 
ACGTATCCTT TGGCCATGGC GAATGTGGCA TTGGCGGATT TGAGAGGTGG CGCGGTCCAC 
GGTGCCGCGG TACTGGTTAT GGGGGCATGG CAGGAACGCG AGACGTGA

Protein sequence

MHAMVLEEVG RPLVPTELPR PRPQPGQVLV KILACGVCRT DLHVVDGELP NPKLPLVPGH 
EVVGQIESVG SPDISLQTGQ MVGIPWLAWT CGACEYCRAG RENLCDQARF HGYTVDGGYA 
EYMVADARYC FPLPDIYANP EGAPLLCAGL IGFRALRFAA GRRRLGLYGF GAAAHLLIQV 
ARYQGMEVYA FTRPGDSKAQ DLAIKLGAVW VGGSEVLPPQ PLDAAILFAP VGALIPIALQ 
AVKKGGVVIS AGIHMSDIPA FPYSLLWEER QVRSVANLTR KDAEDYFPLA RRVPVQSHIT 
TYPLAMANVA LADLRGGAVH GAAVLVMGAW QERET