Gene Hhal_0140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_0140
Symbol
ID	4710691
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	159974
End bp	161173
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	71%
IMG OID	639854598
Product	iron-containing alcohol dehydrogenase
Protein accession	YP_001001736
Protein GI	121996949
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGGGG CGCAGATCCT CCAGCCCATC CACTGGCCGC GCACGGCCCA CTACCCCGGG 
GCGGTAGAAC GGTTGCAGCC CTGGGTGAAA GAGCTTTGCC CGGAGCCCGG TACGCTGGTC 
CTGGTCACCG GCCGCAATAC GCTGGCGTAC CTGGCGGCGG CGCAGGAGGC CGTGGACAGC 
CTAAAGGCGC AGGGGTGGCG TGTGGCGACG GTCATCGTCA CCGGCGAGCC GAGCGCCGAG 
TGGGTAGATG AGCAGCGTCA GGGTATCCCG GCCGGCGGTT CAGATCTGGT GATTGCGCTG 
GGCGGGGGGA GTGTCCTCGA CGTCGGCAAG ACCCTGGCGG CGATGGCCTG TGAAGAGGGG 
CCGACACGGG CCTACCTGGA GGGCGTGGGC GATCGGACGC CCTCCGGGCG CCGCCTGCCT 
TGGCTGGCCG TGCCGACCAC CATGGGGACG GGCAGCGAGG TCACCCATAA CGCCGTACTC 
GGCCAACCCG GCCTGGAACA GGGCTACAAG AAATCCCTGC GTCATCCCCA TTACGTGGCG 
GATCGGGTGG TTCTCGATGC GCGGCTGACG GCGTCCGTGC CGCGTTCGGT GGTTGCCAGT 
GCGGGGATGG ACGCCTTTTC GCAATTGCTG GAGAGCTACC TGGCGCCCAC CTCCTCGCCG 
CTGCTCGACG GCTGGCTGGT CTACGGCCTG GAGCTGGCCG GTGGGGCCCT CCCGGAGTTG 
ATCCGCCGCC ACGGCGATGC CGATCTCGAG GCGCAGCGCC ACGACATGGC GCTGGCTGCC 
AGTCTCTCGG GGGTGGCGCT CACCTATACC GGGCTAGGCA TCGTCCACGG GCTCATCGGG 
CCGCTCGGGG CGGTGGCGTC CGTCCCCCAC GGGGCGGCCT GCGCCAATGT GCTCCCCCCG 
GCGATGGCGC ATACCCTGCG CCAGGCTCGA GCCGTGGGCG GGGCGTCTCG GCAGCGGGTG 
GAGGATCGGA TGGCTGCGGT CTCCGGCCGG CTCGGCGGCG AGGCCCGGGC CGACGCCCTG 
GTCGAAACCC TAGAGCACTG GCGGCAGGAG GCGCGTACGC ACGCCGGACT GGTGGGGCTG 
TCCGGCTACG GCATCGAGCC CCGGCACCTG GAGGCCGTCG TGGCGAAGGG ATCGAACCGG 
CGCAACCCGG TGGCGCTGGA TGCCGAGCAG TGGCGGTCGA TCCTGGAGGA GAGCCTTTAG

Protein sequence

MAGAQILQPI HWPRTAHYPG AVERLQPWVK ELCPEPGTLV LVTGRNTLAY LAAAQEAVDS 
LKAQGWRVAT VIVTGEPSAE WVDEQRQGIP AGGSDLVIAL GGGSVLDVGK TLAAMACEEG 
PTRAYLEGVG DRTPSGRRLP WLAVPTTMGT GSEVTHNAVL GQPGLEQGYK KSLRHPHYVA 
DRVVLDARLT ASVPRSVVAS AGMDAFSQLL ESYLAPTSSP LLDGWLVYGL ELAGGALPEL 
IRRHGDADLE AQRHDMALAA SLSGVALTYT GLGIVHGLIG PLGAVASVPH GAACANVLPP 
AMAHTLRQAR AVGGASRQRV EDRMAAVSGR LGGEARADAL VETLEHWRQE ARTHAGLVGL 
SGYGIEPRHL EAVVAKGSNR RNPVALDAEQ WRSILEESL