Gene Haur_1504 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1504
Symbol
ID	5733389
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	1753209
End bp	1754210
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	52%
IMG OID	641278642
Product	alcohol dehydrogenase
Protein accession	YP_001544276
Protein GI	159898029
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.139822
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAGCAA TTATCTATCG TGAATATGGC TCAGCCGATG TGTTGCGGCT CAGCGAAGTA 
GCTCGCCCAA CCCCTGCTGA AAATCAAGTT TTAATTAAAG TACATATGAC AGCCCTTAAC 
GCCGCCGATT GGCGCTTGAT GTCTGGTAAA CCCTTTCCTG TACGCTTTAT GACGGGCTTA 
TTCAAACCCA AAAAAGGTAT TCCTGGCACC GATGTGGCTG GAGTTATCGA AGCCGTCGGG 
CGTAACGTCA CTCAATTTAA AGTCGGCGAT GCGGTGTTTG GCGATCTTTC GGGCTGCGGA 
GCTGGTGGCT TAGGCCAATA TGTTTGTGCC CCCGAACATG TGCTGGTGCT CAAGCCCGAG 
CAGCTAAGTT TTGAACAAGC TGCTGCCGCG CCCATGGCCG CGGTCACAGC CTTGCAAGGC 
CTGCGCCAAG GCGGCATCGC CGCAGGCCAA AAGGTCTTGA TTTATGGAGC TTCAGGTGGA 
ATTGGCACAT TTGCGGTGCA GCTTGCTAAA CATTTTGGCG CAATCGTTAC CGCTGTTTCC 
AGTGCCGCCA AGCACGATTT GCTACGTTCG CTCGGCGCTG ATCAGGTGCT GGATTATGCT 
AAGGATGATT TTGCTCGCAA TGGTCAGCTG TATGATCTGA TTTTGGGGGT CAATGGTCAT 
CGCTCAATTT TCGACTATAA ACGCAGTTTA GCGCCTCAAG GTCGCTATGT GATGGTTGGC 
GGCGAAATGA GCCAGATTTT TCAGGCGATC GCCTTGGGCA AATTGCTCTC AATTGGCAGC 
CAAAAACAGC TGAGTAACCT GTTCGCCAAG CCCAACCAAA CCGATCTCGC CAAAATTGGC 
TTTTTGCTGG CCAACGGCGA TATCAAAGCG GTGATCGATC AGCGCTACCC GCTGGAAGAA 
GCTCCTGCCG CAATGCGTTA TCTCCAAGCT GGCCATGCCA AAGGCAAAAT TATGATCGAA 
TTGCAACCCA CCACAGCTCA AAGCTTGGAG CAAACCGTAT GA

Protein sequence

MQAIIYREYG SADVLRLSEV ARPTPAENQV LIKVHMTALN AADWRLMSGK PFPVRFMTGL 
FKPKKGIPGT DVAGVIEAVG RNVTQFKVGD AVFGDLSGCG AGGLGQYVCA PEHVLVLKPE 
QLSFEQAAAA PMAAVTALQG LRQGGIAAGQ KVLIYGASGG IGTFAVQLAK HFGAIVTAVS 
SAAKHDLLRS LGADQVLDYA KDDFARNGQL YDLILGVNGH RSIFDYKRSL APQGRYVMVG 
GEMSQIFQAI ALGKLLSIGS QKQLSNLFAK PNQTDLAKIG FLLANGDIKA VIDQRYPLEE 
APAAMRYLQA GHAKGKIMIE LQPTTAQSLE QTV