Gene Haur_3894 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3894
Symbol
ID	5735755
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	4886837
End bp	4887775
Gene Length	939 bp
Protein Length	312 aa
Translation table	11
GC content	52%
IMG OID	641281045
Product	alcohol dehydrogenase
Protein accession	YP_001546656
Protein GI	159900409
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00052515
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGACAA TGCAGGCAAT TCAAATTAAT CGGTATGGCG GCGTTGACGA ATTAGTGCAG 
GCAGAAATTG CGCGGCCTGA GCCTACCGCC GATCAAGTGT TAATTAAAGT TCATGCAATT 
GGGATTAATC CGGTTGATTA TAAAGTGCGC TCAGGTATGA TCGCCTTTTT CGATGAGCAA 
GCGTTTCCGG TGGCGCTTGG TTGGGATGTG GCGGGCACAA TTGCTGCGGT TGGCTCAAAT 
GTTAGCCAAT GGAAGCTTGG CGATGAAGTC TATGGCATGG TCAATTTTCC CACTCCTAGC 
GGTGCCTATG CTGAATATGT GGTAGCTCCA GCGCTTGAAG TTGCTGCCAA ACCCAAAAGC 
CTGAGCTTTG CAGAAGCCGC AGCTGTGCCG TTGGTAGCCT TGACTGCTTG GCAGGCCTTT 
GATCTGGTTG GTTTGCAGGC TGGCGATCGC GTGCTGGTGC ATGCAGCGGC TGGCGGCGTT 
GGTCATGTGG CGGTGCAATT GGCTAAATTA CGCGGCGCTC ATGTGATTGC AACGGCCTCG 
GCGCGGAATG AAGGCTTTGT GCGCGAATTG GGCGTTGATC AATTTGTTGA TTACACTGCT 
GCGCCGTTTG AGCAACAAAT CGAACCAGTT GATGTTGTGT TTGATACCGT TGGCGGCGAA 
GTCCAAGCGC GTTCGTATGC GGTGTTAAAA CCTCAAGCTG GATTGGTAAC GATTGTTGGT 
TCACCGCCCG CCGATTTGGC CGCAGCCCAT GCTGGCAAAA GCTTGAACCA TCTTGTTCAG 
GCCAATCAAG CCCAATTAAC CGAGATTGCC AACTTGATCG ATAGCCAAAA ATTGCGGGTG 
GAAGTCGAAC AAGTCTACGA TTTCACGGCC ATGGCAGCGG CCCACGAACG CATGCAAAGT 
AGTCGGGTAC GCGGCAAAAT TGTGGTCAAA GTGAGCTAA

Protein sequence

MTTMQAIQIN RYGGVDELVQ AEIARPEPTA DQVLIKVHAI GINPVDYKVR SGMIAFFDEQ 
AFPVALGWDV AGTIAAVGSN VSQWKLGDEV YGMVNFPTPS GAYAEYVVAP ALEVAAKPKS 
LSFAEAAAVP LVALTAWQAF DLVGLQAGDR VLVHAAAGGV GHVAVQLAKL RGAHVIATAS 
ARNEGFVREL GVDQFVDYTA APFEQQIEPV DVVFDTVGGE VQARSYAVLK PQAGLVTIVG 
SPPADLAAAH AGKSLNHLVQ ANQAQLTEIA NLIDSQKLRV EVEQVYDFTA MAAAHERMQS 
SRVRGKIVVK VS