Gene Haur_2608 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2608
Symbol
ID	5734486
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	3348248
End bp	3349243
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	51%
IMG OID	641279748
Product	aldo/keto reductase
Protein accession	YP_001545374
Protein GI	159899127
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000730826
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAAGC GCCAATTAGG CCGTGATGGT TTGGTGGTTT CGGCAGCAGG CTTAGGCTGT 
ATGGCAATGT CGGGGATGTA CGGGCCTTCG GATCGTGCCG AGAGTATTGC GACAATTCAT 
TCAGCGCTTG ATGCTGGAGT CAATTTGCTG GATACTGGCG ATTTCTATGG GATGGGCCAT 
AACGAACTGC TGATTAGTGA AGCCTTGCGT GAGCGTTCAC GCTCCGATGT TGTTTTGAGT 
GTCAAATTTG GGGCAATGCG AAGCCCTGAT GGTTCGTGGC TCGGCTACGA TGCTCGGCCA 
GCTGCGGTTA AAAATTTCTT ATACCACAGC CTTACACGCT TGAACACCGA TTACATTGAT 
ATTTATCGAC CTTCGCGGCT TGACCCGAAT GTACCGATTG AAGAAACAAT TGGGGCGATT 
GCCGAGATGG TCGAAAAAGG CTATGTGCGG CATATCGGTT TGTCGGAAGT TGGGGTTGAA 
ACGATTCGAC GAGCAGCAGC GGTGCATCCA ATTGTCGATT TGCAAATTGA ATATTCCTTG 
ATGTCGCGTG GTATCGAGGC CGAAATTTTG CCTGCTTGTC GCGAATTGGG CATCGGCATC 
ACCGCCTATG GAGTGCTTTC GCGTGGCTTG CTAAGCGGTG CTTGGTCGAA AGAACGGGTT 
TTGGCTGGCT CAGATTTTCG TTCCCATGGC CCGCGCTTTA CTGGCGAGAA TCTTGATCAT 
AATTTAGAAC TGGTTGCAGC CTTGCAAACA ATTGCCGAAG CCAAGGGTGC AAGTATTGCC 
CAAATTGCCA GCGCATGGGT AGTGGCGCAA GGAGCCGATA TTATTCCATT GTTCGGGGCA 
CGCCGCCTAC ATCAATTGCA CGATTCATTG ACCAGCCTTG ACATTAACTT GAATGCTGAT 
GAATTAGGCA TAATTGAGCG GGCGATTCCC AAAGGTGCGG CGGCGGGCGA ACGCTACAAT 
GCCTATCTGA TGCAACATTT GGATAGCGAA CGCTAA

Protein sequence

MQKRQLGRDG LVVSAAGLGC MAMSGMYGPS DRAESIATIH SALDAGVNLL DTGDFYGMGH 
NELLISEALR ERSRSDVVLS VKFGAMRSPD GSWLGYDARP AAVKNFLYHS LTRLNTDYID 
IYRPSRLDPN VPIEETIGAI AEMVEKGYVR HIGLSEVGVE TIRRAAAVHP IVDLQIEYSL 
MSRGIEAEIL PACRELGIGI TAYGVLSRGL LSGAWSKERV LAGSDFRSHG PRFTGENLDH 
NLELVAALQT IAEAKGASIA QIASAWVVAQ GADIIPLFGA RRLHQLHDSL TSLDINLNAD 
ELGIIERAIP KGAAAGERYN AYLMQHLDSE R