Gene Hhal_2284 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_2284
Symbol
ID	4709118
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	2507513
End bp	2508553
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	70%
IMG OID	639856760
Product	aldo/keto reductase
Protein accession	YP_001003850
Protein GI	121999063
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATACC GCCCACTCGG TCACAGCGAG CTACGCGTCA GCGCCATCTG TCTGGGCACC 
ATGACCTGGG GCGAACAGAA CAGTGAGGCC GAGGCCCACG CCCAGCTCGA CCTCGCCGCC 
GAGCACGGGG TGAACTTCAT CGATGCGGCG GAGATGTATC CCGTGCCGCC CCGGGCCGAG 
ACCGCCGGGC GCACCGAGGC GTACCTGGGC AACTGGCTGG CCCGCCAGCC ACGCCGCGAG 
GATCTGGTCA TCGCCACCAA GATCGCCGGC CCCGGGCTGG ACTCGATCCG CGACGGCCAG 
CGCGCCTACA CCCCCGAGCA GCTCCGCGAG GCGGTGGACG GCTCATTGCA GCGGCTGCGG 
ACCGACTACA TCGACCTCTA CCAGCTGCAC TGGCCGGAGC GCCCCGCCAA TTACTTCGGG 
CGACTCGACT ACCCCTGCCC CGAGGACGAC GGGCGGGAGC ATGAGCGCAT CCGGCGCGCC 
CTGGAGGGGC TGGCCGAGCT GGTCGACGCT GGCAAGATCC GCCACATCGG ATTGTCCAAC 
GAGACGCCCT GGGGCGCCAT GCGCTTCATC GCCGAGGCCG AGCGCCTCGG TCTGCCGCGC 
ATCGTCTCCA TCCAGAACCC GTACAACCTG CTCAACCGCA GCTACGAGGT CGGACTCGCC 
GAGGTCAGCC ACCGCGAGGG CTGCGGCTTG CTGGCCTACT CGCCCCTCGG CTTCGGCGTG 
CTCAGCGGCA AGTACCTGGA TGGTCAACGC CCGGCCGAGG CCCGCCTGAC CCTCTTCGAG 
CGCTTCCAGC GCTACACCGG CGAACGGGGC GTGACCGCCA CCCGGGCCTA CGTCGACCTC 
GCCCGGAAGC ACGGCCTCGA CCCGGCACAG ATGGCCATCG CCTTCGCCAC CCAGCGGCCC 
TTCTGCACCA GCACGATCAT CGGCGCCACG ACCACCGAGC AGCTGCGCAC CAATATGGAG 
GCCGGGGCGC TGGCCCTAGA TGGGGCACTC CTGCAGGAGA TCGACACCCT CCACCAGGCC 
AACCCCAACC CCTGCCCATG A

Protein sequence

MEYRPLGHSE LRVSAICLGT MTWGEQNSEA EAHAQLDLAA EHGVNFIDAA EMYPVPPRAE 
TAGRTEAYLG NWLARQPRRE DLVIATKIAG PGLDSIRDGQ RAYTPEQLRE AVDGSLQRLR 
TDYIDLYQLH WPERPANYFG RLDYPCPEDD GREHERIRRA LEGLAELVDA GKIRHIGLSN 
ETPWGAMRFI AEAERLGLPR IVSIQNPYNL LNRSYEVGLA EVSHREGCGL LAYSPLGFGV 
LSGKYLDGQR PAEARLTLFE RFQRYTGERG VTATRAYVDL ARKHGLDPAQ MAIAFATQRP 
FCTSTIIGAT TTEQLRTNME AGALALDGAL LQEIDTLHQA NPNPCP