Gene Hhal_1445 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1445
Symbol
ID	4711373
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	1557237
End bp	1558187
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	67%
IMG OID	639855912
Product	5-carboxymethyl-2-hydroxymuconate delta-isomerase
Protein accession	YP_001003014
Protein GI	121998227
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCCCGA GTGCACCACC GTCGACGCAC GGCGCCATTT GCGGGACAAT GGCGATTGGC 
AGGCCCGATC GCAACCCCAC ACGCGGAAAC GGCACCATGC GCATCACCAC CGTCCGTCAT 
CAAGGCGTTT CCCGGATCGC CGTTCACGAG CAGGGCGACC GCTGGGCGGT ATCCCCCACT 
CCCGGGGATC TGGGTGAACA CCTATGCGCC GGCACCGTCC CCGAAGCCGG CTACGACTGG 
CCACGGGTCA CCGCCGAGGC CCTGACCTTC CTCGCGCCTC TGCCACACCC ACCGCGCAAT 
GTGATCTGCC TCGGGCTGAA CTACGCCGAC CACGCCCGGG AATCCCAGCA GGCCAAGGGC 
GATGAGCTCG CCCTGCCCGA AGCCCCGGTG GTCTTCACCA AGGCAACAAC CAGTGTCGCC 
GGTCCCTACG ACGATTTCAT CCTCGACCCG TCCGTCACCA GCGAGCTGGA CTGGGAGGTG 
GAGCTCGCGG TCGTCATAGG CCGGGGCGGA CGACACATCC GCGAACAGGA CGCCCTTCAG 
CACGTCTTCG GCTACACCGT CGTCAACGAC CTCTCCGCGC GGGACCTGCA GTTCCGACAC 
AAGCAGTTCT TCCTCGGCAA ATCGGTGGAC GGCAGCTGCC CGATGGGGCC CTGGATCACC 
ACCGCCAATG CGGTGCCGAA CCCCCACAAC CTCGCCCTCT CCTGCCGGAT CAACGACACC 
ACCGAGCAAC AGTCGCACAC CGGCGAGATG GTCTTCTCCA TCCCCAGGAT CATCGCCGAG 
CTGTCACGGG TCATGACCCT GATCCCGGGG GATATCATCG CCACCGGCAC CCCCGCCGGC 
GTCGGCTTTG CGCGCACGCC GCCCCGCTTC CTGCAGGCCG GCGATATCGT GACCTCCGAG 
GTCGAGGGAC TCGGTACGCT GCGTAATCGC ATTGTGGCAC CGGATTCGTG A

Protein sequence

MAPSAPPSTH GAICGTMAIG RPDRNPTRGN GTMRITTVRH QGVSRIAVHE QGDRWAVSPT 
PGDLGEHLCA GTVPEAGYDW PRVTAEALTF LAPLPHPPRN VICLGLNYAD HARESQQAKG 
DELALPEAPV VFTKATTSVA GPYDDFILDP SVTSELDWEV ELAVVIGRGG RHIREQDALQ 
HVFGYTVVND LSARDLQFRH KQFFLGKSVD GSCPMGPWIT TANAVPNPHN LALSCRINDT 
TEQQSHTGEM VFSIPRIIAE LSRVMTLIPG DIIATGTPAG VGFARTPPRF LQAGDIVTSE 
VEGLGTLRNR IVAPDS