Gene Hhal_1058 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1058
Symbol
ID	4709824
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	1146729
End bp	1147823
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	69%
IMG OID	639855529
Product	uroporphyrinogen decarboxylase
Protein accession	YP_001002636
Protein GI	121997849
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID	[TIGR01463] methyltransferase, MtaA/CmuA family [TIGR01464] uroporphyrinogen decarboxylase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCAGCT CTGAGCTCAA GAACGATCGA ATCCTGCGCG CTTTCCAGCG CCAGCCCGTG 
GACCGGACCC CGGTCTGGAT GATGCGCCAG GCCGGCCGCT ATCTGGCCGA ATATCGAGAG 
GTGCGGGCCC AGGCCGGCAG CTTCATGGGC CTGTGCCGCA GCCCCGAGCT GGCGGCCCGG 
GTGACCATGC AGCCGCTGGA GCGCTACGAG CTCGACGCCG CCATTCTCTT CTCGGACATC 
CTCACCATCC CCGAGGCCAT GGGGCTCGGC CTGAACTTCG TCACCGGCGA GGGGCCGGTC 
TTCGAGCACC GGGTCAAGAC CGCCGCCGAC ATCGACCGGC TGCCCCAGCC CTCGGCCCAG 
AAAGAGCTGC GCTACGTCAT GGATGCGGTG GCAGCCTGCC GCAAGGAGCT GAACGGACAG 
GTGCCGCTGA TCGGCTTCAC CGGCAGCCCG TGGACCCTGG CCACTTACAT GATCGAAGGC 
GGCTCGAGCA AGACCTTCGC CGCCAGCAAG AGTCTGCTCT TCAACGAGCC GGAGGCCGCG 
CACCGGCTGA TGGCCAAGCT CGCCGACACC GTGGCCGACT ACCTCAACGG CCAGGTAGAG 
GCTGGCGCGC AGGCGCTGAT GATCTTTGAC ACCTGGGGCG GGGCCCTGGA TCCGGTGCGT 
TACCGGGAGT TCTCGCTGGC CTATATGCAG CGCATCCTCG AGCAACTCCC CCGCGAGCGC 
GAGGGGCGTC GTATCCCGGT CACCCTGTTC ACCAAGGGCG GCGGCCAGTG GCTGGAGGAT 
ATCGCCGACA CCGGCTGTGA CGGCGTCGGC CTCGACTGGA CGACCTCGCT GGCCGACGCC 
CGGCGCCGGA TCGGCGGCCG GGTGGCCCTG CAGGGGAACC TCGATCCGTG CATGCTCCAC 
GCCAACCCCG AGGTCATCCG CCGCGAGGTG GCCCGCTGCC TGGAAGAGTT CGGCCACGGT 
CCGGGCCACG TGTTCAACCT TGGCCACGGC ATCCAGCCGG AGACGCCGCC GGAGAATGTC 
GATGCCATGA TCCGGGCCCT CCACGAACTC TCGCCGGCCT ACCATGACGC AACGGCCACC 
TCGGCCACGT CGTAG

Protein sequence

MSSSELKNDR ILRAFQRQPV DRTPVWMMRQ AGRYLAEYRE VRAQAGSFMG LCRSPELAAR 
VTMQPLERYE LDAAILFSDI LTIPEAMGLG LNFVTGEGPV FEHRVKTAAD IDRLPQPSAQ 
KELRYVMDAV AACRKELNGQ VPLIGFTGSP WTLATYMIEG GSSKTFAASK SLLFNEPEAA 
HRLMAKLADT VADYLNGQVE AGAQALMIFD TWGGALDPVR YREFSLAYMQ RILEQLPRER 
EGRRIPVTLF TKGGGQWLED IADTGCDGVG LDWTTSLADA RRRIGGRVAL QGNLDPCMLH 
ANPEVIRREV ARCLEEFGHG PGHVFNLGHG IQPETPPENV DAMIRALHEL SPAYHDATAT 
SATS