Gene Hhal_1051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1051
Symbol
ID	4709807
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	1136276
End bp	1137325
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	69%
IMG OID	639855522
Product	delta-aminolevulinic acid dehydratase
Protein accession	YP_001002629
Protein GI	121997842
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0113] Delta-aminolevulinic acid dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00488786
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGGCGG TCGTGACACG GAGCTCCCAA CCGCAGTTCA ATGGCGGCTA CCCCTTACGG 
CGCCCTCGCC GGATGCGCCG CGACGCCTTC TCCCGCCGGC TCATGCGGGA GACCCGACTC 
GGCCCAGAGG ACCTGATCCA GCCGGTCTTC GTCCTCGACG GTGAGGACCG CACCGAGCCG 
GTGCCCTCCA TGCCCGGTGT CGAGCGCATG ACCATCGATC GGTTGGTTCA CGAGGCCCGG 
GAACTGCACG CACTTGGTAT CCCGCTGATC GCCATCTTCC CGGTCACCCC GGCCGAGGTG 
AAGAGCGAGG ATGCGCGGGA GGCCTACAAC CCGAGCGGCA TCGCCCAGCG CGCCGTGCGC 
GCGGTCAAGG ACGCGGTCCC CGAGATGGGC GTCATGACCG ACGTCGCCCT GGACCCGTTC 
ACCAGCCACG GGCAGGACGG TCTCATCGAC GAGACCGGGT ACGTCATGAA CGAGGAGACC 
GTCGAGGTCT TGGTCCGCCA GGCGCTGTCC CACGCCGAGG CCGGTGCCGA CGTGGTCGGC 
CCGTCGGACA TGATGGACGG CCGCATAGGC GCCATCCGCA GCGCGCTGGA GTCCCACGAC 
CACCGCAACG TGCGCATCCT CTCCTACGCG GCCAAGTACG CCTCCTGCTA CTACGGTCCG 
TTCCGCGATG CGGTGGGGTC GTCCGACAAC CTCGGCAGCG GCGTGGCCGG CCCCGGCAAG 
GACAGTTACC AGATGGACCC GGGCAACAGC GACGAAGCCC TGCACGAGGT AGCCCTCGAC 
CTGCAGGAAG GGGCCGATAT GTTCATGGTC AAGCCGGGCC TGCCCTACCT GGACGTGATC 
CGGCGGATCA AGGACGAATT CGGCGTCCCG ACCTTCGCCT ACCAGGTCAG CGGCGAGTAC 
TCCATGCTGA AGGCCGCCGC CCAGAACGGC TGGCTCGACG AGCGCGAATG CGTCCTCGAG 
GCGCTGATGT CGCTGCGCCG TGCCGGTGCC GACGGCATCC TGACCTACCA CGCGCGGGCG 
GCGGCCGAGT GGCTCCGGGA AGAGGGCTGA

Protein sequence

MEAVVTRSSQ PQFNGGYPLR RPRRMRRDAF SRRLMRETRL GPEDLIQPVF VLDGEDRTEP 
VPSMPGVERM TIDRLVHEAR ELHALGIPLI AIFPVTPAEV KSEDAREAYN PSGIAQRAVR 
AVKDAVPEMG VMTDVALDPF TSHGQDGLID ETGYVMNEET VEVLVRQALS HAEAGADVVG 
PSDMMDGRIG AIRSALESHD HRNVRILSYA AKYASCYYGP FRDAVGSSDN LGSGVAGPGK 
DSYQMDPGNS DEALHEVALD LQEGADMFMV KPGLPYLDVI RRIKDEFGVP TFAYQVSGEY 
SMLKAAAQNG WLDERECVLE ALMSLRRAGA DGILTYHARA AAEWLREEG