Gene Sala_2843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2843
Symbol	hemE
ID	4080636
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	2995278
End bp	2996306
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	67%
IMG OID	638011227
Product	uroporphyrinogen decarboxylase
Protein accession	YP_617881
Protein GI	103488320
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID	[TIGR01464] uroporphyrinogen decarboxylase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0629975
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGGCGT CACCGAAGAA GCTGCTCGCG ACGTTGCGCG GAGCGCGGCA CGAGCGAACG 
CCGCTCTGGC TGATGCGCCA GGCCGGGCGC TATCTTCCCG AATATCGCGC CCTTCGCGAG 
AGCAAGGGCG GATTCCTCGA GCTGTGCTAC GATCCCGAAG CCGCCGCCGA AGTCACGTTG 
CAGCCGATCC GCCGCTTCGG TTTCGACGGC GCGATCCTTT TCTCCGACAT TCTCGTCATC 
CCGCACGCGC TCGGCCAGCA TCTGTGGTTC GAGGCGGGCG AAGGTCCGCG GCTTGCGCCG 
CCGCTCGTCG ATGGCGCCTT GGCGTCACTC GAAGCCGCGC CGCAGCGCCT CGATCCCGTC 
TATGCGACGG TCGCGCGCGT CGCAGCCTCG CTGCCGCCCG AAACGACCTT TCTCGGCTTT 
GCGGGCAGCC CGTGGACCGT CGCGACCTAT ATGGTCGCGG GACGGGGATC GAAGGATCAG 
GCGGCGGCGC GGCGGATGGC CTTCGCCGAC CCGGCCGCGT TCGGCGCCAT CATCGATGCG 
ATTGCCGATC TGACCGTGAC CTATTTGTCG GGCCAGATCG AACAGGGCGT CGACGCGGTG 
CAGCTTTTCG ACAGCTGGGC GGGCAGCCTC AGCCCCGCGC AGTTCGAACA ATGGGTGATC 
GCCCCCAATG CCGGAATCGT CCGCCGTCTG AAGGCGCTGC ACCCTGACAC GCCGGTGATC 
GGCTTTCCGA AGGGCGCGGG GGGCAAGCTT CGTGCCTATG CCGAAGAAAC CGGCGTCGAT 
GCGATCGGCC TCGACGAAAC GGTCGATCCG ACATGGGCCG ATGCCGCCTT GCCGTCACAG 
CTGCCCGTCC AGGGCAATCT CGACCCGCTC GCGCTCGTTG CGGGTGGTGC GGCGCTCGAT 
GCCGCGATCG ACCGCATCCT TGCGGCTTTT CCGTCGCGCC CCCATATCTT CAATCTGGGC 
CACGGGATCG TTCCCGACAC CCCGGTTGCC CATGTCGAAC ATCTCATCAA GCGCGTTCGC 
GGCGGATAA

Protein sequence

MKASPKKLLA TLRGARHERT PLWLMRQAGR YLPEYRALRE SKGGFLELCY DPEAAAEVTL 
QPIRRFGFDG AILFSDILVI PHALGQHLWF EAGEGPRLAP PLVDGALASL EAAPQRLDPV 
YATVARVAAS LPPETTFLGF AGSPWTVATY MVAGRGSKDQ AAARRMAFAD PAAFGAIIDA 
IADLTVTYLS GQIEQGVDAV QLFDSWAGSL SPAQFEQWVI APNAGIVRRL KALHPDTPVI 
GFPKGAGGKL RAYAEETGVD AIGLDETVDP TWADAALPSQ LPVQGNLDPL ALVAGGAALD 
AAIDRILAAF PSRPHIFNLG HGIVPDTPVA HVEHLIKRVR GG