Gene Clim_2341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2341
Symbol	hemE
ID	6355687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2570962
End bp	2572017
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	51%
IMG OID	642669933
Product	uroporphyrinogen decarboxylase
Protein accession	YP_001944343
Protein GI	189347814
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID	[TIGR01464] uroporphyrinogen decarboxylase

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCAAAA ATGATCTATT TCTCCGGGCA TTGAAGCGTC AGCCCTGTTC CAGGACGCCT 
ATCTGGGTGA TGAGACAGGC CGGCCGCTAT CTTCCGGAGT ATCGGGCAGT CAGAGAAAAA 
ACTGACTTTT TAACCCTTTG CAAAACGCCT GAACTGGCCG CCGAGGTAAC CATTCAGCCT 
GTTGATCTGA TGGGTGTCGA TGCCGCGATC ATCTTTTCCG ACATTCTTGT GATCAATGAA 
GCCATGGGAA TGAACGTCGA GATTATCGAG ACAAAAGGAA TCAAGCTTTC TCCTGTCATC 
CGCAGCAAGG CAGATATCGA CAAGCTCATC GTGCCCGATA TCGATGAGAA GCTCGGCTAT 
GTTATGGATG CCCTGCGTCT TACCAAGAAA GAACTCGACA ATCGCGTTCC GCTTATCGGT 
TTTTCCGGTG CCGCATGGAC GCTCTTTACC TATGCAGTGG AAGGCGGCGG CTCGAAGAAC 
TACGCTTTTG CCAAGAAAAT GATGTACCGT GAGCCGCAGA TGGCCCATCT TCTGCTCGGC 
AAGATTTCCG AAACCATCAG CGCCTATCTG CTCAAGCAGG TCGAGGCCGG TGCCGACGCA 
ATCCAGATTT TCGATTCATG GGCAAGCGCT CTCTCCGAGG ACGATTATCG TGAATTCGCT 
CTTCCTTACA TCAAGCAGAA TGTTCAGGCT GTCAAGGCGA AGTATCCAGA CATTCCCGTT 
ATCGTATTTT CGAAAGACTG CAACACCATT CTTTCCGATA TTGCTGATAC CGGCTGCGAT 
GCCATGGGTC TTGGATGGGG CATAGATATC GCAAAAGCCC GTGCCGAGCT CAAGGACCGA 
GTCGCCCTGC AGGGTAATCT CGATCCGACA GTGCTCTACG GCACCCCTGA AAAGATCAAG 
TCGGAAGCAG CAAAAGTCCT GAAACAGTTC GGTCAGCACA CCGAAAGCTC AGGTCATGTT 
TTCAACCTCG GACATGGTAT TCTTCCCGAT GTCGATCCGG CAAACCTGAA GCTTCTTGTC 
GAATTCGTCA AGGAAGAGAG CGCCAGGTAC CACTGA

Protein sequence

MLKNDLFLRA LKRQPCSRTP IWVMRQAGRY LPEYRAVREK TDFLTLCKTP ELAAEVTIQP 
VDLMGVDAAI IFSDILVINE AMGMNVEIIE TKGIKLSPVI RSKADIDKLI VPDIDEKLGY 
VMDALRLTKK ELDNRVPLIG FSGAAWTLFT YAVEGGGSKN YAFAKKMMYR EPQMAHLLLG 
KISETISAYL LKQVEAGADA IQIFDSWASA LSEDDYREFA LPYIKQNVQA VKAKYPDIPV 
IVFSKDCNTI LSDIADTGCD AMGLGWGIDI AKARAELKDR VALQGNLDPT VLYGTPEKIK 
SEAAKVLKQF GQHTESSGHV FNLGHGILPD VDPANLKLLV EFVKEESARY H