Gene Cpha266_0174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_0174
Symbol	hemE
ID	4568471
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	198999
End bp	200054
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	49%
IMG OID	639764774
Product	uroporphyrinogen decarboxylase
Protein accession	YP_910665
Protein GI	119356021
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID	[TIGR01464] uroporphyrinogen decarboxylase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCAAAA ATGATCTCTT CCTCCGGGCG TTAAAAAGAC AGCCTTGCTC ACGAACACCA 
ATCTGGGTGA TGCGGCAGGC TGGCCGTTAC TTGCCGGAAT ATCGTGCCGT AAGAGAAAAA 
ACAGACTTTT TAACCTTGTG CAAAACCCCG GAACTGGCAG CAGAAGTAAC CATTCAGCCG 
GTTGACTTAA TGGGTGTCGA TGCAGCCATT ATTTTCTCGG ATATCCTTGT CGTCAACGAA 
GCCATGGGAA TGGACGTCGA AATCATCGAA TCCAAAGGCA TACGGCTCTC ACCTGCTATC 
CGCTCGCAGG TCGACATTGA TCGGCTTATC ATCCCTGACA TCAATGAAAA GCTCGGGTAT 
GTGATGGATG CCATCCGCCT GACAAAAAAA GAGCTTGACA ACAGAGTCCC GCTTATCGGA 
TTTTCCGGTG CAGCATGGAC GCTCTTCACC TATGCCGTCG AAGGTGGTGG GTCAAAGAAC 
TACGCCTTTG CCAAAAAGAT GATGTATCGT GAGCCGAAAA TGGCCCATAT GCTCCTCAGC 
AAAATTTCCA GCGTCATCAC CGAATATGTC CTGATGCAGA TCGAAGCCGG TGCAGATGCA 
ATCCAGATAT TCGATTCATG GGCAAGCGCA CTTTCAGAAG ACGACTATCG CGAATTTGCC 
CTTCCCTATA TCAAGGAAAA CGTTCAGGCA ATCAAGACAA AATATCCCGA CACTCCGGTA 
ATTGTCTTCT CGAAAGACTG TAACACCATT CTCTCCGAAA TTGCCGATAC CGGCTGCGAT 
GCCATGGGCC TTGGATGGAA CATGGATATT GCCAAAGCGC GCAAAGAACT GAACGACAGA 
GTCTGCATTC AGGGCAATAT GGATCCGACA GTACTGTACG GCACTCCGGA TAAAATCCGC 
TCGGAAGCAG CCAAAATACT CAAGCAGTTT GGCCAGCATA CAGCGACATC AGGCCATGTG 
TTCAACCTCG GACACGGCAT TCTTCCGGAT GTCGATCCTG CAAACCTGAA ACTCCTTGTG 
GAATTTGTCA AGGAAGAAAG TGTCAAGTAC CACTAA

Protein sequence

MLKNDLFLRA LKRQPCSRTP IWVMRQAGRY LPEYRAVREK TDFLTLCKTP ELAAEVTIQP 
VDLMGVDAAI IFSDILVVNE AMGMDVEIIE SKGIRLSPAI RSQVDIDRLI IPDINEKLGY 
VMDAIRLTKK ELDNRVPLIG FSGAAWTLFT YAVEGGGSKN YAFAKKMMYR EPKMAHMLLS 
KISSVITEYV LMQIEAGADA IQIFDSWASA LSEDDYREFA LPYIKENVQA IKTKYPDTPV 
IVFSKDCNTI LSEIADTGCD AMGLGWNMDI AKARKELNDR VCIQGNMDPT VLYGTPDKIR 
SEAAKILKQF GQHTATSGHV FNLGHGILPD VDPANLKLLV EFVKEESVKY H