Gene PCC8801_2998 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_2998
Symbol	hemE
ID	7104490
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	3104861
End bp	3105925
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	47%
IMG OID	643476027
Product	uroporphyrinogen decarboxylase
Protein accession	YP_002373141
Protein GI	218247770
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID	[TIGR01464] uroporphyrinogen decarboxylase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTCAAG GTAATAATAC CCCCTATTTA CTCCGTGCTG CACGGGGAGA GATATTAGAC 
AGACCCCCCG TGTGGATGAT GCGACAAGCG GGGCGTTATA TGAAGGTTTA TCGAGATTTA 
CGCGACAAAT ACCCCAGTTT TCGGGATAGA TCGGAGAATG CAGACTTAGC CATCGAAATT 
TCCCTACAAC CCTGGAAAGC ATTCCGACCC GATGGGGTGA TCATGTTCTC TGATATTCTA 
ACCCCTCTCC CTGGCATTGG CATTTCCTTT GAAATTCCTG AAAGCAAGGG TCCGATGATT 
GATTCTCCTA TTCGTACCCA GGAACAGGTC GATAATCTCC ATTCTCTCGA CCCTGAAGCG 
TCTTTACCCT TCATAAAGAC TATTTTAAAG GCTTTACGCG ACGAAGTGAA GAACGAAGCT 
ACGGTTTTAG GGTTTGTCGG TTCTCCTTGG ACTCTTGCAG CTTATGCTAT TGAGGGGAAA 
AGTTCCAAAG ATTATGCCAA CATTAAACGG ATGGCTTTCT CTGAACCAGC CATTTTACAC 
CAGTTTTTGA GTAAATTAGC CGATGCGATC GCGGTTTATG TTCGCTATCA GATCGATTGT 
GGTGCTCAAG TAGTGCAATT GTTCGACTCT TGGGCGGGTC AATTGAGTCC CCAAGATTAC 
AAAGTGTTTG CACTTCCCTA CCAGCAACAG GTCGTCCGTC AGGTGAAAGC AACCCATCCT 
GATACCCCGC TTATTCTCTA TATTAGCGGC AGTGCCGGGG TTTTGGAACT GATGGGTCAG 
TCGGGGGTAG ACATCGTTAG CGTTGACTGG ACGGTGGATA TGGCTGACGC TAGACAACGG 
TTAGGACGTA ATATGATGGT ACAGGGGAAT ATCGATCCAG GTATCTTATT TGGGTCAAAA 
CAGGTAATCC GCGATCGCAT TTTAGACACA GTTCAAAAAG CGGGTAAAGG TGGCCATATC 
TTGAATTTAG GTCATGGTGT CTTGGTGGGA ACTCCTGAAG AGAATGTTGG TTACTTCTTT 
GAAACGGCTA AGCAGGTTGA TCAATTACTC GCGGTTCCCG TTTAG

Protein sequence

MTQGNNTPYL LRAARGEILD RPPVWMMRQA GRYMKVYRDL RDKYPSFRDR SENADLAIEI 
SLQPWKAFRP DGVIMFSDIL TPLPGIGISF EIPESKGPMI DSPIRTQEQV DNLHSLDPEA 
SLPFIKTILK ALRDEVKNEA TVLGFVGSPW TLAAYAIEGK SSKDYANIKR MAFSEPAILH 
QFLSKLADAI AVYVRYQIDC GAQVVQLFDS WAGQLSPQDY KVFALPYQQQ VVRQVKATHP 
DTPLILYISG SAGVLELMGQ SGVDIVSVDW TVDMADARQR LGRNMMVQGN IDPGILFGSK 
QVIRDRILDT VQKAGKGGHI LNLGHGVLVG TPEENVGYFF ETAKQVDQLL AVPV