Gene Acid345_4300 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4300
Symbol
ID	4071873
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	5111600
End bp	5112631
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	59%
IMG OID	637986333
Product	delta-aminolevulinic acid dehydratase
Protein accession	YP_593374
Protein GI	94971326
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0113] Delta-aminolevulinic acid dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTTTC CCATCAGCCG TCCCCGTCGC CTCCGCAAGA ATGAAGCTTT CCGTTCGCTG 
GTTCGCGAGA CCCGCCTATC GCCGGCCGGG TTCGTTTACC CGCTATTCGT GTGCCCGGGT 
GAGGGCGTGC GCAAAGAAGT CCGCTCCATG CCGGGAGTCT TCAATCTGTC GGTAGACGAG 
GCAGTGAAGG AAGCACAAGA GGTCAAATCG CTCGGCATTC CGTCGGTCAT TTTGTTCGGA 
CTTCCGGAGA GCAAGGACGA GCAGGCAACC GGCGCATGGG CTGAAGATGG CATCGTGCAG 
CAGGCGGCGC GTGTAATTAA GCGCGAAGTG CCAGGCTTGC TGCTGATGGG CGACGTTTGT 
CTCTGCGAAT ACATGTCGCA CGGGCATTGC GGTATTGTGC AGAAGACCGC CACCAACCGC 
TCCGTCGGCG CGGCGTCCAC TGCGCAGATG AGCGGCGTGG ATGAATACGA AATTCTTAAC 
GACGAATCAC TCGATATCCT GGCCAAGACC GCCGTCTCGC AGGCTCGCGC GGGCATGGAT 
ATCATTGCCC CCAGCGACAT GATGGACGGC CGGGTCGCCG CCATTCGCGA CGCTCTCGAC 
GATGAAGGCT TCGAGAACAT CCCGATCTTG GCCTATGCGG CGAAGTTTGC TTCCGGCTTC 
TACGGGCCAT TCCGAGAAGC CGCGGACTCA GCCCCTGCCT TCGGCGATCG CCGCTCTTAC 
CAAATGGATG GCGCTAACCT CCGCGAAGCC ATGATCGAAA TCGAACTCGA CCTTGAAGAG 
GGCGCAGACA TGATTATGGT GAAGCCGGCG ATGCCCTATC TTGACGTCAT CTCGGAAGCG 
CGCCGACGTT ACGACGTGCC GCTCGCCGCT TACCAGGTCA GCGGCGAATA CGCCATGATC 
AAGGCCGCCG CGCAGAACAA CTGGATCGAT CACGATCGCG TAATGCTGGA ATCGTTGCAA 
AGCATTCAGC GCGCCGGGGC GTCGATCATC TTGACTTACT TTGCGAAAGA TGTGGCGAAG 
ATCCTCGGTT AG

Protein sequence

MSFPISRPRR LRKNEAFRSL VRETRLSPAG FVYPLFVCPG EGVRKEVRSM PGVFNLSVDE 
AVKEAQEVKS LGIPSVILFG LPESKDEQAT GAWAEDGIVQ QAARVIKREV PGLLLMGDVC 
LCEYMSHGHC GIVQKTATNR SVGAASTAQM SGVDEYEILN DESLDILAKT AVSQARAGMD 
IIAPSDMMDG RVAAIRDALD DEGFENIPIL AYAAKFASGF YGPFREAADS APAFGDRRSY 
QMDGANLREA MIEIELDLEE GADMIMVKPA MPYLDVISEA RRRYDVPLAA YQVSGEYAMI 
KAAAQNNWID HDRVMLESLQ SIQRAGASII LTYFAKDVAK ILG