Gene Caul_3049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3049
Symbol
ID	5900504
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3312252
End bp	3313478
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	67%
IMG OID	641563551
Product	5-aminolevulinate synthase
Protein accession	YP_001684674
Protein GI	167647011
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0156] 7-keto-8-aminopelargonate synthetase and related enzymes
TIGRFAM ID	[TIGR00858] 8-amino-7-oxononanoate synthase [TIGR01821] 5-aminolevulinic acid synthase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.192624
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTACA AAGCCGCGTT CCGTAACACC GTGGATCAGA TCCGCGACGA AGGCCGCTAT 
CGGGTGTTCG CCGACGTGAA GCGCCATCGC GGCGCGTTCC CGCGCGCCAC CTGGACCCGC 
CCGGACGGCG GCGAAAGCGA GATCGTGGTC TGGTGCTCCA ACGACTATCT GGGCCAGGGG 
CAGAACCCCC TGGTGCTGGA CGCCATGCAC GCGGCGATCG ACCAGCACGG TTCGGGCTCG 
GGCGGCACGC GCAACATCTC GGGCACCAAC CACCACCATG TCGAGCTGGA GGCCGAGCTG 
GCCGACCTGC ACGGCAAGGA AGCGGCCCTG CTGTTCACCT CGGGCTACGT CTCCAACGAG 
GCCAGCCTGT CGGCCCTGCA GAAGATCCTC CCCGGCCTGA TCATCTTCTC CGACGCCCAG 
AACCACGCCT CGATGATCGC CGGCATCCGC AACGGCGGCT GCCAGCGCCA TGTGTTCCGC 
CACAACGACC TGGCCCATCT TGAAGAGCTG CTGATCGCCG CCCCGGCCGA CGCGCCCAAG 
CTGATCGCCT TTGAGAGCGT CTATTCGATG GACGGCGACA TCGCCGACCT GGCCGGCACC 
GTGGCCCTGG CCAAGAAATA CGGCGCCATG ACCTATCTCG ACGAGGTCCA TGCCGTGGGC 
ATGTACGGTC CGCGCGGCGG CGGCGTCGCC GAGCGCGACC GCCTGATGGA CCAGATCGAC 
ATCATCGAAG GCACCCTGGG CAAGGCCTTC GGCGTGATGG GCGGCTACAT CACCGGCGAC 
GCCGTGGTGG TCGACGCCAT CCGTCTGATG GCTTCGGGCT TCATCTTCAC GACATCCCTG 
CCGCCGGCGT TGACCGCCGG CGCCTTGGCC AGCGTGAAAT ATCTCAAGCA CCACCCGGAA 
GTCCGCGAAG CCCATCAGGA GCGCGCCCAG ACCCTGAAGG CGATGTTCAA GGCCGCCGGC 
CTGCCGGTGA TGGAGAACGA CAGCCACATC GTGCCGGTGC TGGTCGGCGA TCCCGTCCAC 
TGCAAGCTGA TCAGCGACAT GCTGCTGGCC GACCACGGCG TCTATGTGCA GCCGATCAAC 
TACCCGACCG TGCCGCGCGG CACCGAGCGC CTGCGCTTCA CCCCGACGCC GTTCCACACC 
GACGACATGA TGCGCAAGCT GGTCGGGGCG ATGGAAACCC TGTGGGCGCA CTGCAACGTG 
GCCCGCATGG GCGGCTACGC GGCTTAA

Protein sequence

MDYKAAFRNT VDQIRDEGRY RVFADVKRHR GAFPRATWTR PDGGESEIVV WCSNDYLGQG 
QNPLVLDAMH AAIDQHGSGS GGTRNISGTN HHHVELEAEL ADLHGKEAAL LFTSGYVSNE 
ASLSALQKIL PGLIIFSDAQ NHASMIAGIR NGGCQRHVFR HNDLAHLEEL LIAAPADAPK 
LIAFESVYSM DGDIADLAGT VALAKKYGAM TYLDEVHAVG MYGPRGGGVA ERDRLMDQID 
IIEGTLGKAF GVMGGYITGD AVVVDAIRLM ASGFIFTTSL PPALTAGALA SVKYLKHHPE 
VREAHQERAQ TLKAMFKAAG LPVMENDSHI VPVLVGDPVH CKLISDMLLA DHGVYVQPIN 
YPTVPRGTER LRFTPTPFHT DDMMRKLVGA METLWAHCNV ARMGGYAA