Gene Caul_0213 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0213
Symbol
ID	5897487
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	227881
End bp	228933
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	70%
IMG OID	641560697
Product	3-isopropylmalate dehydrogenase
Protein accession	YP_001681848
Protein GI	167644185
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR00169] 3-isopropylmalate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.209682
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCACGC TTCTGCTCCT GCCCGGCGAC GGGATCGGCC CCGAGGTTTG CGGGGAGGTG 
CGCCGGGTGG CCGCCGCGCT CACGCCCGAC CTGATGATCG CCGAAGCCCT CTATGGCGGC 
GCCAGCTACG ATGTGCATGG CGCGCCCCTG ACCGACGACG TCCGCGACCA GGCCCTGGCC 
AGCGACGCGG TGCTGATGGG CGCTGTCGGC GGTCCCAAGT GGAAGGACGC CCCCCGCCAC 
CTGCGCCCCG AGGCGGGCCT GCTGCAGCTG CGCAAGGACA TGGACGTCTA CGCCAACCTG 
CGCCCGGCCT ACTGCTTCGA GGCCCTGGCC GACGCCTCCA GCCTCAAGCG CGAGCTGGTT 
TCGGGCCTGG ACATCATGTT CGTCCGTGAA CTGACAGGCG GGGTCTATTT CGGCCAGCCA 
CGCGGCATCG AGGATCTCGG CAACGGCCAG AAGCGCGGCG TCGACACCCA GGTCTACACC 
ACCGCCGAGA TCGAGCGCGT GGCCCGGGTG GCCTTCGAAC TGGCGCGCGG CCGGTCCAAT 
CGCGTCGCCT CGGCCGAGAA GTCGAATGTC ATGGAGTCGG GACTGCTATG GCGGGAGGTC 
GTCACCAACC TCCACGCCAA GGAATATGCC GACGTCCAGT TGGAGCACAT CCTGGCCGAC 
AACTGCGCCA TGCAGCTGGT CCGCGCGCCC AAGCAGTTCG ACGTGATCGT CACCGACAAC 
CTGTTTGGCG ACATCCTGTC GGACGCCGCG GCGATGCTGA CCGGCTCGCT GGGCATGCTG 
CCCTCAGCGG CGCTGGGCGC GGCGGGCAAG CCGGGCCTCT ATGAGCCGAT CCACGGCTCG 
GCCCCCGACA TCGCGGGCCA AGGCGTGGCC AATCCGCTGG CCGCCATCCT GTCGTTCGAG 
ATGGCCCTGC GCTGGTCGCT GAACCGCGCC GACGCGGCCG ACACCCTGTT GGCGGCGGTC 
AAGGCGGCGC TGGACGGCGG TGCGCGGACG CGTGACCTGG GCGGGTCGTT GTCGACCGCC 
GAGATGGGCG ATGCGGTGCT GAAGAGGCTC TAA

Protein sequence

MSTLLLLPGD GIGPEVCGEV RRVAAALTPD LMIAEALYGG ASYDVHGAPL TDDVRDQALA 
SDAVLMGAVG GPKWKDAPRH LRPEAGLLQL RKDMDVYANL RPAYCFEALA DASSLKRELV 
SGLDIMFVRE LTGGVYFGQP RGIEDLGNGQ KRGVDTQVYT TAEIERVARV AFELARGRSN 
RVASAEKSNV MESGLLWREV VTNLHAKEYA DVQLEHILAD NCAMQLVRAP KQFDVIVTDN 
LFGDILSDAA AMLTGSLGML PSAALGAAGK PGLYEPIHGS APDIAGQGVA NPLAAILSFE 
MALRWSLNRA DAADTLLAAV KAALDGGART RDLGGSLSTA EMGDAVLKRL