Gene Caul_3351 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3351
Symbol
ID	5900806
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	3630190
End bp	3631995
Gene Length	1806 bp
Protein Length	601 aa
Translation table	11
GC content	67%
IMG OID	641563857
Product	acetolactate synthase 3 catalytic subunit
Protein accession	YP_001684976
Protein GI	167647313
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0028] Thiamine pyrophosphate-requiring enzymes [acetolactate synthase, pyruvate dehydrogenase (cytochrome), glyoxylate carboligase, phosphonopyruvate decarboxylase]
TIGRFAM ID	[TIGR00118] acetolactate synthase, large subunit, biosynthetic type

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCCC ACCAGACGAT CGAGAGCCAA GCTCCCGCCA CCACCGCGGA CCGCGCCATG 
ACCGGCGCCG AGATCGTGGT CCGCGGCCTC GTGGACCAGG GCGTCGAGGT GCTGTTCGGC 
TATCCGGGCG GTGCGGTCCT CCCGATCTAT GACGCGCTGT TCCACGAGCC GCGCCTGCGG 
CACGTCCTGG TCCGCCACGA GCAGGGCGCG ACCCACGCCG CCGAGGGCTA TGCGCGCAGC 
TCGGGCAAGC CAGGCGTCGT CCTGGTCACC TCGGGTCCGG GCGCGACCAA CGCCATCACC 
GGCATCATGG ACGCCCTGAT GGACTCGATC CCGATGGTCA TCATCACCGG CCAGGTCCCC 
ACCCACCTGA TCGGCACCGA CGCCTTCCAG GAGGCCGACA CCGTCGGCAT GACCCGCTCG 
TGCACCAAGC ACAATTACCT GGTCAAGGAC GTCCGCGACT TGCCGCAGAT CATCCATGAG 
GCCTTCAAGA TCGCCACTAC CGGCCGCCCC GGCCCGGTGC TGATCGACAT CCCCAAGGAC 
GTCCAGTTCG CCAAGGGCGA CTATTACGGC CCGACCGAGA TCGCCTCGAC CCACGCCTAC 
AACCCGCGCA TCAAGGGCGA CCAGAACCGT ATCGCCGAGG CCGCCAGGCT GATCGCCCAG 
GCTCGCCGGC CGATCTTTTA CACCGGCGGC GGCGTGATCA ACGCCGGCCC CAAGGCCAGT 
GAAGCCCTGC GCGCGTTCCA GGCCCTGACC GGCGCGCCGG TCACCTCGAC CCTGATGGGC 
CTGGGCGCCT TCCCGGCGGC CGATCCGGCC TGGCTGGGCA TGCTGGGCAT GCACGGCACG 
TTCGAGGCCA ACAATGCCAT GCATGACTGC GACGTGATGA TCTGCGTCGG GGCTCGCTTC 
GACGACCGGG TCACCGGCCG CCTGGACGCC TTCTCGCCCG GCAGCAAGAA GATCCACATC 
GATATCGACG CCTCGTCGAT CAACAAGAAC GTCCGCGTCG ATCTGCCGAT CATCGGCGAC 
GCCGGCAGCG TGCTGGAAGA CCTGATCGCC GCCTGGAAGG CCGCCGGCCA CCAGCCCAAC 
AAGGCCGCCC TGACCGACTG GTGGAGCCAG ATCGACGCCT GGCGCGCCCG CCAGTGCCTG 
AAATACCGGG GCTCGGACAC GGTCATCAAG CCGCAGTACG CCATCGAACG CCTGTACGCC 
CTGACCCAGG GCAAGGACGT CTACATCACC ACCGAGGTCG GCCAGCATCA GATGTGGGCC 
GCGCAGTTCT TCCGCTTCGA GGAGCCCAAT CGTTGGATGA CCTCCGGGGG CCTGGGGACC 
ATGGGCTACG GCCTGCCCGC CGCCATCGGC GTGCAGATGG CCCATCCGGG CAGCCTGGTC 
ATTGACATCG CTGGCGAAGC CTCGATCCAG ATGTGCATCC AGGAGCTGTC GACGGCGATC 
CAGTTCGGCC TGCCGGTCAA GATCTTCATC CTGAACAACG AATGGATGGG CATGGTCCGC 
CAGTGGCAGC AACTGCTGCA CGGCGAGCGC TACAGCCACT CCTATTCCGA CAGCCTGCCC 
GACTTCGTGA AACTGGCCGA AGCCTATGGC GCCGTGGGCA TCCGCTGCAG CGACCCGGCC 
GAGCTGGACG AGAAGATTCT GCAGATGATC AACAGCGACA AGGTCGTGGT CTTCGACTGC 
CGCGTCGAGA AGCACGAGAA CTGCCTGCCG ATGATCCCTT CGGGCAAGGC CCACAACGAG 
ATGATCATGG GCGACGTCGA GGACATCGGA AACGTCATCG GGGCGGCGGG GGCAGGGCTG 
GTCTAA

Protein sequence

MTAHQTIESQ APATTADRAM TGAEIVVRGL VDQGVEVLFG YPGGAVLPIY DALFHEPRLR 
HVLVRHEQGA THAAEGYARS SGKPGVVLVT SGPGATNAIT GIMDALMDSI PMVIITGQVP 
THLIGTDAFQ EADTVGMTRS CTKHNYLVKD VRDLPQIIHE AFKIATTGRP GPVLIDIPKD 
VQFAKGDYYG PTEIASTHAY NPRIKGDQNR IAEAARLIAQ ARRPIFYTGG GVINAGPKAS 
EALRAFQALT GAPVTSTLMG LGAFPAADPA WLGMLGMHGT FEANNAMHDC DVMICVGARF 
DDRVTGRLDA FSPGSKKIHI DIDASSINKN VRVDLPIIGD AGSVLEDLIA AWKAAGHQPN 
KAALTDWWSQ IDAWRARQCL KYRGSDTVIK PQYAIERLYA LTQGKDVYIT TEVGQHQMWA 
AQFFRFEEPN RWMTSGGLGT MGYGLPAAIG VQMAHPGSLV IDIAGEASIQ MCIQELSTAI 
QFGLPVKIFI LNNEWMGMVR QWQQLLHGER YSHSYSDSLP DFVKLAEAYG AVGIRCSDPA 
ELDEKILQMI NSDKVVVFDC RVEKHENCLP MIPSGKAHNE MIMGDVEDIG NVIGAAGAGL 
V