Gene Rmet_5039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmet_5039
Symbol
ID	4041901
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cupriavidus metallidurans CH34
Kingdom	Bacteria
Replicon accession	NC_007974
Strand	-
Start bp	1725278
End bp	1727113
Gene Length	1836 bp
Protein Length	611 aa
Translation table	11
GC content	66%
IMG OID	637980460
Product	acetolactate synthase large subunit
Protein accession	YP_587170
Protein GI	94313961
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0028] Thiamine pyrophosphate-requiring enzymes [acetolactate synthase, pyruvate dehydrogenase (cytochrome), glyoxylate carboligase, phosphonopyruvate decarboxylase]
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.818274
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.707988
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCTTGT CTGCACCCGG CATCGGCAAT TGCTGTCCGG ATTCTTGCAT ACGATTAAGT 
ATACTTAAAA GTATTCTTTC GAGTATGCTC CATCGGACGC CGGCGCTTCC TTCACCCGGC 
CGATCAATGG AGATCAAGCG GATGACCAAG ATGAACGGCG CCGAAGCGAT GGTGCGTATG 
CTCCAGCTCA ACGGTGTGAA GCACATTTTT GGCTTGTGTG GCGATACCAG CCTGCCTTTT 
TACGATGCTC TGGCCCGTCT GGACCATGGC ATGGACCACG TGCTGGCGCG CGACGAGCGC 
AGCGCCGCGT ACATGGCGGA CGCCTACGCC CGCGTCACGG GCAAGGTCGG CGTGTGTGAG 
GGTCCGAGTG GAGGAGGCGC CACATATCTG TTGCCGGGGC TGGTGGAGGC CAATGAATCG 
TCGGTGCCGG TGCTGGGCAT TACGTCCGAT GTATCCGTCA ACTCGCGCGG CAAATACCCC 
CTGACCGAGC TGGACCAGGA ATCCCTGTAT CGGCCACTGA CCAAGTGGAA CACCACGATC 
GACCGTGCCG ATCAGATTCC CGACGCCGTG CGCGCTGCCT TCCGCGCCAT GACGACCGGC 
AAGCCGGGTT CGGCGCATCT GTGCCTCCCC TATGACGTTC AGAAGCATGA CGTGGACCCG 
GCCGGGATCT GGGCTCAGGC CGGTCACGAT CGTTTCCCGG CGCTGCGCTA CGCGCCGGAC 
CCCGACGAGG TCGATCGCGC CGCGCGCCGT CTGACCGAAG CGCGCGCGCC GCTGATCATC 
TGCGGCGGTG GCGTGGTGAT TTCGGGCGCC TGCGCTGAGC TGGACACGCT CGCGACCTCG 
CTCAACGCGC CGGTGTGCAC CACGGTCAGC GGCCAGGGCA GCCTGGCCGA TACGCACCCG 
CTCAACGCCG GCGTGGTAGG CGCCAATGGC GGCATCCCGG CCACCCGCGA TCTGGTGGCC 
AATGCCGATG TCGTGCTGTT TATCGGTTGC CGCGCCGGCT CCACCACCAC CGAGCACTGG 
CGCTTCCCCG GCCGCAACGT GCCGATCCTG CATATCGACA TCGATCCAAT GGTGATCGCG 
GCCAACTACA ACACCGACGT TGGTATGGTG GGCGATGCCT TGCTGGCCCT TCGCATGTTG 
AACGCCGCAG TGCGTGACCG ACTGCCGATG CGCCGTGCCG ATACCGCCGA CGGGCGCGCG 
CTGGTGGAAG TCGCGCGCGC GGCCAAGCGT GCGAGCTTCG CACCGCTGGC GGCCTCGCTG 
GAGCGGCCGA TCAAGCCCGA GCGCGTGGTC GATACGCTCA ACCGCCTCTT GCCCGAGGAC 
GCCATCGTGG TGGCGGACCC TGGCACACCT TGCCCGTATT TCTCCGCCTA TCACGAGAGC 
CGACGCGCCG GCCGGCAGTT CATCACCAAT CGCGCGCATG GTGCGCTGGG TTTCTCGCTG 
GCGGCCGGTA TCGGCGCTTC GCTGGGTCGC CCTGGCACCA CGGTTGTCTC CGTGATGGGC 
GATGGCAGTT TCGGCTTTAC CTGCGGCGAG ATGGAAACGC TGGTACGCCG CCGCATCCCG 
CTGAAGATGA TCGTGTTCTC GAACTCGGTG TTCGGCTGGA TCAAGGCGAG CCAGAAGGCC 
GGCTACGACC GCCGCTACTT CTCCGTGGAT TTCAGCCGCA CCGATCACGC GCGCGTGGCC 
GAGGCCTTTG GCGTGCGCGC GTGGCGCGTG GAAGATCCCG CGATGCTCGA CGCAGCCATT 
CGCGCCGCGC TGGAGCATGA CGGTCCCGCG CTGGTGGACG TCATCACGCA GGAGTTGCAG 
GATGCCGCGG CACCGGTCAG CCAGTGGATG GGCTGA

Protein sequence

MPLSAPGIGN CCPDSCIRLS ILKSILSSML HRTPALPSPG RSMEIKRMTK MNGAEAMVRM 
LQLNGVKHIF GLCGDTSLPF YDALARLDHG MDHVLARDER SAAYMADAYA RVTGKVGVCE 
GPSGGGATYL LPGLVEANES SVPVLGITSD VSVNSRGKYP LTELDQESLY RPLTKWNTTI 
DRADQIPDAV RAAFRAMTTG KPGSAHLCLP YDVQKHDVDP AGIWAQAGHD RFPALRYAPD 
PDEVDRAARR LTEARAPLII CGGGVVISGA CAELDTLATS LNAPVCTTVS GQGSLADTHP 
LNAGVVGANG GIPATRDLVA NADVVLFIGC RAGSTTTEHW RFPGRNVPIL HIDIDPMVIA 
ANYNTDVGMV GDALLALRML NAAVRDRLPM RRADTADGRA LVEVARAAKR ASFAPLAASL 
ERPIKPERVV DTLNRLLPED AIVVADPGTP CPYFSAYHES RRAGRQFITN RAHGALGFSL 
AAGIGASLGR PGTTVVSVMG DGSFGFTCGE METLVRRRIP LKMIVFSNSV FGWIKASQKA 
GYDRRYFSVD FSRTDHARVA EAFGVRAWRV EDPAMLDAAI RAALEHDGPA LVDVITQELQ 
DAAAPVSQWM G