Gene Rmet_1966 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmet_1966
Symbol
ID	4038771
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cupriavidus metallidurans CH34
Kingdom	Bacteria
Replicon accession	NC_007973
Strand	-
Start bp	2141794
End bp	2143104
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	64%
IMG OID	637977349
Product	homoserine dehydrogenase
Protein accession	YP_584114
Protein GI	94310904
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0000284917
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.216212
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCCCA TCAAAGTCGG CCTTCTCGGC ATCGGTACCG TCGGTAGCGG CACGTTCAAC 
GTGCTCAAGC GCAATCAGGA GGAAATTCGT CGCCGTGCAG GCCGCGGCAT CGAGATTGCG 
GTGGTGGCTG ACCTGAACAC CGAGCGCGCC CGCGAGCTGA CCGGTGGGAC GGTGGACGTC 
GTCAGCGATG CGAACGACGT GGTGACGCGT CCGGACATCG ACATCGTCAT CGAGCTGATC 
GGCGGCTATG GCATCGCCCG CGAGTTGGTG CTCAAGGCGA TCGAGAATGG CAAGCACGTG 
GTCACCGCCA ACAAGGCGCT GCTGGCCGTG CATGGCAACG AGATTTTCGA GGCCGCGCGC 
AAGAAGGGCG TGATCGTCGC CTTCGAGGCG GCAGTGGCGG GTGGCATCCC CATCATCAAG 
GCGCTGCGCG AAGGCCTGAC CGCGAACCGC ATCCAGTGGA TCGCCGGCAT CATCAACGGC 
ACGACGAACT TCATCCTGTC CGAGATGCGC GACAAGGGTC TGGATTTCGA TACCGTGCTC 
AAGGAAGCGC AGCAACTGGG CTATGCCGAG GCCGATCCGA CCTTCGACAT CGAAGGCGTC 
GACGCCGCGC ACAAGGTCAC GCTGATGAGC GCGATCGCAT TCGGTATGCC GGTGCAGTTC 
GACCGCGCCC ACGTGGAAGG CATCACCAAG CTGTCGGCCA TCGATATCAA ATACGCCGAG 
GAACTGGGTT ATCGCATCAA GCTGCTCGGC ATCACCCGCC GCCGCGAGGA AGGCGTGGAA 
CTGCGCGTGC ACCCGACGCT GGTGCCGGCC TCGCGCCTGA TCGCCAACGT GGAAGGCGCG 
ATGAACGCCG TGCTGGTGCA GGGCGATGCC GTGGGCGCCA CTCTGTACTA CGGCAAGGGC 
GCCGGCGCCG AGCCGACCGC CTCGGCCGTG ATTGCCGATC TGGTCGACGT GACCCGCCTG 
CACACCGCCG ATCCGAACCA CCGCGTACCG CACCTGGCAT TCCAGCCGGA CGAGCTGTCG 
AACGTGCCCG TGCTGCCGAT CGACGAAGTC ACTAGCTCGT ACTACCTGCG TATGCGTGTG 
TCGGACGAAA CTGGCGTGCT GGCAGAGATC ACGCGCATCC TGGCGGAAGC CGGCATCAGC 
ATCGACGCGA TGCTGCAGAA GGAATCGCGC GAAGGCGAGC CGCAGACCGA CATCATCATC 
CTGACGCACC TGACGCGCGA GAAGCACGTC AATGCCGCGA TTCGCAGCAT CGAAGCGCTC 
CAGACCGTGC TGTCGCCGGT CACGCGCCTG CGCATGGAAG AACTGAACTG A

Protein sequence

MNPIKVGLLG IGTVGSGTFN VLKRNQEEIR RRAGRGIEIA VVADLNTERA RELTGGTVDV 
VSDANDVVTR PDIDIVIELI GGYGIARELV LKAIENGKHV VTANKALLAV HGNEIFEAAR 
KKGVIVAFEA AVAGGIPIIK ALREGLTANR IQWIAGIING TTNFILSEMR DKGLDFDTVL 
KEAQQLGYAE ADPTFDIEGV DAAHKVTLMS AIAFGMPVQF DRAHVEGITK LSAIDIKYAE 
ELGYRIKLLG ITRRREEGVE LRVHPTLVPA SRLIANVEGA MNAVLVQGDA VGATLYYGKG 
AGAEPTASAV IADLVDVTRL HTADPNHRVP HLAFQPDELS NVPVLPIDEV TSSYYLRMRV 
SDETGVLAEI TRILAEAGIS IDAMLQKESR EGEPQTDIII LTHLTREKHV NAAIRSIEAL 
QTVLSPVTRL RMEELN