Gene Rmet_1681 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmet_1681
Symbol
ID	4038484
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cupriavidus metallidurans CH34
Kingdom	Bacteria
Replicon accession	NC_007973
Strand	-
Start bp	1817805
End bp	1818947
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	64%
IMG OID	637977063
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_583831
Protein GI	94310621
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.145582
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGATC CACAAAAGTC CCCGCCCAGC GTTGCCGAAG GCTGGCAGGC GCCGCCGGAC 
CGCACCAGTG TGACGGACGA TGCGCGCGTG GAGGACATCA TCCCGCTGCC CCCGCCCGAG 
CACTTGATCC GTTTCTTCCC CATCCGTGGC ACCCCCGTTG AATCGCTGGT CACCCAGACG 
CGCCAGCGCA TCTCCCGCAT TCTGCATGGC AGTGATGACC GGCTGCTCGT GATCATGGGC 
CCCTGCTCGA TCCACGACCC GCAGGCCGCG CTCGACTACG CACGGCGTCT GGCGGCCGAA 
CGCGAGCGCT ACGCGGACTC GCTGGAAATC GTGATGCGGG TGTATTTCGA GAAGCCCCGC 
ACCACGGTCG GCTGGAAGGG CCTGATCAAC GACCCCTACC TGGACGAGAG CTATCGCATC 
GACGAAGGCC TGCGCATCGC GCGCAGCCTG CTGGTGGATA TCAACCGCCT CGGGTTGCCG 
GCGGCCGGCG AGTTCCTGGA CGTCATTTCG CCCCAGTACA TCGGCGATCT GATCTGCTGG 
GGCGCGATTG GCGCCCGCAC GACCGAGAGC CAGGTACACC GGGAACTGGC TTCGGGCGTC 
TCCGCGCCCA TTGGCTTCAA GAATGGCACC GACGGAAACA TCAAGATCGC GATCGACGCG 
ATCCAGGCCG CATCGCGCCC GCACCACTTC CTTGGCGTGC ACAAGAACGG CCAGGTCGCG 
ACGGTCCATA CCAAGGGCAA CCCGGACTGC CACGTCATTC TTCGCGGCGG CAAGGCGCCC 
AACTACGACG CGGAGGTTGT CGCCGCAGCG TGCAAGGAAC TGGAAGCGGC GCGGCTGCGC 
AATTCGTTGA TGGTCGATTG CAGCCATGCC AACAGCAACA AGCAGCACCA ACGCCAGATC 
GACGTCGCAC GCGACGTGGC GCAGCAGATC AGCGGCGGCA GCCAGTCGAT CTTCGGCCTG 
ATGGTCGAGA GCCATCTGGT ACCCGGCGCG CAGAAGTTCA CCCCAGGAGA ACACAACCCA 
TCGGGTCTCA CTTATGGTCA GAGCATCACG GACGCCTGCA TCGGGTGGGA GGACTCCGTG 
ACGGTGCTGG AACTGCTGAG CGAGGCGGTA AATGTACGGC GTGGGGTAAA CAGGAAGGCT 
TAA

Protein sequence

MNDPQKSPPS VAEGWQAPPD RTSVTDDARV EDIIPLPPPE HLIRFFPIRG TPVESLVTQT 
RQRISRILHG SDDRLLVIMG PCSIHDPQAA LDYARRLAAE RERYADSLEI VMRVYFEKPR 
TTVGWKGLIN DPYLDESYRI DEGLRIARSL LVDINRLGLP AAGEFLDVIS PQYIGDLICW 
GAIGARTTES QVHRELASGV SAPIGFKNGT DGNIKIAIDA IQAASRPHHF LGVHKNGQVA 
TVHTKGNPDC HVILRGGKAP NYDAEVVAAA CKELEAARLR NSLMVDCSHA NSNKQHQRQI 
DVARDVAQQI SGGSQSIFGL MVESHLVPGA QKFTPGEHNP SGLTYGQSIT DACIGWEDSV 
TVLELLSEAV NVRRGVNRKA