Gene Rmet_4954 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmet_4954
Symbol
ID	4041816
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cupriavidus metallidurans CH34
Kingdom	Bacteria
Replicon accession	NC_007974
Strand	-
Start bp	1619637
End bp	1621037
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	66%
IMG OID	637980375
Product	GntR family transcriptional regulator
Protein accession	YP_587085
Protein GI	94313876
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGACA TGAAAGGCGA ACGCCATGTG GAATGGCTGC GCCCGCTGAC ACCGGGCGCA 
GGGCCGCGCT ACATGCAGAT CGCGGATTTG ATTGCGCGGG CGGTGCAGAC GGGCGAACTC 
GCCGTCGGCG ACCAGATCCC GTCGCAGCGG TGGCTGGCGA CGCAGCTCGG GGTGGATCTC 
ACCACGGTGA CGCGTGCCTA TACGGAGGCA CGCAATCGTG GCCTGATCTC GTCGTTCAGC 
GGGCGTGGCT CGTTCGTCGC GGGCGTTGGC GAGGCGGGCG ATGAGATGCG TATCGACCTG 
TCGATGAACA CCCCACCGCA GCCGGCCAGT GGAAGCATGG GTGACGCGCT CAAGTTGGCC 
ATTGACGAAG TGCTGGCACG GCAAGGCATC GAGGCGATGT CCGCCTACCA GGACACGTGG 
TCCGGCGCCT CGATCGTCCA GGCGGGCAGG GCGTGGCTGC GGCCCGCGGT TGGCGCGATG 
GCAGGGCAGC AGGAACTGAT TGTCTGCGCG GGTACCCAGG CCGCGATCTT CAGCCTTTTG 
CAGTCGCGCA CGCAGCGTGG GGATGCCGTC CTTGCCGAGC CGCTGACCTA TCCCGGCTTT 
CTGCTTACCG CGCAGCAGCT CGGTTTGCGT GTCGTCGCGC TCGAAGTCGA CCAGGATGGG 
GTGTTGCCGG ACGCGATCGA ACGAAGCCAT CGCGAAACCG GCGCGCAGGT GATCTACCTG 
AATCCGACGC TCCAGAACCC GACTGCGAGC ACCATGCCCG AGCACCGGCG CGAGGCCATC 
GGGGCCATGT TGCGCAAGCT CGGCATGACG CTGATCGAGG ACGATCCCTA TCGCTACCTG 
CTCAACGACG CGCCGCCGCC GATCGTCACC TACGAAGGGG GCGAGCGTGC GTACTATCTG 
ACCTCGCTGT CGAAATGCCT CTGGCCGAGC CTGCGCACGT CGTTCGTCCT GTTGCCGCGC 
CAGCACGATG CCGCAATGCT GCAGGATGCG TTGCGCGCCT CCAGCATGGG GTGTTCGCTA 
TTGCTGACCG CGGTGGCCGA GCACTGGATG CGCAGTGGCC AGGCCAGGCA CCTGATGCTC 
GACATCCAGC GCGAAGTGCG CGCGCGGCAG ACGCTGGCGC GCAACCTGTT GCCGAAGGAC 
GTCAACGCAC ATCCCACCGG CCTGCACTTG TGGATGACGC TGCCGGCCCA CTGGAATCGA 
CAGTTGTTCG CGCTCGCGCT CGAGCAGCAG GGCGTGCTGG TGGCCTGCTC GGATGCGTTC 
AGCGTGGATG CGAATCCCGT GGATGCGGTG CGTCTGTCGG TCGGCGGCGC GCGTAGCCAG 
ACGGATCTGG CTCATGCGTT GCAGCGGATC GCCACGTTGC TGCGGGAGGA TCGCCGTCGA 
GGCGTGCGGG CCATTGTCTA G

Protein sequence

MSDMKGERHV EWLRPLTPGA GPRYMQIADL IARAVQTGEL AVGDQIPSQR WLATQLGVDL 
TTVTRAYTEA RNRGLISSFS GRGSFVAGVG EAGDEMRIDL SMNTPPQPAS GSMGDALKLA 
IDEVLARQGI EAMSAYQDTW SGASIVQAGR AWLRPAVGAM AGQQELIVCA GTQAAIFSLL 
QSRTQRGDAV LAEPLTYPGF LLTAQQLGLR VVALEVDQDG VLPDAIERSH RETGAQVIYL 
NPTLQNPTAS TMPEHRREAI GAMLRKLGMT LIEDDPYRYL LNDAPPPIVT YEGGERAYYL 
TSLSKCLWPS LRTSFVLLPR QHDAAMLQDA LRASSMGCSL LLTAVAEHWM RSGQARHLML 
DIQREVRARQ TLARNLLPKD VNAHPTGLHL WMTLPAHWNR QLFALALEQQ GVLVACSDAF 
SVDANPVDAV RLSVGGARSQ TDLAHALQRI ATLLREDRRR GVRAIV