Gene Rmet_5513 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmet_5513
Symbol
ID	4042374
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cupriavidus metallidurans CH34
Kingdom	Bacteria
Replicon accession	NC_007974
Strand	+
Start bp	2258985
End bp	2260031
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	58%
IMG OID	637980931
Product	putative AraC family transcriptional regulator
Protein accession	YP_587641
Protein GI	94314432
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAACG CTGAGAGTTT GTCAAAAAGC GCAGAGACGC CGAGAGACGG CATCCCACTG 
TGCTACTTGC AGTTGCTGCT ATTGCCGGCC CGAGCAAAGG GCTACGACAC GGACGCGTTG 
TTGCGGCACC ATGGGCTTTT GTCTGCTCTA GACAGTTCGC CAAATCAAAT CGTCACGATG 
CTGCAGTTCG CGCGAATTCT GCGGCGCTTG CGGAGACTGC TCCATGACGA GATGATTGCC 
GTCACCGACC GCCCAGTTCG TCCCGGTACG TTCTTGCTCG TCGTCCGCCA GATGCTGCAA 
TGTACAACGC TGGGAGAAGC GCTTCGACTT GGTTGCAGCC TCTATCGACT TGTCATCGAG 
GACTTCTCAC CCCGTCTTCG CATATATGGC GATGTTGCTC GCCTGGAGAT AGTCGACGCT 
TCACCACCAG GTACATTCCG AAGCATCGCA CACCTCATGA TGCTATACGG CGCCATCGGG 
CTCATGTCCT GGATGGTCCA GCGACCGATT GCCGTGCATG AAGTCACGCT TCCAGCGTCA 
TATCCATCCC TCGCCCCCGC GGACGCCTTG TTCCAAGCGC CCGTACGCGC TGCCTCCATT 
AGTGGAATCA GCTTCGAATC GAGCCACCTC AACGAACGAG TTGTGACAGA CATCGGGGGA 
TTGAGAACGT TCCTGCTTCA TTGGCCGATC CGAAAGATGG CACCTTACAG CGAGAAACTT 
CCTCTAGCTG TCCAGGTTAG AAAACGCCTT ATTCAACGGG ATATCGCGCA TCTCCCTGCC 
CAAGCGGAGC TTGCTGCTAC GATGGGGCTG ACCGACAAGG CGTTGCGCCG TCGACTGTTC 
CAGGAAGGAC AGAGCTACCG AGCCATCGTC GACGCGCTTC GGCGTGATGC CGCGATACGG 
CTTCTCGAGC AGTCCAGACT CAGCGTTGCC GAAATTGGGA TCCGCCTGGG ATTCTCAGAG 
CCCAGCGCCT TTCACCGCGC TTTTCGCCGA GCAACAGGCC TGACGCCGAA TCAATTTCGG 
CGCCAAGCTT CGGTGGACCC CAACTAG

Protein sequence

MSNAESLSKS AETPRDGIPL CYLQLLLLPA RAKGYDTDAL LRHHGLLSAL DSSPNQIVTM 
LQFARILRRL RRLLHDEMIA VTDRPVRPGT FLLVVRQMLQ CTTLGEALRL GCSLYRLVIE 
DFSPRLRIYG DVARLEIVDA SPPGTFRSIA HLMMLYGAIG LMSWMVQRPI AVHEVTLPAS 
YPSLAPADAL FQAPVRAASI SGISFESSHL NERVVTDIGG LRTFLLHWPI RKMAPYSEKL 
PLAVQVRKRL IQRDIAHLPA QAELAATMGL TDKALRRRLF QEGQSYRAIV DALRRDAAIR 
LLEQSRLSVA EIGIRLGFSE PSAFHRAFRR ATGLTPNQFR RQASVDPN