Gene Rmet_2055 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmet_2055
Symbol
ID	4038862
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cupriavidus metallidurans CH34
Kingdom	Bacteria
Replicon accession	NC_007973
Strand	-
Start bp	2226265
End bp	2227575
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	61%
IMG OID	637977440
Product	extracellular solute-binding protein
Protein accession	YP_584203
Protein GI	94310993
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.822621
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTTTC CACGCACCGC GTTGAAGTTC GCCGCCGTTG CAAGCCTGGC CTTGGCCGGT 
ACGGCCCATG CCGCAGTTGA GATCCAGTGG TGGCACGCCA TGCAGGGCGC GCTGAACGAC 
AAGGTCAACG AGATTGCCGA CAAGTTCAAC GCCAGCCAGT CCGACTACAA GATCGTGCCG 
GTCAACAAGG GCAATTACGA CGAGACCATG GCAGCCGGCA TTGCGGCATT CCGCGCGGGC 
GGCGCGCCGG CCATCCTGCA GGTATTCGAG GTGGGTACCG CGACGATGAT GAGCGCCAAG 
GGCGCCATCA AGCCGGTGTC GCAGGTGATG AAGGACGCTG GCGAGAAGTT CGATCAAAAG 
GCGTACATCC CGGCAGTGGC GGGTTACTAC ACGTCGTCGA AGGGCGAGAT GCTGTCGTTC 
CCCTTCAATA GCTCGACGAC TGTCTTCTAT TACAACAAGG ATGCCTTCAA GAAGGCGGGC 
ATTTCCGCTC CACCCAAGAC CTGGCCCGAG GTGATGCAGT ACTCGGCCAA GCTCAAGGCG 
TCGGGCCAGA ACTGCGCCTA TACCACCGAC TGGCAGAGCT GGGTGCACCT GGAGAGCTTC 
TCCGCCTGGC ACAACACGCT CTTCGCCACG AAGAACAACG GTTTTGGCGG CACCGACGCG 
CGACTGGTCT TCAATAGCCC GCTGCATGTG AAGCACATCA CGAATCTGCA GGAGATGGTG 
AAGAAGGGCT ACTTCAGCTA CGGCGGCCGC AAGGCGGAGT CGCAGGCCAA GTTCTACAAC 
GGCGAGTGCG CGATGTTCAC GGGCTCGTCC GCATCGCTGG CCAATATCCG CAAGAATGCC 
AAATTCCAGT TTGGTGTGTC GCAACTGCCG TACTACCCGG ACGTGCCGGG CGCGCCGCAG 
AACACGATCA TCGGCGGTGC ATCGCTGTGG GTGATGGGCG GCAAGAAGGC CGACGAGTAC 
AAGGGCGTGG CCAAGTTCTT CACGTTCCTG TCGCGACCGG AGATCCAGTC GGACTGGCAC 
CAGGCCACTG GCTACCTGCC GGTGACGATG GCTGCGTATG AGATGACGAG GAAGTCGGGT 
TACTACGACA AGAACCCGGG TGCCGATGTC TCGGTCGAGC AGATGGTCGT GAAGACCACC 
GACAAGTCGC GCGGCGTGCG TCTCGGCAAC CTCGTGCAGA TCCGTACCGT GATCGACGAG 
GAACTCGAAG CGGTGTGGGC TGGCAAGAAG GAGCCGAAGG CCGCGCTCGA CAACGCCGTG 
GCACGTGGCA ACGAACTGCT GGAGCGTTTC CAGAAGACCG CCAGGGAATA A

Protein sequence

MSFPRTALKF AAVASLALAG TAHAAVEIQW WHAMQGALND KVNEIADKFN ASQSDYKIVP 
VNKGNYDETM AAGIAAFRAG GAPAILQVFE VGTATMMSAK GAIKPVSQVM KDAGEKFDQK 
AYIPAVAGYY TSSKGEMLSF PFNSSTTVFY YNKDAFKKAG ISAPPKTWPE VMQYSAKLKA 
SGQNCAYTTD WQSWVHLESF SAWHNTLFAT KNNGFGGTDA RLVFNSPLHV KHITNLQEMV 
KKGYFSYGGR KAESQAKFYN GECAMFTGSS ASLANIRKNA KFQFGVSQLP YYPDVPGAPQ 
NTIIGGASLW VMGGKKADEY KGVAKFFTFL SRPEIQSDWH QATGYLPVTM AAYEMTRKSG 
YYDKNPGADV SVEQMVVKTT DKSRGVRLGN LVQIRTVIDE ELEAVWAGKK EPKAALDNAV 
ARGNELLERF QKTARE