Gene Rmet_4940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmet_4940
Symbol
ID	4041802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cupriavidus metallidurans CH34
Kingdom	Bacteria
Replicon accession	NC_007974
Strand	-
Start bp	1604923
End bp	1605951
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	67%
IMG OID	637980361
Product	peptidase U32
Protein accession	YP_587071
Protein GI	94313862
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.66387
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCCAC CCTTGGCGGC GCCCGTGCGC CGCCCTCAAC TTGTCGCACC CGCAGGCTCG 
CTAGCAGCGC TGCGCATGGC GTTGCAGCAC GGCGCCGACG CGGTGTATCT GGGCCTGCGC 
GATGCCACCA ACGCGCGCAA CTTCGGCGGT CTGAATTTCA GCGAGGACGA TATCCGCACC 
GGTGTGGCCG AGGCCCACGC ATGCGGTGCC GAAGTGCTGT TCGCTATCAA CACGTTCGCG 
CAGATGGGCC ACGTCGAGCA ATGGCACCAT GCCGTCGACG CGGCCGCCGC GCTCGGCGCG 
GATGCGGTCA TCATGGCCGA CCCCGGTCTG ATTGCCTATG CCGCGAAACG CCATCCGTCC 
CTGCGCATCC ACCTTTCCGT GCAGGGCTCC GCCACCCACG CCGATGCAAT CGAGCTGATG 
CGCGAGCAGT TCGGCATCCG GCGCGTCGTG TTGCCGCGAG TGCTCACGGT CACACAGATT 
GCGAAGCTTG CCCGCCAGAC CGATATCGAA CTTGAAGTCT TTGGATTCGG CAGCCTCTGC 
GTGATGGCGG AGGGCCGGTG CCTGCTGTCG TCCTACGCTA CCGGCGACTC GCCTAATAAC 
AAGGGCGTCT GCTCTCCGGC CCATGCGGTG CGCTGGGACG AACAGGACGG CACGATGCAG 
GCGCGACTGT CCGGCATCCT GATCGACAGC TACGCCCCTG GCGAGCCGGC GGGCTATCCG 
ACCCTCTGCA AGGGCCGATT CACGGTCGAA GGCGAGCGCG GCTACGTGCT GGAGGAACCC 
ACCAGTCTCA ATGCGGTATC GCTGCTGCCC ACTCTGATCG ACATTGGCAT CGCCGCGATC 
AAGATCGAAG GCCGGCAGCG CAGCCCGCGC TACGTCGCCG ACGTGGTGGG TGTGCTGCGC 
GCGGCCATCG ACGATGCATG CCGCGATCCG AAGCGCTTCG CGCCGCGCCA GGAATGGCAG 
GCCACGCTGG GACGCCACGC CGAAGGCGAC CAGGTCACGC AAGGCGCGTA CGAGCGGCCC 
TGGCGCTGA

Protein sequence

MNPPLAAPVR RPQLVAPAGS LAALRMALQH GADAVYLGLR DATNARNFGG LNFSEDDIRT 
GVAEAHACGA EVLFAINTFA QMGHVEQWHH AVDAAAALGA DAVIMADPGL IAYAAKRHPS 
LRIHLSVQGS ATHADAIELM REQFGIRRVV LPRVLTVTQI AKLARQTDIE LEVFGFGSLC 
VMAEGRCLLS SYATGDSPNN KGVCSPAHAV RWDEQDGTMQ ARLSGILIDS YAPGEPAGYP 
TLCKGRFTVE GERGYVLEEP TSLNAVSLLP TLIDIGIAAI KIEGRQRSPR YVADVVGVLR 
AAIDDACRDP KRFAPRQEWQ ATLGRHAEGD QVTQGAYERP WR