Gene Rmet_3233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmet_3233
Symbol
ID	4040068
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cupriavidus metallidurans CH34
Kingdom	Bacteria
Replicon accession	NC_007973
Strand	+
Start bp	3508636
End bp	3509832
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	61%
IMG OID	637978639
Product	peptidase S1 and S6, chymotrypsin/Hap
Protein accession	YP_585374
Protein GI	94312164
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID	[TIGR02037] periplasmic serine protease, Do/DeqQ family [TIGR02038] periplasmic serine pepetdase DegS

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGCGCC GCTTCTGGCT GTTCTTCGCT CAGGCTGTCA CGGTTGTTCT GGCCGTGTGG 
TTCGTCGTGG CCACACTCAA ACCCGAGTGG CTGCAGCGCG GGCGGGTGGC CGTGCAATCG 
GGTTCGCCCA TTGTGGCGCT AAAAGAGGTC GTCCCCAGTG TGGAAGGTTC GGCCGCTCCG 
GGGTCCTATA GCGAGGCGGC CCGCCTTGCC ATGCCCGCAG TCGTCAATAT TTTCACCAGC 
AAGAACGGAT CGAAGCGATC GCCCAATAAT CCGCAGGCCG AAGATCCGTG GTTCCGGTTC 
TTCTTTGGCG ACCGCTTGCC GGAGCGCCAA GAGCCGGTGT CGAGCTTGGG CTCGGGCGTG 
ATCGTCAGTG CCGAAGGTTA CATTCTAACC AACCACCACG TTGTGGATGG CGCCGACGAA 
ATCGAGGTGG CGCTGACCGA CGGACGCAAG GCAAATGCCA AGGTGGTGGG CTCCGATCCC 
GAAACCGACC TTGCCGTGCT GAAGGTCACG CTCAAGGACT TGCCTGCGAT CACGCTGGGG 
CGGATCGAGA ACGTGAAGGT GGGCGATGTG GTGCTGGCTA TCGGCAACCC GTTTGGTGTC 
GGCCAGACCG TGACAATGGG TATTGTCTCG GCGCTCGGCC GCAGCCATCT CGGCATCAAC 
ACATTCGAGA ACTTCATTCA GACCGATGCA GCGATCAACC CCGGTAACTC TGGTGGTGCA 
CTGGTCGACG CACAGGGCAA TCTGCTTGGC ATCAACACGG CGATCTATTC GCGCTCCGGC 
GGCTCGCTCG GTATTGGCTT TGCGATTCCT GTGTCGACCG CCAAGCAAGT CATGGAATCG 
ATCATCTCCA CGGGTAGCGT GACACGTGGC TGGATCGGCG TGGAGCCGCA GGATCTGACC 
CCAGAGATTG CCGAGTCTTT CGGGCTCGAA GCCAAGGAAG GCGCGCTGAT TGCAGCGGTG 
GTCCAGGGTG GGCCAGCTGA CAAGGCCGGC GTCAAACCTG GGGATGTGCT GGTCTCGGTC 
GACAATCAAT CGATCTCGGA CACCACCGCC CTGCTCAACG CGATTGCACA GTTGAAACCG 
GGCGCCGAGG TGAAGATGAA GGTGATTCGA CGCGGCAAAC CGGCGGAACT CACTGTCACG 
ATCGGCAAGC GCCCGCCTCC TCCGCGCAGG CCGATGCCGC TGGATGAGGA AGAGTAG

Protein sequence

MLRRFWLFFA QAVTVVLAVW FVVATLKPEW LQRGRVAVQS GSPIVALKEV VPSVEGSAAP 
GSYSEAARLA MPAVVNIFTS KNGSKRSPNN PQAEDPWFRF FFGDRLPERQ EPVSSLGSGV 
IVSAEGYILT NHHVVDGADE IEVALTDGRK ANAKVVGSDP ETDLAVLKVT LKDLPAITLG 
RIENVKVGDV VLAIGNPFGV GQTVTMGIVS ALGRSHLGIN TFENFIQTDA AINPGNSGGA 
LVDAQGNLLG INTAIYSRSG GSLGIGFAIP VSTAKQVMES IISTGSVTRG WIGVEPQDLT 
PEIAESFGLE AKEGALIAAV VQGGPADKAG VKPGDVLVSV DNQSISDTTA LLNAIAQLKP 
GAEVKMKVIR RGKPAELTVT IGKRPPPPRR PMPLDEEE