Gene Rmet_5422 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmet_5422
Symbol	sumF
ID	4042283
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cupriavidus metallidurans CH34
Kingdom	Bacteria
Replicon accession	NC_007974
Strand	-
Start bp	2168098
End bp	2169156
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	68%
IMG OID	637980840
Product	Sulfatase-modifying factor 1 precursor (C-alpha-formyglycine- generating enzyme 1); putative exported protein
Protein accession	YP_587550
Protein GI	94314341
COG category	[S] Function unknown
COG ID	[COG1262] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGTGA ACGTGTTGCG AAACAGGGGA CGCTGGCGCA CGCCGCTGGC GGTAGCTGGG 
CTGGCATTCG CGGTGGGTGT CATCGCGTCG CTGGGCGTGC ATGCGGTGCC GGGGGCCGCC 
ATGCCTGACG GCGCCACACT CGGTTCGGTG CAGCGATGCG CCGCCTACTC GGGTTTGCCG 
GCCGGCTGGG GCAAGTCGCG GACGGCTGGC ATGGCTCGGG TGACGGGCGG TGAGTTCGTG 
CCCGGTACCA CGCTTGGCTA TCCGGACGAG CGGCCCGCAG GAAAAACGCG CGTCGGCAGC 
TTCTGGATCG ACCGTACCGA GGTGACGGTG GCCCAGTTCG CGGCGTTCGT GCAGGCCACC 
GGTTACGTCA CCGATGCCGA GCGACAAGGT GCGGCGGTGG TCTTCCACAA GCCGACCGAC 
GCAGAACTGG GTCAACGCCC CTACGCGTGG TGGACGATGG TGACAGGCGC CAACTGGCGG 
CATCCGGAAG GGCCGGCCGC TGCCAATTCA CATGGCTACG ATCACCGACG TGACAACCAG 
CCGGTGACGC TCGTCACGCA GGCCGATGCC AGGGCCTATG CGAACTGGCT CGGCCATGAC 
CTGCCCACGG AGGACGAATG GGAGTTCGCG GCCAAGGCGG GACGTAGTGA TGCCGGACTG 
GAAACGGCAC CGCAAACGGC CGAAGGAACG CCCACCGCCA ACTACTGGCA GGGCGTGTTC 
CCGGTGCTCA ATACCTCGCG CGATGGGTTC GCGGGGCTCG CGCCGGTGGG GTGCTACACC 
GCCAATGCGC TCGGCTTGTT CGACATGATC GCCAACGCCT GGGAGTGGAC TGGCGACGCC 
TACACCGGCC CGCGTCAGTC GCACGCCAAT GGCGATACGG CAGTCGTGGC GGCAGCGTCA 
CGGTCGCGCA AGCCGGCGGC GACCAGTGTA ATCAAGGGCG GATCGTTCCT GTGCGCGCCG 
GACTTCTGCG TGCGCTACCG TGCTTCGGCG CGGGAGTCTG CCGAAAGCGA CTTGCCGACG 
TCGCATATCG GCTTCCGAAC GGTGCTGCGC GATGGCTGA

Protein sequence

MVVNVLRNRG RWRTPLAVAG LAFAVGVIAS LGVHAVPGAA MPDGATLGSV QRCAAYSGLP 
AGWGKSRTAG MARVTGGEFV PGTTLGYPDE RPAGKTRVGS FWIDRTEVTV AQFAAFVQAT 
GYVTDAERQG AAVVFHKPTD AELGQRPYAW WTMVTGANWR HPEGPAAANS HGYDHRRDNQ 
PVTLVTQADA RAYANWLGHD LPTEDEWEFA AKAGRSDAGL ETAPQTAEGT PTANYWQGVF 
PVLNTSRDGF AGLAPVGCYT ANALGLFDMI ANAWEWTGDA YTGPRQSHAN GDTAVVAAAS 
RSRKPAATSV IKGGSFLCAP DFCVRYRASA RESAESDLPT SHIGFRTVLR DG