Gene Rmet_2459 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmet_2459
Symbol
ID	4039282
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cupriavidus metallidurans CH34
Kingdom	Bacteria
Replicon accession	NC_007973
Strand	-
Start bp	2669567
End bp	2670775
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	65%
IMG OID	637977858
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_584605
Protein GI	94311395
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00148709
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.252663
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAAC CGTTCAACCC CGACGCCTAC GGCATTGATA CCCTCGGCGT GCGCGCCGGC 
ACGCTGCGCA CTGGCGAATT CATGGAGCAC TCCGAGGCGA TGTACCTGAC CTCGAGCTTC 
TGCTTCAACA GTGCAGCCGA AGCCGCCGCA CGCTTCGCCA ACTCGGAAGA GGGTTACACC 
TACTCGCGCT TCACGAATCC GACCGTGTCG ATGTTCCAGT CGCGCCTGGC CGCGCTGGAA 
GGCGCGGAGG CCTGCATGGC CACGGCTTCG GGCATGAGCG CGATTCTGTC GGTGGCGCTC 
GCCACGCTGC AGGCCGGCGA TCACCTGGTC AGCTCGCGTT CGATCTTCGG CTCGACGATG 
ACGCTGTTCA ACTCGATCCT GGCCAAGTTC GGTGTGGAGA CGACCTACGT CGACGGCACC 
GATCTGGCTG CCTGGCGTGC CGCTGTGAAG CCGAACACGA AGCTGTTCTT CCTGGAGACG 
CCGTCGAACC CGCTGACCGA GGTGTCCGAT ATCGCGGCAG TTGCCGATAT TGCGCACAAT 
GCCGGCGCGC TGTTCGTGGT CGACAACTGC TTCTGCTCAC CGGCTTTGCA GCAGCCGATC 
AAGTTCGGTG CCGATGTGGT GGTGCATTCG GCCACCAAGC ACATCGATGG CCAGGGCCGC 
GTGCTTGGCG GCGCGGTGGT CGGCAAGCAC GATTTCATCA TGGGCAAGGT GTTCCCGTTC 
GTGCGTACGG CGGGCCCGAC GCTGTCGGCG TTCAACGCGT GGGTGATGCT CAAGGGCATG 
GAAACGCTGG CGATCCGCAT GGAGCGTCAC TCGCAGAGCG CGTTGGCGAT TGCCGAGTTC 
CTCGAGTCAC ATCCGGCCGT GAATCGTGTG TTCCACCCGG CGCTGAAGTC GCATCCGCAG 
TACGAGATCG CCCAACGCCA GCAGAGCGGG GGCGGCGCGA TCGTGTCGTT CGAGTTGAAG 
GGCGATAGCC CCGAAGCCAT GCGTGCTGCT GCGTGGCGCG TGATCGACAG CACGAAGCTG 
TGCTCGATCA CCGGCAATCT CGGCGACACG CGCACGACGA TCACCCATCC GTACACCACC 
ACCCACGGTC GCGTGGCGCC TGAAGCCAAG GCCGCCGCCG GCATCAGCGA AGGGCTGATC 
CGACTGGCCG TTGGCCTGGA GTCCGTGGAG GATCTCAAGG CCGATCTGCT GCGCGGCCTG 
GGCCAGTAA

Protein sequence

MSEPFNPDAY GIDTLGVRAG TLRTGEFMEH SEAMYLTSSF CFNSAAEAAA RFANSEEGYT 
YSRFTNPTVS MFQSRLAALE GAEACMATAS GMSAILSVAL ATLQAGDHLV SSRSIFGSTM 
TLFNSILAKF GVETTYVDGT DLAAWRAAVK PNTKLFFLET PSNPLTEVSD IAAVADIAHN 
AGALFVVDNC FCSPALQQPI KFGADVVVHS ATKHIDGQGR VLGGAVVGKH DFIMGKVFPF 
VRTAGPTLSA FNAWVMLKGM ETLAIRMERH SQSALAIAEF LESHPAVNRV FHPALKSHPQ 
YEIAQRQQSG GGAIVSFELK GDSPEAMRAA AWRVIDSTKL CSITGNLGDT RTTITHPYTT 
THGRVAPEAK AAAGISEGLI RLAVGLESVE DLKADLLRGL GQ