Gene Rsph17029_0500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_0500
Symbol
ID	4897245
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	522651
End bp	523832
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	68%
IMG OID	640111084
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_001042388
Protein GI	126461274
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.960396
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.966435
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAAGG ACTGGAAGAC AAGGACGCAA CTCGTCCACG GGGGCAGCCG CCGGAGCCAG 
TATGGCGAAA TGGCCGAGGC GATCTTCCTG ACCCAGGGCT TCGTCTACGA CTCGGCCGAA 
CAGGCCGAGG CGCGCTTCAT CGAGACCGGC GCCGACGAAT TCATCTATGC CCGCTACGGC 
AACCCCACGA CGCGCATGTT CGAAGAGCGC ATCGCGGCCG TCGAGGGCAC CGAGGATGCG 
TTCGCCACCG CCTCGGGCAT GGCCGCGATC CACGGCGTGC TCACCTCCAT TGTGCGGGCG 
GGCGATCATC TGGTGGCGGC ACGCGCTCTT TTCGGCTCCT GCATCTACAT CCTCGAGGAG 
GTGCTGGGCC GGTTCGGCGT CGAGGTGACC TTCGTCGACG GCACCGATCT CGATCAGTGG 
CGAGCGGCGG TGCGGCCCGG CACGAAGGCC GTGTTCTTCG AGTCGGTCTC GAACCCGACG 
CTCGAGGTGG CCGACATCGG CGCCATCGCC GAGATCGCCC ATGCCGTGGG CGCGCTCGTC 
ATCGTGGACA ATGTCTTCGC GACGCCCGTC TTCTCGACGG CGGTGCGGCA GGGCGCGGAT 
GTGGTGATCT ATTCGGCCAC CAAGCACATC GACGGGCAGG GGCGCGCGCT CGGCGGCGTG 
GTCTGCGCCT CGCAGGCCTT CATCCGCAAG GTGCTCGAAC CCTTCATGAA GCACACCGGC 
GGCTCGATGA GCCCCTTCAA CGCCTGGCTC ATGCTGAACG GGATGGCGAC GCTCGACCTG 
CGCTGCCGCG CGATGGCGGA CACGGCCGAG AAGATCGCCC GCGCGCTCGA GGGCCATCCC 
CAGCTCGGCC GCGTGATCCA TCCCGCGCTG GAAAGCCACC CGCAGCACGA CATGGCCAAG 
GCGCAGATGG AACGTCCCGG CACGATGATC GCGCTCGACC TCGCCGGGGG CAAGGAGGCG 
GCCTTCCGCT TCCTCGACGC CCTGAAGATC GTGAAGATCT CGAACAATCT GGGCGATGCC 
CGCTCGATCG CGACCCACCC GGCGACGACC ACCCACCAGC GTCTCTCCGA CGCGCAGAAG 
GCCCATCTCG GCATCACGCC CGGACTCGTG CGGCTGTCGG TGGGGCTCGA GGATGCGGAC 
GACCTGATCG CCGATCTGAA ACAGGCGCTC GCGGTGATCT GA

Protein sequence

MTKDWKTRTQ LVHGGSRRSQ YGEMAEAIFL TQGFVYDSAE QAEARFIETG ADEFIYARYG 
NPTTRMFEER IAAVEGTEDA FATASGMAAI HGVLTSIVRA GDHLVAARAL FGSCIYILEE 
VLGRFGVEVT FVDGTDLDQW RAAVRPGTKA VFFESVSNPT LEVADIGAIA EIAHAVGALV 
IVDNVFATPV FSTAVRQGAD VVIYSATKHI DGQGRALGGV VCASQAFIRK VLEPFMKHTG 
GSMSPFNAWL MLNGMATLDL RCRAMADTAE KIARALEGHP QLGRVIHPAL ESHPQHDMAK 
AQMERPGTMI ALDLAGGKEA AFRFLDALKI VKISNNLGDA RSIATHPATT THQRLSDAQK 
AHLGITPGLV RLSVGLEDAD DLIADLKQAL AVI