Gene Rsph17029_1095 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1095
Symbol
ID	4895095
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	1131502
End bp	1132794
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	67%
IMG OID	640111681
Product	O-acetylhomoserine/O-acetylserine sulfhydrylase
Protein accession	YP_001042977
Protein GI	126461863
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.337792
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTCAG ACCGCAAACT CGGCTTCGAC ACGCTGCAGA TCCACGCCGG GGCCAAGCCG 
GATCCGGCGA CGGGCGCCCG GCAGGTGCCG ATCTACCAGA CGACCGCCTA TGTGTTCCGC 
GACGCCGAGC ACGCGGCACG TCTCTTCAAT CTGGAAGAGG TGGGCTATAT CTACTCGCGC 
CTTACCAACC CGACCGTCAT GGCTCTGGCC GAGAGGGTGG CCGCGCTGGA GGGAGGCGCG 
GGCGCCGTCT GCTGCTCCTC GGGGCATGCC GCGCAGATCA TGGCGCTCTT CCCGCTGATG 
GCACCCGGCC GCAACATCGT GGCTTCGACA CGTCTCTACG GCGGCACGAT CACACAATTC 
TCGCAGACGA TCAGGCGGTT CGGCTGGTCG GCCAAGTTCG TGGACTTCGA CGATCCCGCC 
GCCATCGAGG CCGCGATCGA CTCGGATACG CGCGCCCTCT TCTGCGAGAC CATTGCCAAC 
CCCGGCGGCG TCATCACGGA TCTCGATGCG GTCTCGGCCA TCGCGGACAA GATGGGCCTG 
CCGCTCATCG TGGACAACAC CACTGCCACG CCTTGGCTCT GCCGCCCGAT CGAGCATGGC 
GCGACACTCG TCGTTCATTC CGCAACGAAA TACCTGACCG GCAATGGCAC GGTGACCGGC 
GGCGTGATCG TGGACTCGGG CAAGTTCGAC TGGTCCGCGT CGGACAAGTT CCCGAGCCTG 
TCGCAGCCCG AGCCGGCCTA CCATGGCCTC GTCTTCCACA AGGCGCTGGG GCCGATGGCC 
TACACGTTCC ACTCCATCGC CGTGGGCCTG CGCGATCTCG GCATGACCAT GAACCCGCAG 
GGGGCGCATT ACACGCTGAT GGGGATCGAG ACCCTCAGCC TGCGCATGGC CCGGCATGTC 
GAGAACGCGC AGAAGGTGGC CGCCTGGCTG GAGCAGGACC CGCGGGTGGA ATTCGTGAGC 
TACGCAGGAT TGCCCTCCTC GCCCTGGCAC GGCCGCGTCG CGCGGATCTG CCCGAAGGGG 
GCCGGAGCGC TCTTCACCTT CGCGGTCAAG GGCGGCTACG ACGCGTGCGT GGCGCTCGTC 
GATGCGCTGC AGCTGTTCAG CCATGTCGCC AACCTCGGCG ATACACGGTC GCTTGTGATC 
CACTCGGCCT CCACCACCCA TCGCCAGCTC ACGCCCGAGC AGCAGGTGGC GGCCGGCGCA 
GCGCCGAATG TCGTGCGCAT CTCGATCGGG ATCGAGGATG CCGACGATCT GATCGCGGAC 
CTGGATCAGG CCCTAGCCAA GGCGACGGCC TGA

Protein sequence

MSSDRKLGFD TLQIHAGAKP DPATGARQVP IYQTTAYVFR DAEHAARLFN LEEVGYIYSR 
LTNPTVMALA ERVAALEGGA GAVCCSSGHA AQIMALFPLM APGRNIVAST RLYGGTITQF 
SQTIRRFGWS AKFVDFDDPA AIEAAIDSDT RALFCETIAN PGGVITDLDA VSAIADKMGL 
PLIVDNTTAT PWLCRPIEHG ATLVVHSATK YLTGNGTVTG GVIVDSGKFD WSASDKFPSL 
SQPEPAYHGL VFHKALGPMA YTFHSIAVGL RDLGMTMNPQ GAHYTLMGIE TLSLRMARHV 
ENAQKVAAWL EQDPRVEFVS YAGLPSSPWH GRVARICPKG AGALFTFAVK GGYDACVALV 
DALQLFSHVA NLGDTRSLVI HSASTTHRQL TPEQQVAAGA APNVVRISIG IEDADDLIAD 
LDQALAKATA