Gene RSP_2431 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_2431
Symbol
ID	3720028
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007493
Strand	-
Start bp	1064635
End bp	1065927
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	67%
IMG OID	640070612
Product	putative O-acetylhomoserine sulfhydrylase
Protein accession	YP_352493
Protein GI	77462989
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCTCAG ACCGCAAACT CGGCTTCGAC ACGCTGCAGA TCCACGCCGG GGCCAAGCCG 
GATCCGGCGA CGGGCGCCCG GCAGGTGCCG ATCTACCAGA CGACCGCCTA TGTGTTCCGC 
GACGCCGAGC ACGCGGCACG TCTCTTCAAT CTGGAAGAGG TGGGCTATAT CTACTCGCGC 
CTTACCAACC CGACGGTCAT GGCTCTGGCC GAGAGGGTGG CCGCGCTGGA GGGAGGCGCG 
GGCGCCGTCT GCTGCTCCTC GGGGCATGCC GCGCAGATCA TGGCGCTCTT CCCGCTGATG 
GCACCCGGCC GCAACATCGT GGCCTCGACA CGTCTCTACG GCGGCACGAT CACACAATTC 
TCGCAGACGA TCAGGCGGTT CGGCTGGTCG GCCAAGTTCG TGGACTTCGA CGATCCCGCC 
GCCATCGAGG CCGCGATCGA CTCGGATACG CGCGCCCTCT TCTGCGAGAC CATTGCCAAC 
CCCGGCGGCG TCATCACGGA TCTCGATGCG GTCTCGGCCA TCGCGGACAG GATGGGCCTG 
CCGCTCATCG TGGACAACAC CACTGCCACG CCCTGGCTCT GCCGCCCCAT CGAGCATGGC 
GCGACGCTCG TCGTTCATTC CGCAACGAAA TACCTGACCG GCAATGGCAC AGTGACCGGC 
GGCGTGATCG TGGACTCGGG CAAGTTCGAC TGGTCGGCGT CGGACAAGTT CCCGAGCCTG 
TCGCAGCCCG AGCCGGCCTA CCATGGCCTC GTCTTCCACA AGGCGCTGGG GCCAATGGCC 
TACACGTTCC ACTCCATCGC TGTGGGCCTG CGCGATCTCG GCATGACCAT GAACCCGCAG 
GGGGCGCATT ACACGCTGAT GGGGATCGAG ACCCTCAGCC TGCGCATGGC CCGGCATGTC 
GAGAACGCGC AGAAGGTGGC CGCCTGGCTG GAGCAGGACC CGCGGGTGGA ATTCGTGAGC 
TACGCAGGAT TGCCCTCCTC GCCCTGGCAC GGCCGCGTCG CGCGGATCTG CCCGAAGGGG 
GCCGGAGCGC TCTTTACCTT CGCGGTCAAG GGCGGCTACG ACGCGTGCGT GGCGCTCGTC 
GATGCGCTGC AGCTGTTCAG CCATGTCGCC AACCTCGGCG ATACACGGTC GCTTGTGATC 
CACTCGGCCT CCACCACCCA TCGCCAGCTC ACGCCCGAGC AGCAGGTGGC GGCCGGCGCA 
GCGCCGAATG TCGTGCGCAT CTCGATCGGA ATCGAGGATG CCGACGATCT GATCGCGGAC 
CTGGATCAGG CCCTCGCCAA GGCGACGGCC TGA

Protein sequence

MSSDRKLGFD TLQIHAGAKP DPATGARQVP IYQTTAYVFR DAEHAARLFN LEEVGYIYSR 
LTNPTVMALA ERVAALEGGA GAVCCSSGHA AQIMALFPLM APGRNIVAST RLYGGTITQF 
SQTIRRFGWS AKFVDFDDPA AIEAAIDSDT RALFCETIAN PGGVITDLDA VSAIADRMGL 
PLIVDNTTAT PWLCRPIEHG ATLVVHSATK YLTGNGTVTG GVIVDSGKFD WSASDKFPSL 
SQPEPAYHGL VFHKALGPMA YTFHSIAVGL RDLGMTMNPQ GAHYTLMGIE TLSLRMARHV 
ENAQKVAAWL EQDPRVEFVS YAGLPSSPWH GRVARICPKG AGALFTFAVK GGYDACVALV 
DALQLFSHVA NLGDTRSLVI HSASTTHRQL TPEQQVAAGA APNVVRISIG IEDADDLIAD 
LDQALAKATA