Gene RPC_4904 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_4904
Symbol
ID	3973727
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	5473315
End bp	5474520
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	67%
IMG OID	637928017
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_534745
Protein GI	90426375
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.247924
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGAGA CCAAGACCAC CGCACCATCC ACCTCCGCCT ATCGCCGCGA GACGAGGCTG 
GTGCATTCCG GCACGCTGCG CTCGCAATAT GGCGAGACCT CCGACGCGCT GTTTCTCACC 
CAGGGCTTCG TCTACGCCTC CGCCGAGCAA TGCGAGGCGC GCTTCACCGG CGACGACCCC 
GGGTTCCAAT ATTCGCGGTT CTCCAACCCG ACGGTGTCGG CGTTCGAACA GCGCATGGCG 
GAATTCGAGG GCGCCGAGGC CGCGCGCGCC ACCGCCACCG GCATGGCGGC GGTGACCGCG 
GCGCTGTTGG CGCCGCTGCG CGCCGGCGAT CACGTGGTCG CTTCCAAGGC GATGTTCGGC 
TCCTGCCGCT ACGTGGTGGA AGACCTGCTG CCGCGCTACG GCATCGAATC AACGCTGGTC 
GACGGCCTCG ACCTCGATCA ATGGCAAAAG GCGCTGCGGC CCAACACCAA GACGTTCTTC 
CTGGAAAGCC CGACCAATCC GACGCTCGAC GTGCTCGACA TCGGCGAGAT CGCCAAGATC 
GCCCATGCCG GCGGCGCCCG CCTGGTAGTC GACAACGTGT TCGCGACCTC GCTGTGGCAG 
AGCCCGCTCG AGCTCGGCGC CGACGTCGTG GTGTATTCGG CGACCAAGCA CATCGACGGC 
CAGGGCCGCT GTCTCGGCGG CGTGGTGCTG GCGTCAAACG CCTTCATCGA AGAGCACATC 
CAGATGTATC TGCGGCAGAC CGGGCCATCG CTGTCGCCGT TCAACGCCTG GGTGCTGCTG 
AAAGGCTTGG AGACGCTGGC GATCCGGGTC GAGAAGCAGA CCACCAACGC CGCGGCGGTC 
GCCGACGCGC TGGCCGGCCA TCCGAAGATC ACCCGGCTGA TCTATCCCGG CCGCGACGAC 
CATCCGCAGG CCGTCACGGT GAAGAAGCAG ATGCGCGCCG GCTCGACGCT GGTCGGCTTC 
GACGTCAAGG GCGGCAAGCA AGGCGCGTTC CGTTTCCTCA ACGCGCTGAA GCTGACGCTG 
ATCAGCAACA ATCTCGGCGA CGCGCGCAGC CTGGTCACGC ACCCCGCGAC CACCACGCAC 
CAGCGGCTGA AGCCGGAAGT CCGCGCCGAT CTCGGCATCA GCGAGGGCTT CATCCGCTAC 
TCCGCCGGGC TCGAACACAA GGACGATCTG ATCGAGGATC TTTTGGCCGC GCTACAGCAG 
GTGTAG

Protein sequence

MSETKTTAPS TSAYRRETRL VHSGTLRSQY GETSDALFLT QGFVYASAEQ CEARFTGDDP 
GFQYSRFSNP TVSAFEQRMA EFEGAEAARA TATGMAAVTA ALLAPLRAGD HVVASKAMFG 
SCRYVVEDLL PRYGIESTLV DGLDLDQWQK ALRPNTKTFF LESPTNPTLD VLDIGEIAKI 
AHAGGARLVV DNVFATSLWQ SPLELGADVV VYSATKHIDG QGRCLGGVVL ASNAFIEEHI 
QMYLRQTGPS LSPFNAWVLL KGLETLAIRV EKQTTNAAAV ADALAGHPKI TRLIYPGRDD 
HPQAVTVKKQ MRAGSTLVGF DVKGGKQGAF RFLNALKLTL ISNNLGDARS LVTHPATTTH 
QRLKPEVRAD LGISEGFIRY SAGLEHKDDL IEDLLAALQQ V