Gene RPD_4194 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4194
Symbol
ID	4024715
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4661081
End bp	4662103
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	61%
IMG OID	637964400
Product	cysteine synthase
Protein accession	YP_571312
Protein GI	91978653
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0031] Cysteine synthase
TIGRFAM ID	[TIGR01137] cystathionine beta-synthase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.360882
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGATTGC ACGTCGGTAA CGCCGTCGGC GCGACCCCGC TGGTCGAGAT CACCAAGTTG 
GATATCCCGG ATGGCATCCG GGTATTCGCG AAGCTGGAGT TCCTCAATCC TGGCGGCAGC 
ATCAAGGACC GCATGGTCAA ATACATTCTC GACCATGCCG AGCGTGTCGG GGCGCTGCAG 
CCCGGTGCGA CGATTGTGGA GAATACGTCC GGAAACACCG GCGCGGCGAT CGCCATGTTC 
GCGGCCGAAC GCGGATATCG GGCGATCCTG ACGATGCCGG ACAAGGTGAG CCAGGAGAAA 
CAAAACGTCC TGCGCGCGAT GGGCGCACAG ACAATCGTTT GCCCGACGGC GGTTCGACCG 
GATTCACCGG AGCACTACGT CGAGACGGCT CGACGGCTTC ACCGCGAGAT ACCCGGCTCG 
TTCATGCTGA ACCAGTACGA CAATCCGCTG AACGCCGAGG CGCATTTCCA CACCACCGGG 
CCGGAAATAT GGGAAGCGCT CGGCGGCCGG ATCACGGCCT TCGTTTCGTC GGGCAGCACC 
GGGGGAACGA TTTCCGGTAT CGGCGGCTAT CTACGCTCGA AGAACCCCGA CATCCACGTC 
GTTCTGCTCG ACCCCGTCGG CTCGATCTAT CACAAATACT TTCACGAAGG CGTCGTGGAT 
CCGCGCGAAA TCGCGGCCTA CCACGTCGAG GGTGTCGGTG AGGACCATCT CGCCAAGTGC 
ATGGATTTCT CGGTTCTGAC CAATGTAATT CGCTTCAACG ATCGCAACGC CATTCAAATG 
TGCCACGAGC TTGCGCGGAA AGAAGGCTTG CTGTGCGGCG GCAGTTCAGG AGCCAATATC 
TGGGGCTGCA TCGAAGTTGC GAAGGCGCTG AAGCCGCCGG CGGTCATTGT GACCGTTCTT 
CCGGACAGCG GAGCGAAGTA CGTTTCCAAG ATTTACAACG CGGATTGGCT TGCGGAACAA 
CGGTTCGCGG ACGGTAGCAG CGCAACGGTG TCGATGCGCA GTCCGGCGCC GAGCGACGCC 
TGA

Protein sequence

MRLHVGNAVG ATPLVEITKL DIPDGIRVFA KLEFLNPGGS IKDRMVKYIL DHAERVGALQ 
PGATIVENTS GNTGAAIAMF AAERGYRAIL TMPDKVSQEK QNVLRAMGAQ TIVCPTAVRP 
DSPEHYVETA RRLHREIPGS FMLNQYDNPL NAEAHFHTTG PEIWEALGGR ITAFVSSGST 
GGTISGIGGY LRSKNPDIHV VLLDPVGSIY HKYFHEGVVD PREIAAYHVE GVGEDHLAKC 
MDFSVLTNVI RFNDRNAIQM CHELARKEGL LCGGSSGANI WGCIEVAKAL KPPAVIVTVL 
PDSGAKYVSK IYNADWLAEQ RFADGSSATV SMRSPAPSDA