Gene RPC_3637 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3637
Symbol
ID	3970652
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	4044565
End bp	4046601
Gene Length	2037 bp
Protein Length	678 aa
Translation table	11
GC content	71%
IMG OID	637926745
Product	SufS subfamily cysteine desulfurase
Protein accession	YP_533491
Protein GI	90425121
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.51832
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.140258
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAGC CTCACGCGGC CAGCGGCGCC GCGTTGCCGC CAGACCCCGC CGGCACCGCC 
TGGCCCGATC CCACGGTGAT CGCGCGGCTC GCCAATGCGC TGTTCCAGGC GCCGCCGAAC 
CAGGCGCCGC CGAGTTCGAC GGGCGCGCCG CTCGGCGCGC AGAGCATTCC GCTGGCGCCG 
CAGACCCCGA TCACCACGCC GGCGCCAACG GTGACCACGA GCGCCGCGCC ATGGGTGCCG 
GGCAATCCCT CGGCGGGTCC GCCCGACCTG CCGCCGACCA CGATCCCCTC GGTGGTGCCG 
ACGCCGAGCG TCACCGCGCC GCAGCCGCCG TCGCAGTCCT CGCTGCCGCC GGGCCTTGAG 
GTGCCGCAGC CCGGCGCGTC GCCGGGCGCG ATCGGGCCGC AGCCGATCGA TCTGCAAGCC 
GTCGATCTGC AGGGCGCCGC GCCATTCAAC CTCGGCGATG CGGTGTACTT CGCCCCGCCC 
GACCGTCGCG TCGCCGCCGA CGCGCCGAGC GGCGGCGCCG CGGCCGGTGC CGAGCCCGCC 
GCGTATTTCC TGTCGGAAGC GCCGTTCGCC TCGCATCACG CGCCGCAGCC GTCTGCCTCG 
CAATCGACCA CGCCGCCCGG CATCGCTCCG ACCGGCAGCG GCGATCCGAC TCATCTCGAC 
GCGGTGCCGA CGCAGAGCTA CCTCAGCGCC GACGCGGCGT CGCAGCCGCC GCGCGCCGAT 
CTCGGCAAGC CAAGTTCGGA CTTCGCGGTG ATGACGCCGA ATCTGCGCGC AGTGTTGACG 
CCGGCATTCG GCGGCGGCGC GCATCCGTTC GATCCGCACG CCATCAAACG CGACTTCCCG 
ATCCTGCAAA CGCGGGTGCA TGGCAAGCGG CTGGTCTGGC TCGACAACGC CGCCACCACG 
CAGAAGCCGC AGGCGGTGAT CGACCGCCTG GCGCACTTCT ACAGCCACGA GAATTCCAAC 
ATCCACCGCG CCGCGCACGA GCTCGCGGCG CGCTCCACCG ACGCCTATGA GGCGGCGCGC 
GAAAAAGTCC GCCGCTTTCT CGGCGCGCCC TCGCCGCGCG ACATCATCTT CGTGCGCGGC 
GCTACCGAGG GCATCAACCT GGTGGCGCAG GCCTGGGGCC GCCGCAACAT CGGCGAAGGC 
GACGAGATCG TGGTGTCGTG GCTCGAGCAC CACGCCAACA TCGTGCCCTG GCAGCAGCTC 
TGCGCCGAGA AAGGCGCGCG GCTGCGCGTC GCGCCGGTCG ACGACCACGG CCAGATCATC 
CTTGAAGAGT ATGAGAAGCT GCTCGGGCCG AACACCAAGC TGGTGTCGAT CACCCAGGTC 
TCCAACGCGC TCGGCACCGT CGTCCCGGTC ACCGAGATCA CCGCGATCGC GCATCGCCAC 
GGCGCTTGCG TGCTGATCGA CGGCGCGCAA TCGGTGTCGC ACATGCCAGT CGACGTGCAG 
GCGATCGGCT GCGACTTCTT CATATTCTCC GGCCACAAGG TGTTCGGGCC GACCGGGATC 
GGCGCGGTCT ATGGCAAGGA TTCCGTGCTC GCCCACATGC CGCCGTGGCA GGGCGGCGGC 
AACATGATCG CCGACGTCAG CTTCGAGAAG ACCATCTATC AGGGACCGCC CGACCGCTTC 
GAGGCCGGCA CCGGCAACAT CGCCGACGCG GTCGGCCTCG GCGCCGCGAT CGACTACGTC 
GAGGCGATCG GCATGGCGGC GATCGAACGC TACGAGCACG AGTTGCACGG CTACGCCACC 
GAACGGATGC AGGGCGTCCC CGGGCTGAAG ATGATCGGCA CCGCCAAGGA CAAGGCCAGC 
GTGCTGTCGT TCGTGCTCGA CGGCCACAAC CCGGTCGACG TCGGCAAGGC GCTCGACCAG 
GACGGCATCG CGGTGCGCGC CGGTCATCAC TGCGCGCAGC CGATCCTGCG GCGGTTCGGG 
CTGGAAGCCA CGGTGCGACC GTCGCTGGCG TTCTACAACA CCTGCGAGGA CGTCGACGCG 
TTGGTGGCGG CGTTGCAGCG GCTGCAGAGC GGCGCCCCGC GCGGGCGGGT GGTGTAG

Protein sequence

MSEPHAASGA ALPPDPAGTA WPDPTVIARL ANALFQAPPN QAPPSSTGAP LGAQSIPLAP 
QTPITTPAPT VTTSAAPWVP GNPSAGPPDL PPTTIPSVVP TPSVTAPQPP SQSSLPPGLE 
VPQPGASPGA IGPQPIDLQA VDLQGAAPFN LGDAVYFAPP DRRVAADAPS GGAAAGAEPA 
AYFLSEAPFA SHHAPQPSAS QSTTPPGIAP TGSGDPTHLD AVPTQSYLSA DAASQPPRAD 
LGKPSSDFAV MTPNLRAVLT PAFGGGAHPF DPHAIKRDFP ILQTRVHGKR LVWLDNAATT 
QKPQAVIDRL AHFYSHENSN IHRAAHELAA RSTDAYEAAR EKVRRFLGAP SPRDIIFVRG 
ATEGINLVAQ AWGRRNIGEG DEIVVSWLEH HANIVPWQQL CAEKGARLRV APVDDHGQII 
LEEYEKLLGP NTKLVSITQV SNALGTVVPV TEITAIAHRH GACVLIDGAQ SVSHMPVDVQ 
AIGCDFFIFS GHKVFGPTGI GAVYGKDSVL AHMPPWQGGG NMIADVSFEK TIYQGPPDRF 
EAGTGNIADA VGLGAAIDYV EAIGMAAIER YEHELHGYAT ERMQGVPGLK MIGTAKDKAS 
VLSFVLDGHN PVDVGKALDQ DGIAVRAGHH CAQPILRRFG LEATVRPSLA FYNTCEDVDA 
LVAALQRLQS GAPRGRVV