Gene Rpal_2745 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_2745
Symbol
ID	6410409
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	2986701
End bp	2987948
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	63%
IMG OID	642712621
Product	cysteine desulfurase, SufS subfamily
Protein accession	YP_001991729
Protein GI	192291124
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTACGC ATCCTGCAGT GAGAAACGGC AGTTACGACG TCGACCTCGT CCGTGAAGAC 
TTTCCGGCGT TGGCGCTGGA GGTCTATGGC AAGAAGCTGG TGTATCTCGA CAACGCCGCC 
TCGGCGCAGA AGCCGCGGCA GGTGCTGACG CGGATGACGC AGGCGTATGA GAGTGAATAC 
GCCAACGTGC ATCGCGGCCT GCATTATCTC GCCAATGCCG CGACAGAAGC CTATGAGGGC 
GGCCGCACTC GGGTGCAACA TCTGCTCAAC GCCAAGCGGC CGGAAGAGAT CATCTTCACC 
CGCAATGCCA CCGAGGCGAT CAACCTCGTG GCATCGTCGT GGGGTGCGAC GAACATCGGC 
GAGGGCGACG AGATCGTGCT CTCGATCATG GAGCACCATT CGAACATCGT GCCGTGGCAC 
TTCCTGCGCG AGCGCCAGGG CGCCGTGCTG AAATGGGCGC CGGTCGACGA CGAAGGCAAC 
TTCCTGATCG ACGAGTTCGA GAAGCTGCTG ACCGCCAAGA CCAAGCTGGT CGCGATCACG 
CAGATGTCGA ACGCGCTCGG CACCGTCGTC CCGGTCAAGG AGGTGGTGAA GATCGCCCAT 
GCCCGCGGCA TTCCGGTGTT GGTCGACGGC AGCCAGGCAG CGGTGCATCT CGCCATCGAC 
GTCCAGGACA TCGATTGCGA TTTCTATGTG ATGACCGGGC ACAAGATCTA CGGCCCGACC 
GGGATCGGCG CGCTGTACGG CAAGTACGAC GTCCTCGCCA AGATGCGGCC CTACAACGGC 
GGCGGCGAGA TGATCCGTGA GGTCGCCCAG GACTGGGTGA CCTACGGCGA CCCGCCGCAT 
CGATTCGAGG CCGGCACGCC GGCGATCGTC GAGGCGGTCG GGCTCGGCGC CGCGATCGAC 
TACGTCAATT CGATTGGCAA GGAACGGATC GCCGCCCACG AACACGATCT TTTGACCTAT 
GCGGAGGAGC GGCTGCGGGA GATCAACGCG CTGCGCATCA TCGGCAGCGC AAAGGGCAAG 
GGACCGGTGA TTTCCTTCGA AATGAAGGGG GCTCACCCGC ACGACGTCGC CACCGTGATC 
GATCGGCAGG GCATCGCGGT CCGTGCCGGC ACCCATTGCG TGATGCCGCT GCTGGAGCGG 
TTCCAAGTCA CTGCGACGTG CCGTGCGTCG TTCGGCATGT ATAATACCCG TGAGGAAGTG 
GACCAACTCG TCAGTGCGCT GATCAAGGCG CGGGATCTGT TCGCATGA

Protein sequence

MSTHPAVRNG SYDVDLVRED FPALALEVYG KKLVYLDNAA SAQKPRQVLT RMTQAYESEY 
ANVHRGLHYL ANAATEAYEG GRTRVQHLLN AKRPEEIIFT RNATEAINLV ASSWGATNIG 
EGDEIVLSIM EHHSNIVPWH FLRERQGAVL KWAPVDDEGN FLIDEFEKLL TAKTKLVAIT 
QMSNALGTVV PVKEVVKIAH ARGIPVLVDG SQAAVHLAID VQDIDCDFYV MTGHKIYGPT 
GIGALYGKYD VLAKMRPYNG GGEMIREVAQ DWVTYGDPPH RFEAGTPAIV EAVGLGAAID 
YVNSIGKERI AAHEHDLLTY AEERLREINA LRIIGSAKGK GPVISFEMKG AHPHDVATVI 
DRQGIAVRAG THCVMPLLER FQVTATCRAS FGMYNTREEV DQLVSALIKA RDLFA