Gene Rru_A3214 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A3214
Symbol
ID	3836660
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	-
Start bp	3705744
End bp	3706985
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	66%
IMG OID	637827329
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_428296
Protein GI	83594544
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCCGTG AAAGCGATTT TTCCCCCGCC CAGTCTCCGT CTCTTGAAGC GCCCACCGGC 
CCTGCGACTT GGCGGGCCGA TACGTTACTG GTGCGCGGCG GGTTGGCTCG GACTGGTTTG 
AATGAAACCA GCGAAGCGCT GTTTCTCAAT TCCGGCTATG TCTATCCCAA TGCCGAGGAG 
GCCGAGGCGG CTTTCGACGG CACGCTCGAA CGCTATGTCT ATTCGCGCTT CCGCAATCCG 
ACGATCAGCG TTTTCGAAGA GCGACTCGCC GCCCTGGAAG GGGCGCCGGT TTGCAAGGCC 
ACGGCCAGCG GCATGGCCGC CGTCACCTCG GCCCTGCTCT GTCAGGTGCG GGCGGGCGAT 
CGGGTGGTGG CGGCGCGCGA TCTGTTTGGC TCGTGCTCCT GGGTGATCGG CGATCTGCTG 
GCCCAATACG GAGTCAGCGC CGAATTCGTC GATACCGAGA ACCTTGACGC CTGGGCCCAG 
GCCCTGGCCA AGCCGACCCG GGCGGTTTTC CTGGAAACCC CGTCCAATCC GACGCTGCGC 
ATCGTCGATC TCAAGGGGGT TTGCGACCTC GCCCATGCCG CTGGGGCGAC GGTGGTGGTC 
GATAACGCCT TCGCCACGCC GCTTTTGCAG CGGCCGCGCG ACTTCGGCGC CGATGTCGTC 
GTCCATTCGG CGACCAAATG GATCGACGGC CAGGGCCGCT GCCTGGGCGG CGCCGTCCTC 
TGCGACGAGG CGTTCAACGA GACCTATCTC GGGCCGTTCC TGCGCCATAC CGGTCCCTGC 
CTCGCCCCGT TCAACGCCTG GGTCATGCTC AAGGGCCTGG AAACCCTGTC GCTGCGCATC 
AACCGCCACA GCGCGACGGC TTTGACCCTG GCCGGGCTGA TCGAAGGCCA CCCCGCGGTC 
GCCCGCGCCC TTTATCCCGG GTTGGCCAGC CATCCGCGCC ATGCCTTGGC GCAAAGCCAG 
ATGAAGGCCG GCGGCGGCGT CATCGCCCTG TCGCTGAAGG GCGGACGGGC CAGCGCCTAT 
CGCTTCCTCA ACGCGCTGTC GATCGTCGAT ATCTCGAATA ATCTGGGCGA CGCCAAATCG 
CTGGCCTGCC ATCCGTGGAC GACCACCCAC CAGCGCCTGA GCCCGGAAGA AAAACTGATC 
CAGGGCATCG ATGAAGGGCT GATCCGCTTT TCCGTCGGCT TGGAAGACCC CGAGGATCTG 
GCCGCCGACA TCGGCGCCGC CCTCGACGCC GCCGGCGGTT GA

Protein sequence

MPRESDFSPA QSPSLEAPTG PATWRADTLL VRGGLARTGL NETSEALFLN SGYVYPNAEE 
AEAAFDGTLE RYVYSRFRNP TISVFEERLA ALEGAPVCKA TASGMAAVTS ALLCQVRAGD 
RVVAARDLFG SCSWVIGDLL AQYGVSAEFV DTENLDAWAQ ALAKPTRAVF LETPSNPTLR 
IVDLKGVCDL AHAAGATVVV DNAFATPLLQ RPRDFGADVV VHSATKWIDG QGRCLGGAVL 
CDEAFNETYL GPFLRHTGPC LAPFNAWVML KGLETLSLRI NRHSATALTL AGLIEGHPAV 
ARALYPGLAS HPRHALAQSQ MKAGGGVIAL SLKGGRASAY RFLNALSIVD ISNNLGDAKS 
LACHPWTTTH QRLSPEEKLI QGIDEGLIRF SVGLEDPEDL AADIGAALDA AGG