Gene Rcas_0306 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0306
Symbol
ID	5537768
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	381822
End bp	383066
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	62%
IMG OID	640892470
Product	SufS subfamily cysteine desulfurase
Protein accession	YP_001430457
Protein GI	156740328
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0801844
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCAA GCGCCGCTCT GAGCCTGTTC GATATCGTCG CACTGCGGCG GGAGTTCCCG 
ATTCTCAATC AGTCGGTGAA TGGTAAGACG CTGGCGTTTC TCGATAGCGC TGCGTCGTCG 
CAAAAGCCGC GCCGTGTGAT CGATTGCCTC GAGGAGTATT ATCGGCGCTA CAACGCGAAT 
GTGCATCGTG GCATTTACCG CCTGAGCGAA GAGGCGACGT TTGCCTTCGA GCGGGCGCGC 
GGCAAGGTGG CGCGTTTCAT CAATGCTCGC AGCCAGCGCG AGATCGTCTT TGTGCGGAAT 
ACGACTGAGG CGATCAATCT GGTGGCGCGC AGTTGGGGTG ATGCAAACCT GCGCGCGGGG 
GATCGTATTC TGCTCAGTAT CATGGAGCAC CACTCGAACC TGGTGCCCTG GCAGATGCTG 
GCGCAGCGTA CCGGCGCGCA ACTGGAGTTC CTGCCGATCG ATGGCGAAGG TCGCCTGGCG 
CTCGACCATC TGGACGCGCA ACTCGCAGGG GTGCGCCTGG TGGCGATTAC GCAGCAGTCG 
AATGTGTTGG GAACGATCAA TCCGGTGGCG GAGATTGCAC GGCGCGCGCA CGCTTGCGGC 
GCGCTCGTGC TGGTGGACGG CGCGCAGAGC GTACCGCATA TGCCAGTGGA CGTGCAGGCG 
CTCGATATCG ATTTCCTGGC GTTCAGCGGG CATAAAATGT GCGCTCCGAC CGGCATCGGC 
GTGCTGTGGG GGCGGCGTGC AATCCTGGAG CAGATGCCGC CGTTCCTTGG CGGCGGTTCG 
ATGATCAGGG TGGTGGGGCT GCACGAATCG ACATACGCCG ACGTTCCGGC GCGCTTCGAG 
GCGGGAACGC CGGCGATTGC CGAGGCGATT GCGCTCGGTG AGGCGGTTGA TTTTCTGCAA 
GAGATCGGCA TGGATCGAAT CTCCGCCCAC GAGCGCGAAT TGCTGGGGTA TGCGCTTGAA 
CGCCTGAGCG AAGTCGAAGG GCTGCGGGTG TATGGTCCGA CAACGACCGA GATGCGCGGC 
GGCGCGGTGA GTTTCACGCT CGACGGCGTG CATCCGCACG ATGTTGCGGC AGTGCTCGAC 
AGTGAGGGGA TTGCAGTGCG CGCCGGGCAT CACTGTGCGC AACCGTTGCA CGCGCACTAC 
GATATTCCTG CTACTACGCG CGCATCGTTC TATCTGTACA ACATTCCAGA AGAGGTTGAT 
CGACTGGTTG CCGCGCTGCA CAAGGCGCGC ACCCTGTTCG GGTGA

Protein sequence

MTASAALSLF DIVALRREFP ILNQSVNGKT LAFLDSAASS QKPRRVIDCL EEYYRRYNAN 
VHRGIYRLSE EATFAFERAR GKVARFINAR SQREIVFVRN TTEAINLVAR SWGDANLRAG 
DRILLSIMEH HSNLVPWQML AQRTGAQLEF LPIDGEGRLA LDHLDAQLAG VRLVAITQQS 
NVLGTINPVA EIARRAHACG ALVLVDGAQS VPHMPVDVQA LDIDFLAFSG HKMCAPTGIG 
VLWGRRAILE QMPPFLGGGS MIRVVGLHES TYADVPARFE AGTPAIAEAI ALGEAVDFLQ 
EIGMDRISAH ERELLGYALE RLSEVEGLRV YGPTTTEMRG GAVSFTLDGV HPHDVAAVLD 
SEGIAVRAGH HCAQPLHAHY DIPATTRASF YLYNIPEEVD RLVAALHKAR TLFG