Gene RoseRS_3113 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_3113
Symbol
ID	5210081
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	3910455
End bp	3911702
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	59%
IMG OID	640596704
Product	cysteine desulfurase family protein
Protein accession	YP_001277426
Protein GI	148657221
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01976] cysteine desulfurase family protein, VC1184 subfamily

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000139968
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.00618461
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCACCCCC TCGATCTGAC CTGGATTCGC GCACAGTTTC CTGCGCTGGC GCAAGAAGTG 
AATGGACATC CCGCCGTGTT TTTTGATGGT CCAGGCGGAA CGCAGGTTCC GCAGCGGGTG 
ATCGATGCTG TCGCCGATTA TCTGATCCAC CACAATGCCA ATACTCATGG CGCATTTGCA 
ACCAGTCGCC GCACTGATGA AACGATTGAC GCGGCGCGCG CCGCTATGGC TGATTTTCTG 
GGGTGTGCTG CGGACGAGGT GGTTTTCGGA CCAAACATGA CCACGCTGAC CTTTGCGATC 
AGCCGCGCAT TTGGGCGTGA CATTCGCCCC GGTGATGAGA TTGTCCTGAC GCGCCTGGAT 
CATGATGCCA ACGTCGCACC CTGGAAAGCG CTCGAAGAAC AGGGCGCCGT CATTCAGATG 
GTCGATATCG ACACCGAAGA ATGCACCCTC GATATGGCGG ATATGGCGCG CGCCATCGGT 
CCACGCACGA AACTCGTCGC GGTCGGGTAT GCGTCGAACG CCGTGGGAAC GATCAACGAC 
GTGGCGACCA TCACACGGAT GGCGCACGCG GTCGGTGCAC TGGTGTATAT CGATGCAGTG 
CACTACGCCC CGCACGGACC AATCGATGTG CGGGCGCTCG ATTGCGATTT TCTCGCGTGC 
TCGCCGTACA AATTCTTTGC ACCGCATATG GGAGTTTTAT ACGGCAAACG TGAGCACCTG 
GCGCGCCTGC GTCCGTATAA GGTTCGACCC GCCTCTGACG ATGTTCCTGA TCGCTGGGAA 
ACTGGAACCA AAAACCACGA AGGGTTAGCC GGGGTAACGG CGGCAATCGA GTACCTGGCA 
GAACTTGGGC AGCGCATCAA GCCAGCGACG ACCCGACGCG CGGCGCTGGT GCAGGCGATG 
GAAGCGATCA AAGCGTATGA ACGCGGATTA TCGGAGCAAC TGATCGCCGG TCTCCTTGCA 
ATTCCGGGAT TGACCTTCTA CGGTATCAGC GACCCGGCGC GTTTCGACAT GCGCACGCCG 
ACCGTGGCAG TGCGTCTTGC CGGACGCACA CCGCGCGAAC TTGCCGAAGC GCTGGGACGG 
CGCGGCATCT TCTGCTGGGA CGGCAACTAC TACGCGATCA ATCTGACCGA GCGCCTGGGC 
GTTGAAGCTG ATGGCGGCAT GCTGCGTATT GGTCTGGTGC ACTACAACAC CGTGGAAGAG 
ATCGAACTAT TGCTGGAAGC GCTGAACGAA CTGAGGATCG GGAACTGA

Protein sequence

MHPLDLTWIR AQFPALAQEV NGHPAVFFDG PGGTQVPQRV IDAVADYLIH HNANTHGAFA 
TSRRTDETID AARAAMADFL GCAADEVVFG PNMTTLTFAI SRAFGRDIRP GDEIVLTRLD 
HDANVAPWKA LEEQGAVIQM VDIDTEECTL DMADMARAIG PRTKLVAVGY ASNAVGTIND 
VATITRMAHA VGALVYIDAV HYAPHGPIDV RALDCDFLAC SPYKFFAPHM GVLYGKREHL 
ARLRPYKVRP ASDDVPDRWE TGTKNHEGLA GVTAAIEYLA ELGQRIKPAT TRRAALVQAM 
EAIKAYERGL SEQLIAGLLA IPGLTFYGIS DPARFDMRTP TVAVRLAGRT PRELAEALGR 
RGIFCWDGNY YAINLTERLG VEADGGMLRI GLVHYNTVEE IELLLEALNE LRIGN