Gene Sare_2122 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2122
Symbol
ID	5704748
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2444790
End bp	2446097
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	70%
IMG OID	641271607
Product	SufS subfamily cysteine desulfurase
Protein accession	YP_001536978
Protein GI	159037725
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0104519
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0677
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACCGGA CCGCACCGAC CCAGGAGGGT GGCTCGTTGA CCCGGCCCGA CCCCGCGCCA 
CCGGGGTCCG AGATCGGCCG GCTCCGGGCC GACTTTCCGA TCTTCGGTAG GCGGGTGCAC 
GGTCACCCGC TGGTGTATTT GGACTCGGCC AGTACCTCCC AGATACCGCT ACCGGTACTC 
GACCGGATGC GGCGGCACGA ACAGTGGCAC AACGGGAACG TGGGCCGTGC CGTCCACACC 
CTGGGTAGCG AGGCCACCGA GGCGTACGAG GAGGCCCGCG CCAAGCTCGC CGCGTTCATC 
GACGCCCGGT CGCCCGATGA GATCGTGTTC ACCCGTAACA CCACCGAGGC GATCAACCTG 
GTGGCACACG CGTTCGGCGG CGCGGGCGGC GGTGACCAGC GGTTCCGCCT GGGCCCCGGC 
GACGAGATAG TGGTCTCGGA GATGGAGCAT CACTCCAACC TCGTGCCGTG GCAGTTGCTG 
TGTCAGCGCA CCGGCGCCAC GCTCCGCTGG ATCGGACTCA CCGACGACGG CCGCCTGGAC 
CTGTCCGGCC TCGATGAGCT GATCAACGAG CGCACCCGAC TGGTGTCGTA CGTGCACGTC 
TCGAACATCC TCGGCACGGT CAACCCCACC CGGCCGATCG TCGACCGCGC TCGTGCCGTC 
GGTGCGATCA CCATGTTGGA TGCCTCCCAG TCCGTGCCGC ACATGCCCGT TGACGTCGCC 
GCCCTGGATG TCGACTTCGT GGCCTTCACC GGGCACAAGA TGTGCGGCCC GACTGGCATC 
GGCGCACTGT GGGGCCGGGC TGACCTACTG GAGGTGATGC CGCCGTTCCT GGCCGGAGGC 
GGCATGGTCG GGACGGTGTC GATGGAGGGC ACGGCCTTCG TGCCGCCGCC GGCCCGGTTC 
GAGGCGGGCA CACCGGCGAT CACCCCGGCG GTCGGGCTCG GCGCCGCGGT GGACTACCTG 
TCAGCGGTGG GTATGGCCGC GGTGCACCGC CACGAACAGC AGCTCACGGC GTATGCGCTG 
GCCGCGCTCG CCGAGGTGCC GGGGCTGCGG GTATTCGGTC CGACCGATCC GGCGCACCGC 
GGCGGTACGA TCTCCTTCGC CGTGCAGGGG GTGGACCCGA CCGTTGTCGG GCGACAGCTC 
GACGCGGTCG GGGTGCAGGT GCGCGTCGGC CGGCACTGCG CTGGGCCGGT GTGTGCCCGG 
TACGGCGTAC CAGCCATGGC CCGGGCCTCC TTCTACCTGT ACACGACGAC GGACGACGTC 
GACGCGCTGG TCACGGCCCT CGCGGACATC CGCCGGCGGT TCGGGTAG

Protein sequence

MNRTAPTQEG GSLTRPDPAP PGSEIGRLRA DFPIFGRRVH GHPLVYLDSA STSQIPLPVL 
DRMRRHEQWH NGNVGRAVHT LGSEATEAYE EARAKLAAFI DARSPDEIVF TRNTTEAINL 
VAHAFGGAGG GDQRFRLGPG DEIVVSEMEH HSNLVPWQLL CQRTGATLRW IGLTDDGRLD 
LSGLDELINE RTRLVSYVHV SNILGTVNPT RPIVDRARAV GAITMLDASQ SVPHMPVDVA 
ALDVDFVAFT GHKMCGPTGI GALWGRADLL EVMPPFLAGG GMVGTVSMEG TAFVPPPARF 
EAGTPAITPA VGLGAAVDYL SAVGMAAVHR HEQQLTAYAL AALAEVPGLR VFGPTDPAHR 
GGTISFAVQG VDPTVVGRQL DAVGVQVRVG RHCAGPVCAR YGVPAMARAS FYLYTTTDDV 
DALVTALADI RRRFG