Gene BURPS668_2706 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_2706
Symbol	sufS
ID	4885346
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	2678763
End bp	2680004
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	72%
IMG OID	640128634
Product	cysteine desulfurase SufS
Protein accession	YP_001059730
Protein GI	126441575
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.994563
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTGACA TGCTGCGTTC GGCCACGATG ATGGCGAGCG CGTTTCCGGC GCTTGCGCAG 
CGCGTGAACG GCGCGCCGCT CGCGTATCTC GACAACGCGG CGACGACGCA CGTGCCGCAG 
CCCGTCCTCG CCGCGATGCG CGGCTTCGAC GAGCGCGATC GCGCGAACAT CCACCGCGGC 
ATCCACACGC TCAGCCAGCG GGCGACCGAC GCTTACGAAC GCGCGCGCGA CACGCTCGCG 
CGCTTCGTCG GCGCGAACGG CGAGCACCTG CTCGTCTTCA CGTCGGGCGC AACCGATGCG 
CTGAATCTCG TCGCGAATGG GCTATCGGTT GCCGGCCACA CGCAAGCCGT GCTGCAGGAA 
GGCGACGAGA TCATCGTCAG CGCGCTCGAG CATCACGCGA ACCTCGTGCC GTGGCAGATG 
GCCGCGCGCC GTTGCGGCGC GAAGCTGCGG ATCCTGCATC CGGATCCGCA GGGCAGCCTG 
CATGTTCGGG ACCTCGAACG ATTGCTGGGG CCGCGCACGC GCGTGTTCGC GGTCACCGCG 
TGCTCGAACG CGACGGGCGA GCGGCCGCCG TACGAGGCGC TGCTCGCGGC CGCGCGCGCG 
GGCGGCGCGC TGACGGTGCT CGACGCGGCA CAGGCGGTCG GCCACGACGT GCCCGATCTG 
TCCGCGCTCG CGTGCGACTT CGCCGCGTTC TCCGGCCACA AGATGTACGG GCCGATGGGC 
ACCGGCGCGC TCGTCGGCCG CCGGGACGCG CTCGAGCGGC TCGTCCCGCT GCGCTTCGGC 
GGCGACATGG TGAGCTGGGT GGGCGAGACG GACGCGACAT TCGACGCGCT GCCCGCGCGG 
CTCGAAGGCG GCACGCCGAA CGTCGCGGGC GCGGTCGGCA TCGCGGCGGC CGCCGACTAT 
ATCGACGCGA TCGGCCGCGC CCGGATCGAC GCCCACGTGC GCGCACTGCG CGATCACGCG 
GCCGCGGGCC TCGCGGCGCT CGACGGCGTG ACCGTGCTCG CGCCGCGCAC GTCGTCGGCG 
ATCGTATCCT TCGTCGTCGA CGGCGTGCAT CCGCACGACA TCGGCACATT GCTCGACGAG 
CGCGGCATCG CCGTGCGCAC GGGCTTTCAC TGCGCGCAGC CGCTGCTCGA ACGGCTCGGC 
TGCGGGCCGA CGACGCGCGC GTCGTTCGCG CTCTACAACA CGCACGACGA AGTCGAGCGC 
CTCGTCGCGG GCGTCGCGCA AGCACTGAAG GTGTTGAGAT GA

Protein sequence

MGDMLRSATM MASAFPALAQ RVNGAPLAYL DNAATTHVPQ PVLAAMRGFD ERDRANIHRG 
IHTLSQRATD AYERARDTLA RFVGANGEHL LVFTSGATDA LNLVANGLSV AGHTQAVLQE 
GDEIIVSALE HHANLVPWQM AARRCGAKLR ILHPDPQGSL HVRDLERLLG PRTRVFAVTA 
CSNATGERPP YEALLAAARA GGALTVLDAA QAVGHDVPDL SALACDFAAF SGHKMYGPMG 
TGALVGRRDA LERLVPLRFG GDMVSWVGET DATFDALPAR LEGGTPNVAG AVGIAAAADY 
IDAIGRARID AHVRALRDHA AAGLAALDGV TVLAPRTSSA IVSFVVDGVH PHDIGTLLDE 
RGIAVRTGFH CAQPLLERLG CGPTTRASFA LYNTHDEVER LVAGVAQALK VLR