Gene BURPS1106A_1016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1016
Symbol	cysD
ID	4899735
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	992932
End bp	993897
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	68%
IMG OID	640134246
Product	sulfate adenylyltransferase subunit 2
Protein accession	YP_001065296
Protein GI	126453969
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0175] 3'-phosphoadenosine 5'-phosphosulfate sulfotransferase (PAPS reductase)/FAD synthetase and related enzymes
TIGRFAM ID	[TIGR02039] sulfate adenylyltransferase, small subunit

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACGA CGCTCGAACA ATCCGCTTTT GCCCCGTCCG CCGGCGCGTC GACGAGCCGG 
ATGGGCCATC TCGACTGGCT CGAGGCCGAG TCGATCCACA TCCTGCGCGA GCTCGTCGCG 
GAATGCAGCA AGCCGGCGCT GCTGTTCTCG GGCGGCAAGG ATTCGGTGGT CGTGCTGCAT 
CTCGCGCTCA AGGCGTTCGG GCTCGGCGCG AACCGCAGGA CGACGCTGCC GTTTCCGCTC 
GTGCACATCG ACACGGGCCA CAACTACGAC GAGGTGATCG ATTTCCGCGA CCGCCGCGCG 
AAGCAGATCG GCGCGGAGCT GGTGGTCGGC CACGTCGAGG ATTCGATCGC GCGCGGCACG 
GTGGTGCTGC GCCGCGAGAC GGATTCGCGC AACGCCGCGC AGGCGGTCAC GCTGCTCGAG 
ACGATCGAGC GGCACGGCTA CACGGCGATG ATCGGCGGGG CGCGGCGCGA CGAAGAGAAG 
GCGCGGGCGA AGGAGCGGAT TTTCTCGTTT CGCGACGAAT TCGGCCAGTG GGACCCGAAG 
GCGCAGCGCC CGGAGCTGTG GAGCCTGTAC AACGCGCGGC TGCACCGGGG CGAACACCTG 
CGGGTGTTCC CGATCTCGAA CTGGACGGAG CTCGACGTGT GGCAGTACAT CGCGCGCGAG 
AAGCTGGAAC TGCCGTCGAT CTACTACGCG CATCGCCGGG AGATCGTGCG GCGCAACGGG 
CTGCTCGTGC CGGTGACGCC GCTCACGCCG ATGCGCGAGG GCGAGACGAG CGAGCAGGCG 
CTGGTGCGGT TCCGCACGGT GGGGGACATT TCGTGCACGT GCCCGGTCGA GAGCGACGCG 
GACGACGTGG AGAAGATCAT CGCGGAGACG GCGGTGACGG AGATCACGGA GCGCGGGGCG 
ACGCGGATGG ACGACCAGGC GTCGGAGGCC GCGATGGAGC AGCGCAAGAA GCAGGGCTAT 
TTCTGA

Protein sequence

MSTTLEQSAF APSAGASTSR MGHLDWLEAE SIHILRELVA ECSKPALLFS GGKDSVVVLH 
LALKAFGLGA NRRTTLPFPL VHIDTGHNYD EVIDFRDRRA KQIGAELVVG HVEDSIARGT 
VVLRRETDSR NAAQAVTLLE TIERHGYTAM IGGARRDEEK ARAKERIFSF RDEFGQWDPK 
AQRPELWSLY NARLHRGEHL RVFPISNWTE LDVWQYIARE KLELPSIYYA HRREIVRRNG 
LLVPVTPLTP MREGETSEQA LVRFRTVGDI SCTCPVESDA DDVEKIIAET AVTEITERGA 
TRMDDQASEA AMEQRKKQGY F