Gene BURPS668_1850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1850
Symbol	cysA
ID	4882970
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	1811421
End bp	1812476
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	72%
IMG OID	640127778
Product	sulfate/thiosulfate ABC transporter, ATP-binding protein
Protein accession	YP_001058885
Protein GI	126441598
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1118] ABC-type sulfate/molybdate transport systems, ATPase component
TIGRFAM ID	[TIGR00968] sulfate ABC transporter, ATP-binding protein

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.515389
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCATCA CCGTTCGTAA TCTGCACAAA CGCTTCGGCG AGTTCGCCGC GCTCGACGAC 
GTCTCGCTCG ATTTCCCCGC GGGTGAGCTC GTCGCGCTGC TCGGCCCGTC CGGCTGCGGC 
AAGACGACGC TGTTGCGCGT GATCGCGGGC CTCGAGCACG CGGATTCGGG GCAGGTCGTG 
CTGCAAGGGC TCGACGTCGC GTCGGTCGGC GCGCGCGAGC GGCAGGTCGG CTTCGTGTTC 
CAGCACTATG CGCTGTTCCG CCACATGACG GTGTTCGAGA ACGTTGCGTT CGGGCTGCGC 
GTGAAGCCGC GCCGCGAGCG GCCGAGCGAG GCGGCGATCC GCGCGAAGGT GCATGAGCTG 
CTCTCGCTCG TGCAGCTCGA CTGGCTCGCG CAGCGCTATC CGTCCGAGCT GTCGGGCGGG 
CAGCGGCAGC GGATCGCGCT CGCGCGCGCG CTCGCCGTCG AGCCGAAGGT GCTGCTGCTC 
GACGAGCCGT TCGGCGCGCT CGACGCGAAG GTGCGCAAGG AGCTGCGCGG CTGGCTGCGC 
CGGCTGCACG ACGATCTGCA CATCTCGACG ATCTTCGTCA CGCACGATCA GGAGGAGGCG 
CTCGAGGTGG CCGACCGGAT CGTCGTGCTC AATCACGGCC GCGTCGAGCA GGTCGGCAGC 
CCGCAGGCGG TCTACGATCA TCCGCGCAGC GCGTTCGTCT ACGAGTTCCT CGGCGCGGCG 
AACCGGCTCG ACGGCACGGT GAGCGGCAAC GGTTTCGTCG CGCACGGCGC GGCGCAGGCG 
ATCGCCGTCG ACGCGGATTT CGCGGGCCCG GCGCGCGCGT ATGTGCGCCC GCACGATCTG 
GAGCTCGCCG CGCCGCACGC GCGCGCGCAA GGCATCGCGG CCGACGTGCG GCGCGTCGTG 
CCGCTCGGCG GCTCGGTGCG GGTGGAGCTC GCCGCGCGCT CCGGCGAGGT GCTCGAGGCG 
GAGCTCGATC GCAACGCATG GCGCGCGCTC GCGCTCGACG TCGGCGACGC GCTGACCGCC 
GTGCCGCGCG CGGTGCGCGT GTTCCCGGCG CGCTGA

Protein sequence

MGITVRNLHK RFGEFAALDD VSLDFPAGEL VALLGPSGCG KTTLLRVIAG LEHADSGQVV 
LQGLDVASVG ARERQVGFVF QHYALFRHMT VFENVAFGLR VKPRRERPSE AAIRAKVHEL 
LSLVQLDWLA QRYPSELSGG QRQRIALARA LAVEPKVLLL DEPFGALDAK VRKELRGWLR 
RLHDDLHIST IFVTHDQEEA LEVADRIVVL NHGRVEQVGS PQAVYDHPRS AFVYEFLGAA 
NRLDGTVSGN GFVAHGAAQA IAVDADFAGP ARAYVRPHDL ELAAPHARAQ GIAADVRRVV 
PLGGSVRVEL AARSGEVLEA ELDRNAWRAL ALDVGDALTA VPRAVRVFPA R