Gene BURPS1106A_2021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2021
Symbol
ID	4901612
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	1984387
End bp	1985514
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	70%
IMG OID	640135251
Product	cysteine synthase
Protein accession	YP_001066286
Protein GI	126452738
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0031] Cysteine synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGACA TCATGACCCA GACATTCGAC AGGCCCGCCA TCCCGGTGTA CGACAGCGTA 
TCCGGCTCGC TCGACCATCC GGACCTGATC CGGCTCGCGC CGGGGCTCGT CGCGGCGGCG 
TTCCGGCTGA TGAAGCTCGT GCCCGCGAAG TACATCATCG AGAACGCGAT CGCGAGCGGG 
CAGTTGAATC CCGGGATGCC GGTGCTCGAG ACGTCGAGCG GCACGTTCGC GATGGGCATC 
GGGATCGTCT GCGCGGAAAA GCGCATTCCG TTTCACATCG TCAGCGACGC GGCGATCGAC 
GAACGGCTGC AGGCGCGCCT GCGGCAGTTG GGCGGGCGCG TGCAGATCGT CGGGGCGAAC 
GCGACCGGCT CCAACGTCCA GGTGCTGCGG CTCGAAGCGC TGCAGGAGCG GTTGCGCGAG 
AACCCCGGCG GCTTCTGGCC GCGGCAGTAC GACAATCCGG ACAATCAGCA CGCGTACCGC 
GCGTTCGCCG CGCAACTGAT CCGCACGTTC GGCACGAATC TCACGATCGT CGGCACGGTC 
GGCTCCGGCG CGTCGACGTG CGGCACGATC CGGGCGCTGC GCGAGGTCGA TCCGTCGATT 
CCGCTCGTCG GCGTCGATAC GTTCGGCAGC GTGCTGTTCG GGCTGCCCGT CGGCCCGCGC 
GCGCTGCGCG GCCTCGGCAA TTCGATCTAT CCGAACAACC TCGACCACAC GTGCTTCGAC 
CAGGTGCACT GGGTCGCGCC CGACGAAGCC TTCGGGAGCA CGCGCCGGCT GCACCGGCAA 
CACGGGCTGT ATTGCGGGCC GACGTCCGGC GCGGCGTTCA TGGTCGCCGA ATGGCTGCGG 
GCGCAGCGCG ACGACGGCAG GACGATCGTG TTCATCGCGC CCGACGAAGG GCACCGCTAC 
GCCGACACGG TCTACGACGA CGCATGGCTG CGCGGGCAAG GGTACGCCGG CGCGGACGCC 
GCGCCGGCCG CCGCTCCCGT GCGGGCGGTG AGCCCGAACG CCGCGTCCGG CCCGTGGGCG 
TACGTCGAAT GGGGGCGCCG CACGTTCGAG CAGGCGAGCG GCCGCCCGCG TCCGGCAGGC 
AGCGCGCTCG AGCAGATCCG CGACGTCCGG CCCGCGCCCG TTGCATGA

Protein sequence

MNDIMTQTFD RPAIPVYDSV SGSLDHPDLI RLAPGLVAAA FRLMKLVPAK YIIENAIASG 
QLNPGMPVLE TSSGTFAMGI GIVCAEKRIP FHIVSDAAID ERLQARLRQL GGRVQIVGAN 
ATGSNVQVLR LEALQERLRE NPGGFWPRQY DNPDNQHAYR AFAAQLIRTF GTNLTIVGTV 
GSGASTCGTI RALREVDPSI PLVGVDTFGS VLFGLPVGPR ALRGLGNSIY PNNLDHTCFD 
QVHWVAPDEA FGSTRRLHRQ HGLYCGPTSG AAFMVAEWLR AQRDDGRTIV FIAPDEGHRY 
ADTVYDDAWL RGQGYAGADA APAAAPVRAV SPNAASGPWA YVEWGRRTFE QASGRPRPAG 
SALEQIRDVR PAPVA