Gene BURPS1106A_2016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2016
Symbol	argG
ID	4902486
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	1978941
End bp	1980155
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	66%
IMG OID	640135246
Product	argininosuccinate synthase
Protein accession	YP_001066281
Protein GI	126451449
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0137] Argininosuccinate synthase
TIGRFAM ID	[TIGR00032] argininosuccinate synthase

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000804601
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACCCA AACACATTCT CCTCGCTTAT TCCGGCGGCC TCGACACGTC CACCGCGCTG 
CACTTCCTGA AGCGGCATTT CGATTGCCGC GTCACCGCCT ATTGCGCGAA CCTCGGGCAG 
AAGGAGGATT GGGAGCGGAT GAAACGCCGC GCGGCGATCG CCGGCGCGGA CGAGCTGGTC 
ATCGAGGATC TGCGCGAGAC GTTCATCGGC GATTTCGTGT TTCCCGCACT GAAGGCGAAC 
GCGTCGTACG AGCGGGACTA TCTGCTCGGC ACGCCGCTCG CCCGCCCGGC GATCGTCAAG 
GGGCTCATCG AGTACGCGCG CAAGCACGAC GTCGATTGCC TGTCGCACGG CTGCACGCAG 
AAGGGCAACG ATCAGGTGCG CTTCGAGATG GCCGCGAAGA TTCTCGCGCC CGATCTGCCG 
ACGGTCGCGC CGTGGCGCAT CTGGTCGCTG CAGTCGCGCG AGGATCTGTT CGCGTATTGT 
CAGCAGCACG GCATTCCGGT CGAAAGCCGT CCGGACAATC TGTTGAGCCA CGACGAGAAT 
CTCGTGCACA TCACGACGGA GGGCGACTAT CTGGAGAGCG TCGCGAACGC GTTCGACTGG 
CGCGACGCGA ACTGGATCAC GCCGCCCACG CAAGCGCCGG ATGCGATCGA GACGATCACG 
CTCGGGTTCC GCCGGGGCGT GCCCGTCAGC GTCGACGGCG CGGCGCTCGG GCCGGTCGAG 
CTGGTCGAGC GGCTCAACGA AGCGGGCGCC CGCAACGGCG TCGGCTTCCA GGACATCATC 
GAGAACCGCA TCAACGGCCT GAAGGTGCGC GGCGTGTTCG AGAACCCCGC GCTGACGATC 
CTGCACGCCG CGCATCGCAA GCTCGAGAAG ATCACGCTCG GCCGCGACGT CGAGCGCCTG 
CGCAACCTCG TGTCGGACGA CTACGGCGAC ATCGTCTACC GCGGCCTGTG GTTCAGCGAC 
GAGCGGCTCT GCCTGCAGGC GCTCATCGAC GAATCGCAGA AGTACGTGAG CGGCGACGTG 
AAGGTTCAGC TCTACAAGGG TTCGTGCACG CCGTGCGCCG TCGAATCGGA GCAGTCGCTT 
TATTCGCGCG AGCTCGTGAC GCTGCACGCG GGCCGCGCGA TCAGCGGCGA GGACGCGACG 
GGCTTCCTGA ACACGCTCGG CCTGCGTATC GGCATCGAAG CCGCGCGCGC CGGCAACACG 
GGAGCCGGCG CATGA

Protein sequence

MKPKHILLAY SGGLDTSTAL HFLKRHFDCR VTAYCANLGQ KEDWERMKRR AAIAGADELV 
IEDLRETFIG DFVFPALKAN ASYERDYLLG TPLARPAIVK GLIEYARKHD VDCLSHGCTQ 
KGNDQVRFEM AAKILAPDLP TVAPWRIWSL QSREDLFAYC QQHGIPVESR PDNLLSHDEN 
LVHITTEGDY LESVANAFDW RDANWITPPT QAPDAIETIT LGFRRGVPVS VDGAALGPVE 
LVERLNEAGA RNGVGFQDII ENRINGLKVR GVFENPALTI LHAAHRKLEK ITLGRDVERL 
RNLVSDDYGD IVYRGLWFSD ERLCLQALID ESQKYVSGDV KVQLYKGSCT PCAVESEQSL 
YSRELVTLHA GRAISGEDAT GFLNTLGLRI GIEAARAGNT GAGA