Gene BURPS1106A_1017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1017
Symbol	cysN
ID	4901023
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	993920
End bp	995236
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	67%
IMG OID	640134247
Product	sulfate adenylyltransferase, large subunit
Protein accession	YP_001065297
Protein GI	126455060
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2895] GTPases - Sulfate adenylate transferase subunit 1
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR02034] sulfate adenylyltransferase, large subunit

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCATCA TCGAGAACAA CGAAGACCTC GGCGTACTGC GGTTCATCAC GGCGGGCAGC 
GTCGACGACG GCAAGAGCAC GCTGATCGGG CGACTGCTGT ACGACAGCAA GGCGGTGCTG 
TCCGACCAGC TCTCCGCGCT GTCGCGCGCG AAGAACAAGC GCACGGTGGG CGACGAGCTC 
GATCTCGCGC TGCTTACCGA CGGCCTCGAG GCCGAGCGCG AGCAGGGCAT CACGATCGAC 
GTCGCGTACC GCTACTTCGC GACCGCGAAG CGCAAGTTCA TCATCGCCGA CACGCCCGGC 
CACGAGCAGT ACACGCGCAA CATGGTGACG GGCGCGTCGA CCGCGCATGC GGCGATCATC 
CTGATCGACG CGACGCGCGT GACGTTCGAC GCGGGCGCGG CGCAACTGCT GCCGCAGACG 
AAGCGCCACA GCGCGATCGT CAAGCTGCTC GATCTGCAGC ACGTGATCGT CGCGATCAAC 
AAGATGGATC TCGTCGACTA CAGCGAGACG CGCTTCAACG AGATCCGCGA CGCGTACGTG 
AAGCTCGCGC AGCAGCTCGG CCTGGCCGAC GTGCGCTTCG TGCCGGTGTC GGCGTTGAAG 
GGCGACAACA TCGTCGCGGC GAGCGAGCGG ATGCCGTGGT ATGCGGGCGA GCCGTTGCTG 
AACGTGCTCG AAACGCTGCC CGTCGAGACG CAGGCGCATG ACGCGCTGCG CTTTCCGGTG 
CAATGGGTCG CGCGCCAGGA CGGCAGCTCG GCCGACGATT TCCGCGGCTA CATGGGCCGC 
ATCGAGGCGG GCGAGGCGAA GGTGGGCGAC GAGATCGTCG TGCTGCCTTC GAACCGTACC 
GCGACGATCG CCGAGATCAT CGCGCCGGTG CCGGGCGGCA CGGCGGCCGT CGAGCGCGCG 
TTCGCCGGGC AGGCGGTGAC GATCCGCCTG GCCGAGGACG TCGACGTGTC GCGCGGCGAC 
ACGTTCGTGC CGCGCGCGCA GGGCGTCGAG CCGGCGAAGA AGCTCGAGGC CGATCTCTGC 
TGGTTCGACG AGACGCCGCT TTCGTCGCAG CGCAAGTATC TGCTCAAGCA AACGACGAAC 
ACCGTGTTCA CGAAGATCGG CGCGGTCAAG CAGGTGCTCG ACGTGCACAC GCTGTCGCAC 
GCGACCGATC GCCACGAGCT GAAAATGAAC GACATCGGCC GCGTCGCGCT GACGCTGCAA 
AAGCCGATCG TCTGCGACAC GTACGACGCG CATCCGGGCA CGGGCGCGTT CGTGCTGATC 
GACGAGGCGA CCCATCACAC GGTCGCAGCG GGTATGATTC GTGCGTTTTC CGCGTGA

Protein sequence

MSIIENNEDL GVLRFITAGS VDDGKSTLIG RLLYDSKAVL SDQLSALSRA KNKRTVGDEL 
DLALLTDGLE AEREQGITID VAYRYFATAK RKFIIADTPG HEQYTRNMVT GASTAHAAII 
LIDATRVTFD AGAAQLLPQT KRHSAIVKLL DLQHVIVAIN KMDLVDYSET RFNEIRDAYV 
KLAQQLGLAD VRFVPVSALK GDNIVAASER MPWYAGEPLL NVLETLPVET QAHDALRFPV 
QWVARQDGSS ADDFRGYMGR IEAGEAKVGD EIVVLPSNRT ATIAEIIAPV PGGTAAVERA 
FAGQAVTIRL AEDVDVSRGD TFVPRAQGVE PAKKLEADLC WFDETPLSSQ RKYLLKQTTN 
TVFTKIGAVK QVLDVHTLSH ATDRHELKMN DIGRVALTLQ KPIVCDTYDA HPGTGAFVLI 
DEATHHTVAA GMIRAFSA