Gene BURPS1710b_2842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_2842
Symbol	astB
ID	3691235
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	-
Start bp	3151226
End bp	3152566
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	70%
IMG OID	637729298
Product	succinylarginine dihydrolase
Protein accession	YP_334226
Protein GI	76810086
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3724] Succinylarginine dihydrolase
TIGRFAM ID	[TIGR03241] succinylarginine dihydrolase

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGCTA AAGAAGCCAA TTTCGACGGG CTCGTCGGCC CGACCCATAA CTACGCGGGA 
TTGTCGTTCG GCAACGTCGC GTCGCTGTCG AACGAAAAGT CCGACGCGAA CCCGAAGGCG 
GCCGCCAAGC AGGGGCTGCG CAAGATGAAG CAGCTCGCGG ACCTCGGTTT CGCGCAGGGC 
GTGCTGCCGC CGCAGGAGCG GCCGTCGCTG CGCCTGTTGC GCGAGCTCGG CTTCTCCGGC 
AAGGACGCCG ACGTGATCGC GAAGGCCGCG AGGCAGGCGC CCGAGCTGCT CGCCGCCGCG 
AGCTCCGCAT CGGCGATGTG GACCGCGAAC GCGGCGACGG TGAGCCCGTC CGCCGATACG 
AGCGACGCCC GCGTGCATTT CACGCCGGCG AACCTGTGCA GCAAGCTGCA TCGCGCGATC 
GAGCACGAAT CGACGCGCCG CACGCTCGCC GCGATCTTCG CGGACGAAGC GCGCTTCGCG 
GTGCACGACG CGCTGCCCGG CACGCCCGCG CTCGGCGACG AGGGCGCGGC GAACCATACG 
CGCTTTTGCG CGGAGTACGG CGCGCCCGGC GTCGAGTTCT TCGTGTACGG CCGCGCCGAA 
TACCGCCGCG GGCCGGAGCC GACGCGTTTT CCGGCGCGCC AGACGTTCGA GGCGAGCCGC 
GCGGTCGCGC ATCGCCACGG CCTGCGCGAG GAAGCGACGA TCTACGCGCA GCAGCGCCCG 
GACGTGATCG ACGCGGGCGT GTTCCACAAC GACGTGATCG CGGTCGGCAA TCGCGACACG 
CTGTTCTGCC ACGAACATGC GTTCGTCGAC CGGCAGGCGG TGTACGACGC GCTCGCCGCG 
TCGCTCGGCG CGCTCGGCGC GCAGTTGAAC GTGATCGAGG TGCCGGATCG CGCGGTGAGC 
GTCGCCGACG CGGTGGGCTC GTACCTGTTC AACAGCCAGC TGCTCGCGCG CGAAGACGGC 
ACGCAGATGC TGGTCGTGCC GCAGGAATGC CGCGAGAACG CGAACGTGGC CGCGTATCTC 
GACGCGCTCG TCGCCGGCAA CGGGCCGATT CGCGACGTGC GCGTGTTCGA TCTGCGCGAG 
AGCATGAAGA ACGGCGGCGG GCCCGCGTGC CTGCGGCTGC GTGTCGTGCT GAACGATGCC 
GAGCGCGCGG CGGTGAAGCC GAATGTGTGG ATCGGCGACG CGCTGTTCGC ATCGCTCGAC 
GCATGGATCG ACAAGCATTA CCGCGACCGG CTGTCGCCCG TCGATCTCGC CGACCCCGCG 
CTGCTCGACG AATCGCGCAC CGCGCTCGAC GAATTGACGC AGATCCTCGG CCTCGGCTCG 
CTCTATGACT TCCAGCGCTG A

Protein sequence

MNAKEANFDG LVGPTHNYAG LSFGNVASLS NEKSDANPKA AAKQGLRKMK QLADLGFAQG 
VLPPQERPSL RLLRELGFSG KDADVIAKAA RQAPELLAAA SSASAMWTAN AATVSPSADT 
SDARVHFTPA NLCSKLHRAI EHESTRRTLA AIFADEARFA VHDALPGTPA LGDEGAANHT 
RFCAEYGAPG VEFFVYGRAE YRRGPEPTRF PARQTFEASR AVAHRHGLRE EATIYAQQRP 
DVIDAGVFHN DVIAVGNRDT LFCHEHAFVD RQAVYDALAA SLGALGAQLN VIEVPDRAVS 
VADAVGSYLF NSQLLAREDG TQMLVVPQEC RENANVAAYL DALVAGNGPI RDVRVFDLRE 
SMKNGGGPAC LRLRVVLNDA ERAAVKPNVW IGDALFASLD AWIDKHYRDR LSPVDLADPA 
LLDESRTALD ELTQILGLGS LYDFQR