Gene BURPS1106A_2039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2039
Symbol	amaB
ID	4900083
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	2020858
End bp	2022138
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	69%
IMG OID	640135269
Product	allantoate amidohydrolase
Protein accession	YP_001066304
Protein GI	126451874
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR01879] amidase, hydantoinase/carbamoylase family

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCCGA CGGTCTTTCC GCCCCTGAAT GCCGAGCGCC TGAATGCGCG CGTCGAGCAA 
CTCGCGCGTT TCACGCGAGC CGACGTTCCG TGGACGCGCC GCGCGTTCTC GCCGCTGTTT 
ACGGAAGCGC GCGCCTGGCT CGCCGCGCAG TTCGCCGCAG CCGGGCTCGC GGTATCGATG 
GACGCCGCCG GCAACCTGAT CGGCCGCCGC GAGGGCAGCG GCCGCTGCAC GAAGCCGTTG 
ATTACGGGCT CGCACTGCGA CACGGTCGTC GGCGGCGGGC GCTTCGATGG GATCATCGGC 
GTGCTCGCCG GCATCGAGGT CGCGCATACG CTGAACGAGC AGGGGATCGT GCTCGACCAT 
CCGCTCGAAG TGATCGACTT CCTGTCCGAG GAGCCGAGCG ACTACGGCAT CTCGTGCGTC 
GGCAGCCGCG CGCTGTCGGG CGTGCTCGAT GCGGGCATGC TACGCGCGAC GAACGGGGAA 
GGCGAAACGC TCGCGCAGGC GCTGACGCGC ATCGGTGGCA AGCCGGAGGC GCTGAACATG 
CCGTTGCGCG CGCCAGGCAG CACGGCTGCA TTCGTCGAAC TGCATATCGA GCAGGGCCCG 
GTGCTGGAAG CGCGCGGCCT GCCGATCGGC GTCGTGACCA ATATCGTCGG CATCCGGCGC 
GTGCTGATCA CCGTGATCGG GCAGCCCGAC CATGCGGGGA CGACGCCGAT GGACATTCGT 
CGAGACGCGC TTGTCGGTGC CGCACACCTG ATTGAGGCCG CGCATGCGCG CGCGTTGTCG 
CTGTCGGGAA ATCCACACTA CGTGGTCGCG ACGATCGGGC GGATCGCGAT GACGCCGAAC 
GTGCCGAACG CGGTGCCGGG GCAGGTCGAG CTCATGCTGG AAGTGCGGAG CGACAGCGAC 
GCGGTGCTCG ACGCGTTTCC CGAGACGCTG CTGGCCGGTG CGGCCGCGCA GCTCGACGCG 
TTGCGGTTGA GCGCGCACGC GGAGCATGTG AGCCGCGCGC GGCCGACCGA CTGCCAGCCG 
CTCGTAATGG ACGCGGTCGA GCAGGCGGCA GCCCAGCTCG GCTACCCGAG CATGCGTTTG 
CCGAGCGGCG CGGGGCACGA TGCCGTGTAT GTCGCGCCGA CCGGGCCGAT CGGGATGATC 
TTCATTCCGT GCCTGGGTGG GCGCAGCCAT TGCTCGGAGG AATGGATCGA GCCGCAGCAG 
TTGCTCGACG GCACGCGCGT GCTGTACCGG ACGCTCGTCG TGCTCGATCG CACGCTGGCA 
GCGCATGAAA CCGGCCGCTG A

Protein sequence

MNPTVFPPLN AERLNARVEQ LARFTRADVP WTRRAFSPLF TEARAWLAAQ FAAAGLAVSM 
DAAGNLIGRR EGSGRCTKPL ITGSHCDTVV GGGRFDGIIG VLAGIEVAHT LNEQGIVLDH 
PLEVIDFLSE EPSDYGISCV GSRALSGVLD AGMLRATNGE GETLAQALTR IGGKPEALNM 
PLRAPGSTAA FVELHIEQGP VLEARGLPIG VVTNIVGIRR VLITVIGQPD HAGTTPMDIR 
RDALVGAAHL IEAAHARALS LSGNPHYVVA TIGRIAMTPN VPNAVPGQVE LMLEVRSDSD 
AVLDAFPETL LAGAAAQLDA LRLSAHAEHV SRARPTDCQP LVMDAVEQAA AQLGYPSMRL 
PSGAGHDAVY VAPTGPIGMI FIPCLGGRSH CSEEWIEPQQ LLDGTRVLYR TLVVLDRTLA 
AHETGR