Gene BURPS1106A_A0378 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0378
Symbol
ID	4904024
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	359807
End bp	360994
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	71%
IMG OID	640143485
Product	amidohydrolase family protein
Protein accession	YP_001074421
Protein GI	126455778
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGACG CACGTTTTAC CGAGGTCGAC GACCTCGCCC CGCTCGCCGA AGCACTGCGC 
GAGATCCGCC ATCGCATCCA CCGCCATCCG GAACTCGCGT ACGAGGAGGT CGAGACGGCC 
GCGCTCGTCG CGGACAAGCT CGAAGCCTGG GGCTGGCGGG TGACGCGCGG CGTGGGCGGC 
ACGGGCGTGG TCGGCACGCT GCGCGTGGGC GACGGCGCGC GCAGCGTCGG CGTGCGCGCG 
GACATGGACG CGCTGCCGAT CGCCGAGGCG ACCGGGCTGC CTTATGCGAG CGCGGTGCCC 
GGCAAGATGC ACGCGTGCGG CCACGACGGC CACACTGCGA TGCTGCTCGG CGCCGCATGG 
CGGCTCGCGC AGGCGCGCCA CTTCTCCGGC ACCGTTCATC TGTATTTTCA GCCGGCCGAG 
GAGCACGGCG TCGACAGCGG CGCGAAGCGC ATGATCGACG ACGGCCTTTT CGAGCGCTTT 
CCGTGCGACG CGGTGTTCGG GATGCACAAC CATCCGGGCG TCGAGCCGGG CGTGTTCCTC 
ACGCGGCGGG GGGCGTTCAT GTCGGCGGGC GACAAGGCGG TGATCGACAT CCACGGCGTG 
GGCGGCCATG CGGCGCGGCC GCATCTGGCG GTCGATCCGG TCGTCGTCGC GGCGAGCGTC 
GTGATGGCGC TGCAGACGAT CGTCGCGCGC AACGTCGATC CCGCGCAGCC CGCCGTCGTG 
ACGGTCGGCT CGCTGCACGC CGGCACCGCG AACAACGTCA TTCCGAGCCG CGCGCGGCTC 
GAGCTCTCCG TGCGCTCGTT CGATCCCGAG GTGCGCGCGC TGCTCAGGCG CCGGATCACC 
GAGCTCGCCC AGGCGCAGGC GGCCAGCTAC GGCGCGAGCG CGAACGTCGA GTACATCGAG 
GGCTACCCGG TCGTCGTCAA TTCGGACGCC GAAACCGACT TCGCCGCGCA GGTCGCGAAG 
GAGCTGGTGG GCGAGCGCAA CGTCGTCGAG CAGGCCGACA TCCTGATGGG CAGCGAGGAT 
TTCGCGTTCA TGCTGCAGCG GCGGCCGGGC TCGTTCGTGC GGCTCGGCAA CGGCGCGGGC 
GAGGAAGGCT GCATGGTGCA CAACCCGAAA TACGACTTCA ACGATCGCAA CCTCGTGACG 
GGCGCGGCGT TCTGGGCGCG GCTCGTCGAG CGGTATCTGG CGCGGTAG

Protein sequence

MNDARFTEVD DLAPLAEALR EIRHRIHRHP ELAYEEVETA ALVADKLEAW GWRVTRGVGG 
TGVVGTLRVG DGARSVGVRA DMDALPIAEA TGLPYASAVP GKMHACGHDG HTAMLLGAAW 
RLAQARHFSG TVHLYFQPAE EHGVDSGAKR MIDDGLFERF PCDAVFGMHN HPGVEPGVFL 
TRRGAFMSAG DKAVIDIHGV GGHAARPHLA VDPVVVAASV VMALQTIVAR NVDPAQPAVV 
TVGSLHAGTA NNVIPSRARL ELSVRSFDPE VRALLRRRIT ELAQAQAASY GASANVEYIE 
GYPVVVNSDA ETDFAAQVAK ELVGERNVVE QADILMGSED FAFMLQRRPG SFVRLGNGAG 
EEGCMVHNPK YDFNDRNLVT GAAFWARLVE RYLAR