Gene BMA10247_A1842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMA10247_A1842
Symbol
ID	4889137
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei NCTC 10247
Kingdom	Bacteria
Replicon accession	NC_009079
Strand	-
Start bp	1774711
End bp	1775841
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	74%
IMG OID	640148108
Product	putative D-aminopeptidase
Protein accession	YP_001079025
Protein GI	126447514
COG category	[E] Amino acid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3191] L-aminopeptidase/D-esterase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCACAC GAGATCTGGG CATTCGCATC GGCCGCGGCA AGCCGGGGCG CCTGAACGCC 
ATCACCGACG TCGCCGGCGT GCGGGTCGGG CACCACACGG TGCACGTCGA GGCGGGCGAC 
GCGTCGGCGC ACACCGGCGT GACGGTGATC GAGCCGCGCG CCGCGCGCGC GCGCGACGAG 
CCGTGCTTCG CGGGCGTTCA CGTGCTCAAC GGCAACGGCG ACGCGACCGG GCTCGAATGG 
ATTCGCGAGG CGGGGCTGCT GACGACGCCG ATCGCCTATA CGAACACGCA CAGCGTCGGC 
ATCGTGCGCG ATGCGCTCGT CGCCGCCGAG CGCGCGCAGG GCGGCGCGCG CGAGCGCGAG 
CACGTGTACT GGTGCATGCC GGTCGTGATG GAGACGTTCG ACGGACTCCT GAACGACATC 
TGGGGGCAGC ACGTGTGCGT CGGGCACGTC GCGCAGGCGC TCGCCGCCGC GCGTTCGGAC 
CCGGTCGCGG AAGGCTGCGT CGGCGGCGGC ACCGGCATGA TCTGCCACGA GTTCAAGGGC 
GGCATCGGCA CCGCGTCGCG CGTCGTCGCC GAAGCGGCGG GCGGCTGGAC GGTCGGCGCG 
CTCGTGCAGG CGAACTACGG GCAGCGCGCG GCGCTGCGCG TCGCGGGCTA CCCGGTCGGC 
GAAGTGCTGC GCGACGCGCA CTCGCCGTTC GACGAGGCGG GCGGGGCGGG CGAGCCCGGC 
ATGGGCTCGA TCGTCGTGAC GCTCGCGACC GACGCGCCGC TGCTGCCGCA TCAATGCACG 
CGGCTCGCGC AGCGCGCGAG CGTCGGGCTC GCGCGCGTCG GCGGCGGCAC CGACAATTCG 
AGCGGCGACA TTTTCGTGGC GTTCGCAACC GGCAATACCG GGCTGCCGAT CGTGAGCTAT 
GGCCGGCCGG GCCCGACGAC GGTCGGCGTG CGGATGGTCG CCGACGCGCA CATCTCCGCC 
CTGTTCGACG CGGCGGTGGA AGCGGTCGAG GAGGCGATCG TCAACGCGCT CGTCGCGGCG 
ACCGATCTCG CGGCGCGCGG CGTGCGCGTC GAGGCGCTCG GCGCCGCGCG GCTCGTCGAT 
GCGTTGCGCG AGACCGGCTG GCGCCCGCGC GCGGGCGACG CTCAGCTATA G

Protein sequence

MRTRDLGIRI GRGKPGRLNA ITDVAGVRVG HHTVHVEAGD ASAHTGVTVI EPRAARARDE 
PCFAGVHVLN GNGDATGLEW IREAGLLTTP IAYTNTHSVG IVRDALVAAE RAQGGARERE 
HVYWCMPVVM ETFDGLLNDI WGQHVCVGHV AQALAAARSD PVAEGCVGGG TGMICHEFKG 
GIGTASRVVA EAAGGWTVGA LVQANYGQRA ALRVAGYPVG EVLRDAHSPF DEAGGAGEPG 
MGSIVVTLAT DAPLLPHQCT RLAQRASVGL ARVGGGTDNS SGDIFVAFAT GNTGLPIVSY 
GRPGPTTVGV RMVADAHISA LFDAAVEAVE EAIVNALVAA TDLAARGVRV EALGAARLVD 
ALRETGWRPR AGDAQL