Gene BMA10229_A3175 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMA10229_A3175
Symbol
ID	4791772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei NCTC 10229
Kingdom	Bacteria
Replicon accession	NC_008836
Strand	+
Start bp	3214260
End bp	3215660
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	72%
IMG OID
Product	hypothetical protein
Protein accession	YP_001029115
Protein GI	124385214
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.333375
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACGA CGACGGTTGC GATTATCGGT GCGGGGTTTT GCGGGGCGAC GCTGGCGACG 
CATCTGCTGC GAAGGCCGCC GGTGCGGCCA ATGCGGGTGC TGCTGATCAA CCGGTCGGGC 
GCGATGGCGC GCGGCGTGGC GTACGGCACG CGCGCGCTCG GCCATCTGCT GAACGTGCCC 
GCCGGCCGGA TGAGCGCGGT GGCCGGCGAC GATGACGACT TCTATCGATA CGCGAGCGGG 
CGCGATCCGC GCGTCGCGCG CGGCAGCTTC GTGCCGCGGC GGATCTACGG CGACTACCTC 
GAGGCGCGCC TGACCGAGGC GATCGAGCAG GCGCACGCGG GCATCGAATT TCGTAGCGTG 
GTGGGCAGCG CGGTGAGAAT CGCGCCCGTC GACGGCGGCG CGCGCGGCGC GATCACGATG 
GACGGCGGCG CGGTGATCGA GGCCGACCGC GTCGTGCTGA GCAGCGGCAA CGAAATGCGC 
CGCGATCCGT TCATCGCCGA ATCGCAACGC AAGTTCTACG ACAGCCATGC CTACGTTCGC 
GATCCATGGC GGCCGGGCGC ACTGCGCGGC ATCGCGCCCG ATACGCCGGT GCTGCTCGTG 
GGCAGCGGGC TCACGATGAT GGACGTGGTG CTCGATTTGC GCGCCCGGGG CCACGCGGCG 
CCGATTCACG TGGTGTCGCG CCACGGGTTG ATGCCGCTCG CGCACCGTGA GATGGACGCG 
CCGCCGTCCT ACGACGATCG GCTGGCGGCC CGCATGCTCG CGCGCGCGGA CGTGCGCCAT 
TACGTGCGCG CGGTGCGCGA CGCGATTCGC CGAGGCGGCG ACTGGCGAGA CGTGATCGGT 
TCGCTGCGCG CGGCGACGCC GGCGCTGTGG CGCCAGTTGC CGAGCGACGA GCGCCGGCGC 
TTCCTGCGCC ATGTCAGGCC GTACTGGGAC GTGCATCGCC ACCGCTGCGC GCCCGAGCCG 
GCCGCACGGC TGCAAGCGGA ATTCGAGCGA GGCGGCGTCG CGGCCGTCGC GGGGCGGGTG 
ACGGGCTACA GCGAGCATCC GAACGGCGTC GGCGTGACGG TGCGCCGGCG CGGCGCGGCC 
GTCGACGAGC GTCTCGAGGT GGGCGCGGTC GTCAACTGCA CGGGGCCGGC ACCGGACTTC 
AGCGCGCGGG CGGGATCGCT GCTCGGCAAC CTGTATGCGG ACGGGCTGAT CGTGCCGGAT 
GCGATCGGCA TGGGGTTCGA GATCGCCGAC GACGGCGCGG TGCTCGATCG CGACGGCTCG 
CCGTCGGCGT GGCTGCGTTA TGTCGGACCG TTGCTGCAGG CGCGCGATTG GGAGGCGACG 
GCGGTGCCGG AACTGCGGCA GTACGTGCAG CGGCTCGCCG ATACGCTGCT CGCGCCGCGC 
GACGAACGGG CGCTGACCTA G

Protein sequence

MSTTTVAIIG AGFCGATLAT HLLRRPPVRP MRVLLINRSG AMARGVAYGT RALGHLLNVP 
AGRMSAVAGD DDDFYRYASG RDPRVARGSF VPRRIYGDYL EARLTEAIEQ AHAGIEFRSV 
VGSAVRIAPV DGGARGAITM DGGAVIEADR VVLSSGNEMR RDPFIAESQR KFYDSHAYVR 
DPWRPGALRG IAPDTPVLLV GSGLTMMDVV LDLRARGHAA PIHVVSRHGL MPLAHREMDA 
PPSYDDRLAA RMLARADVRH YVRAVRDAIR RGGDWRDVIG SLRAATPALW RQLPSDERRR 
FLRHVRPYWD VHRHRCAPEP AARLQAEFER GGVAAVAGRV TGYSEHPNGV GVTVRRRGAA 
VDERLEVGAV VNCTGPAPDF SARAGSLLGN LYADGLIVPD AIGMGFEIAD DGAVLDRDGS 
PSAWLRYVGP LLQARDWEAT AVPELRQYVQ RLADTLLAPR DERALT