Gene BMA10229_A2433 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMA10229_A2433
Symbol
ID	4793760
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei NCTC 10229
Kingdom	Bacteria
Replicon accession	NC_008836
Strand	-
Start bp	2471944
End bp	2473083
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	70%
IMG OID
Product	hypothetical protein
Protein accession	YP_001028392
Protein GI	124385157
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCCGC TGCAACGACA ACAACAACCC GCCGGCGCCG CGCGCCGCCG CTTCTGGCGC 
GGCGCGCAGG TCGCGCTCGC GAGCGCCGCG TTCGCGCTGC TCGCCGCCTG CGGCGGCGGC 
GACGACAACG GCTCGTCGCA GCCGAGCGCC GGCGTGAACA TGCAGGTCGT GTCCTTCGGC 
GACAGCCTGT CGGACGTCGG CACGTATTCG CCGCAGATCC TGATCGGCTT CGGCGGCGGG 
CGCTTCACGA CGAATCCGGG CCAGGTATGG ACGCAGGACG TCGCCGCCTA CTACGGCGAC 
ACGCTCACCC CGGCGTTCGA AGGCGGCTTC GGCGTGCCGC TGCAGGCGGC GGGCGGCCTG 
GGCTACGCGC AGGGCGGCTC GCGCGTCACG CAGCAGCCGG GCATCGGCCA CGCGGACGCG 
AGCGTCGCGA ACGCCGACTA CGCGCAGGCG ACGACCGTGC CCGTCGCGAC GCAGGTGCAG 
CAATACCTGC AGCAGCACGG CAGCTTCAAC GCGAATCAGA TCGTGCTCGT CAACGGCGGC 
GCGAACGACA TCTTCTATCA GGTGCAGGTC GCGCAGGCTC AGGGCAATAC GCCCGCCGCG 
CAGCTCGCCG CCGCGCAGCA GATCGGCCTC GCCGCGCAGC AGCTCGCGGG CGTCGTCCAG 
CAGATCGTCG CGGCGGGCGC GACGCACGTG TTCGTATCGA ACGTGCCGGA CATCGGCGGC 
ACGCCGCTCG CGGCGTCGAC GGGCCAGCAG GCCGCGCTCA CGCAGTTGTC GACGATCTTC 
AACAGCACGC TCGTCGCGGC GCTGAAGGCG CTGAACGTCG ATCCCGCGAA GGCCGTGCTG 
ATCGACGCAT TCACGTGGCA GGACGGCATC GCCGCGAACT ACCAGGGCAA CGGCTTCTCG 
GTGGCGAACA CGGGCACCGC GTGCAACCTG CAATCGATGA TCGCCGCCGC GACGAAGGCG 
GGGGTCGCGA ACCCGACCGC GTTCGGCTCG TCGCTGTTCT GCTCGCCGCA GATGTACACG 
GTCGCGAACG CGGACCAGAC GTACATGTTC GCCGACACGG TCCACCCGAC GACGCGCCTG 
CACGCGCTCT TCGCGCAATA CGTCGAGCAG CAGATCGCGA AAACGGGCGT CGGCAAGTAA

Protein sequence

MNPLQRQQQP AGAARRRFWR GAQVALASAA FALLAACGGG DDNGSSQPSA GVNMQVVSFG 
DSLSDVGTYS PQILIGFGGG RFTTNPGQVW TQDVAAYYGD TLTPAFEGGF GVPLQAAGGL 
GYAQGGSRVT QQPGIGHADA SVANADYAQA TTVPVATQVQ QYLQQHGSFN ANQIVLVNGG 
ANDIFYQVQV AQAQGNTPAA QLAAAQQIGL AAQQLAGVVQ QIVAAGATHV FVSNVPDIGG 
TPLAASTGQQ AALTQLSTIF NSTLVAALKA LNVDPAKAVL IDAFTWQDGI AANYQGNGFS 
VANTGTACNL QSMIAAATKA GVANPTAFGS SLFCSPQMYT VANADQTYMF ADTVHPTTRL 
HALFAQYVEQ QIAKTGVGK