Gene BMA10229_A1073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMA10229_A1073
Symbol
ID	4791935
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei NCTC 10229
Kingdom	Bacteria
Replicon accession	NC_008836
Strand	-
Start bp	1092602
End bp	1093981
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	56%
IMG OID
Product	putative capsular polysaccharide biosynthesis protein
Protein accession	YP_001027058
Protein GI	124383771
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.110982
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTTAT ACAAAGCGTT GGTTCGGCCC CTTGAGGTTC GAAGAGGTAA ACAGCACATG 
CGTGAGCGCA CAGTTGACTA TTCGTTTTGC GGCATGGTGC GCAGTCGGGA GCGGCTGGCG 
CGCCAAATTG TGTTCCATCA CATTCCCAAG ACGGCGGGAT CGTCGTTCAA TCAGATACTT 
CGCACGCTAT ATCGCGACGA CGAAGTATGC GACGCTGCGT TGGATGACGA ACTCGATGAA 
GTGATGGCCG ACGAGACGCG TCGTTACGAG CTGTTTGTCG GGCATTTCAG CTTCGACGCG 
CTGCATCGGC ACTTCGGCGG CGCCACGCGT TTGACTTTTC TTCGCGATCC GGTTCAGCGC 
TGTATTTCCC AGTATCACAA CTGGCATGAC GCTTCGCGCT ATTCGGATGC GTGGATCGGG 
TGCAGCGACA CGAATCCGGA CGTCATCAAG GCGCTGAAGA TGACGTCCGA GATGTCGCTT 
TGCGAATTTG TGAGTTCGGA TAATCTCGTG ATTTCCGACA GCGCTCAAAA CATGATGACT 
CGCTACCTCG CGCCGAGCGT CGAATGGAAG AAGGAGCGTG GATACTATGA CGCCGAGCTT 
GTCGAGAAAG CTAAGCGCAA TCTCGTCGAG TATTTTCATT TTTTTGGCCT GACCGAGCAA 
TTTGATCGTT CACTAGTGCT TCTTGCGCAT ACCCTCGGTA TCCGCCCATG GGAACGGAGC 
GATGCACTGC TAACTAATCG AAATCCGAAG AAGGCTTCGT TCGACAGTGT TTACAATACC 
ACGCCAGAAG AAGGCGGTGT TTTACGCGAT TACAACTTGA TGGATATCGA GTTGTACGAG 
TTCGCGGTAA AGGAATTCAA TCGCCGCTTC GACGCGGGAT ACCAGAAGCT TGTCGAGTGC 
GCCTTTGAGT ATCTCGCTGA CAAGGACACT CGCGACATGG GTAATGCTGG CGATTTTTAC 
GCGTTCGACA TGACGAACGC AGTCGGCGCC CGAGGTTTGC ATTTTCTGGA ATCCACCCGG 
TTGCCGTGTG GTGCGGATGT TCTTGGACGT TGGACAGGGC TGGAGCCGCG AGCTGTATGG 
GAGATTCCGC TTCGCGCGGG GCGCGACAGC CATGTCGTGA TCGAAGTGGA CTATATCGAT 
AGCGTGTCGC CGGAGGCCCT GGCGCCGGAG CATTTCACGT TAAACGGCAT GCCGGCCAGG 
CAGCATGCGT TCAGCGCGGA GGGCTCGATC CAGCGTCTGC GCCTGGTCTT TTCCGCCGGC 
GCCGCGCTTG CCGGCAGAAT GTTGCACACG CTGAAATTGA CTACTCCGCT TGTGCGTGCG 
GAAGACGGAA CGCGCGACGT TGGAGTGCTT CTATTGCGCT TGCAGTCTTA CAGCGTCTAG

Protein sequence

MSLYKALVRP LEVRRGKQHM RERTVDYSFC GMVRSRERLA RQIVFHHIPK TAGSSFNQIL 
RTLYRDDEVC DAALDDELDE VMADETRRYE LFVGHFSFDA LHRHFGGATR LTFLRDPVQR 
CISQYHNWHD ASRYSDAWIG CSDTNPDVIK ALKMTSEMSL CEFVSSDNLV ISDSAQNMMT 
RYLAPSVEWK KERGYYDAEL VEKAKRNLVE YFHFFGLTEQ FDRSLVLLAH TLGIRPWERS 
DALLTNRNPK KASFDSVYNT TPEEGGVLRD YNLMDIELYE FAVKEFNRRF DAGYQKLVEC 
AFEYLADKDT RDMGNAGDFY AFDMTNAVGA RGLHFLESTR LPCGADVLGR WTGLEPRAVW 
EIPLRAGRDS HVVIEVDYID SVSPEALAPE HFTLNGMPAR QHAFSAEGSI QRLRLVFSAG 
AALAGRMLHT LKLTTPLVRA EDGTRDVGVL LLRLQSYSV