Gene BMAA0412 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMAA0412
Symbol
ID	3086984
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei ATCC 23344
Kingdom	Bacteria
Replicon accession	NC_006349
Strand	+
Start bp	407699
End bp	408727
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	61%
IMG OID	637564335
Product	YD repeat-containing protein
Protein accession	YP_105200
Protein GI	53716605
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3209] Rhs family protein
TIGRFAM ID	[TIGR01643] YD repeat (two copies)

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0858889
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCGATC CGGCGGGGCG GACGACGGCT TGGGAATATG ACGCGTATGG CAGTTTGCTT 
GTGCAGACGT TGCCGGATGG CAGCGCAGTC AGAACGGAAT TTGACCTCGA TCACCGACCG 
GTCTGCATGA CGTTGATAGG CGGCCGGCAG TGGGGCTACG AGTGGAATAC GTTCGGTAAT 
CTGCTCGCGC AGAGCGATCC ATCGGGGGCG ATATCTCGCT ATACCTATGA CGAGTACGGC 
CAGCTTGTTG AGCATACTGG GCCGCGTGGT GCGAGCACAC GGTTCGATTA TCACCCGGAC 
GGCAATCTCG CGGCGCAGAT CGATGCGTTG GGGCATCGCA CGCAGTATCG GTACGATGCG 
CGCGGCTACC TCGGCGAAGC AATCGATGCG CTCGGACAGC AAAGCCAATA CGAGTACGAC 
CGCAACGGCC ATCTGACGCG CGCAATCGAG CCGGGCGGGC GTGAGATTCA CTGTGCGTAC 
GACGCCGATG GAAATCTGTC TCGCCATCGT GACCCCATGG GCCACGTGAC GCAGATGGAG 
TACTCGGCGC TCGGACAGGT CAGCAGACGG CTCGCGCCCG ACGGCACCAC CGTTGAATAC 
CGCTACGACA CGGAAGAACA ACTGATCGGC GTCGTGAACG AACGCAGCGA ACTATACGCG 
CTCGAACGCG ATGCGCTGGG GCGGATCGTC GTGGAGACGG ACTACTGGGG GCAAGCGCGA 
CGCTATCGGT ATGGCGCGGC GGGTGAACTG CTTTGTAGCA CTGATCCTCT GGGGCAGACA 
GTCGAATACC GATACGATTG GCTGGGGCGC ATCGTTCAGA AGCGCGTGCC TCATCCGGAG 
CAGGATGAGG CTCTTCAGAT CGACAGCTTT GCATACGATC GGCACGGGGA CTTGGTGCTC 
GCGGAGAATC CGTCTTGTCG CGTCGAGTTC GATTACGATG CAGCGGGCCG CATGATCGAG 
GAGCGACAGG GTGACGACTT CACGATTGCC AGTGATTATG ACGAAGCCGT GACCTGCCCC 
CTTCGATAG

Protein sequence

MIDPAGRTTA WEYDAYGSLL VQTLPDGSAV RTEFDLDHRP VCMTLIGGRQ WGYEWNTFGN 
LLAQSDPSGA ISRYTYDEYG QLVEHTGPRG ASTRFDYHPD GNLAAQIDAL GHRTQYRYDA 
RGYLGEAIDA LGQQSQYEYD RNGHLTRAIE PGGREIHCAY DADGNLSRHR DPMGHVTQME 
YSALGQVSRR LAPDGTTVEY RYDTEEQLIG VVNERSELYA LERDALGRIV VETDYWGQAR 
RYRYGAAGEL LCSTDPLGQT VEYRYDWLGR IVQKRVPHPE QDEALQIDSF AYDRHGDLVL 
AENPSCRVEF DYDAAGRMIE ERQGDDFTIA SDYDEAVTCP LR