Gene BMA10229_1033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMA10229_1033
Symbol
ID	4790564
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei NCTC 10229
Kingdom	Bacteria
Replicon accession	NC_008835
Strand	-
Start bp	1077141
End bp	1078211
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	69%
IMG OID
Product	pentapeptide repeat-containing protein
Protein accession	YP_001024841
Protein GI	124381713
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAAGA TCCGCTCGGC GGTGCCGCCG CCGCCGCTGC CCGAAGTCGT CGAGGGGCAG 
CGTTACGCGA CGCCGCAGCG CGGCGTCACG CTGGCCGACA CGATGTTCGT CGATTGCCAC 
TTCGAGCGCG TCGAATGGAC CGGCTGCCGG CTCGCGAACC TGCGCTTCGT GAACTGCACG 
TTCGACGCGA ACCGCTTCGA TCGCTGCGAG CTCGAGAAGC TCTCGTACGA TTCGAGCCGG 
ATTCGCGCGG GCGCGTGGAC GCAGAGCGCG CTGCAGCGCG TGTCGTTCAA CGAATGCGAG 
CTCGACGGCG GCACGTGGAC GGGCAGCCTG GTGAAAGACG TCGTATGCAC GCAGTCGAAG 
GGCGGCGCGT GGACGTTCGA CGCGGTGCGC GGCGCGCACG TGTCGCTCGT CGCGGGCGAT 
TACGCGGGCG TCACGCTGCG CGGCGGCCGC TGGAGCGATA CGTCGTGGAT CGGCAGCCGG 
CTCGCCGACC TGCGGCTCGA ATCGGTCGAG CTCGAGAACC TGATCGCCGG GCAAAGCGGC 
TTCGAGCGCG TGGTGCTCGT CGAGTGCCGC GGCGTGAACG TGCGCTGGAT CGATTCGCGG 
ATCGAGCGGA TGACCGTGCA CGGCTGCGAG CTGAAGCAGG CGGCGTGGTC GCACAGCACA 
TGGGCGACGG GCGAGATTCA CGCGAGCCGG CTGCCGATCG CGAGCTTCGA TCATGCGAGC 
GTCAACGGGC TGACGGTGAC GAACAGCGAA TTGCCGCAGG CGATCTTCGA TAGCGCGAGC 
GTCGCGGACA GCGCGCTGCA AGGCGTGCGC GCGCCGCGCA TCGCATTGCG CGACGCATGG 
CTCACGCGCG TGAACCTGTC GGGCGCGCAG ATGCAGCAGC TCGATGCGCG CGGCGTGCAT 
CTGGAGCGCG TCGACCTGCG CGGCGCCGAT TGCCGCGGCG GCAACCTGAT CGGCCAACTG 
AGCCACACGT GGGCGGCGGC CGATACGCGG GACGCGATTT TCGAAGAAGC CACGAGCGCC 
GACGACCGGC TCTGGTGGCA GCGAGTTCAA CCCGGAGCAA GAGGAGTTTG A

Protein sequence

MSKIRSAVPP PPLPEVVEGQ RYATPQRGVT LADTMFVDCH FERVEWTGCR LANLRFVNCT 
FDANRFDRCE LEKLSYDSSR IRAGAWTQSA LQRVSFNECE LDGGTWTGSL VKDVVCTQSK 
GGAWTFDAVR GAHVSLVAGD YAGVTLRGGR WSDTSWIGSR LADLRLESVE LENLIAGQSG 
FERVVLVECR GVNVRWIDSR IERMTVHGCE LKQAAWSHST WATGEIHASR LPIASFDHAS 
VNGLTVTNSE LPQAIFDSAS VADSALQGVR APRIALRDAW LTRVNLSGAQ MQQLDARGVH 
LERVDLRGAD CRGGNLIGQL SHTWAAADTR DAIFEEATSA DDRLWWQRVQ PGARGV