Gene BURPS1106A_0046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0046
Symbol
ID	4899644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	42115
End bp	44148
Gene Length	2034 bp
Protein Length	677 aa
Translation table	11
GC content	68%
IMG OID	640133276
Product	type III DNA modification methyltransferase
Protein accession	YP_001064331
Protein GI	126452068
COG category	[L] Replication, recombination and repair
COG ID	[COG2189] Adenine specific DNA methylase Mod
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.312444
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAATTGA TGGGAAGGAT GATGCAAAAA CTCGATGCGG CGAGCCCGGA GGCGCAATCC 
GCGGATCTCG TGGCCGCCAA CGTCGAGCGC CTGAAGGCGC TCTTTCCGGA CGTGGTGACC 
GAAGGGCCGG ACGGCGCGTC GGTGAATCTC GACGCGCTCG CGGCGCTGGT GGGCGCGAGC 
GCGGCGGCCG CGGCCGACGC CGACGAGAAG TACGGCCTGA ACTGGCACGG CAAGCGGCGC 
GCGCGCCGGC TCGCGCTCAC GCCGTCGACG GGCACGCTGC GCCCGTGCCC GCGCGAGAGC 
GCCGGCTGGG CGTCGACGCG CAACCTGATG ATCGAGGGCG AGAACCTCGA GGTGCTGAAG 
CTGCTGCAGA AGAGCTACGC GGGGCGCGTG AAGCTCGTCT ACATCGATCC GCCGTACAAC 
ACCGGCAAGG ATTTCGTCTA TCCGGACAAT TTCACCGACA GCCTGCGCCA TTATCTCGAG 
CTGACCGGCC AGACGACGGG CGGCAAGCGG GTCACCAGCC ACACCGACGC GAGCGGGCGC 
TTCCACACCG ACTGGCTGAA CATGATCTAC CCGCGCCTGA AGCTCGCGCG CGATCTGCTC 
ACCGAGGACG GCGTGATCGC CGTGCACATC GACGAGCACG AACAGCACGC GCTCGTGCTC 
GTGATGCGCG AGATCTTCGG CGAAGACAAC GAGCTCGGCG TCGCGGTGTG GGACAAGCGC 
AATCCGAAGG GCGATGCGCG CGGGATCGCG TACCAGCACG AATCGATCGT GCTGTTCGCG 
CGCGACGCTG AACGGCTGTT CGAGCGTGCG CCGCTCAAGC GCCCGAAACG CAACGCGCAG 
CGCATGCTGG GCGCGGCGCG CGAGGCGGTC GCCGGCGCGG CGACGATCGC GGACGCGAAC 
GCCGCGTACC GCGGCTGGGT GAAGTCTCAG ACGACGCTGT CGGGCGGCGA GGCGATGTAC 
GACCGAATCT CCGCCGACGG GCGCGTGTAC CGCCTCGTGT CGATGGCGTG GCCGAACAAG 
AAGAAGGCGC CCGACGACTA CTTCGTGCCG CTCGTGCATC CGGTGACGGG CAAGCCGTGC 
CCCGTGCCCG AGCGCGGCTG GCGCAACCCG CCCGCGACGA TGCGCGCGCT CATCGACAAG 
GGCCTCGTCG AATTCGGCGC GGACGAGACC ACGCAGCCGC AGCGGATCTA TTTCCTCGAC 
GAGAACATGT ACGAGAACGT GCCTTCGGTG CTGCCGTTCG GCGGCTCGGA CGACGCGCTG 
ATGAAGTCGC TCGGCATTCC TTTCGATCAG CCCAAGCCCG TCGAATTCGC CGCGTCGATC 
ATCGGCTGGT GCACCGACGG CGACGATCTG ATCGTCGACT TCTTCGGCGG CTCCGGCACG 
ACCGCGCACG CGGTGATGGC GCTGAACGCG GCCGACGGCG GCCATCGCCG CTACGTGCTC 
GTGCAACTGC CCGAGCCGCT CGACGCCGAC AGCAAGGACC AGAAGGCCGC CGCCGATTTC 
TGCGCGGCGC AGCGCGTGCC GCTCAATCTC GCCGAGCTGA CGAAGGAGCG GCTGCGGCGC 
GCGGCGGCGC GCATCGCGGC CGAGCATCCG GGCACGCGGG CGGATCTCGG TTTTCGCGTG 
TTCAGGCTCG ATTCGACGAA CGTCTCCGAA TGGGACCCGC GCGGCGACGA CATCCAGCAG 
TCGCTGTTCG CGGCCGTCGA GCACATCAAG CCGAACCGCT CCGAGGAAGA TCTGCTGTAC 
GAACTGATGC TCAAGCTCGG CCTCGATCTG TGCGCGCCGA TCGACGCACG CATGATCGCC 
GGCAAGGCGG TCTACGTGAT CGACGGCGCG ATCGTCGCGT GCTTCGATGC GCATATCGAC 
CGCGCGTCGA CCGACGCGCT CGGCGAGGGC ATCGTCGGGC TGATCGCCGA AGCGGCCGAC 
GCGCGCGAGG TGACCTGCGT GTTCCGCGAC AGCGGCTTCG CGGACGACGT CGCGAAGGTG 
AACCTGTCGG CGATTCTCGA GCAGCACGGC GTGAAGCGCA TCCGCAGCCT CTGA

Protein sequence

MQLMGRMMQK LDAASPEAQS ADLVAANVER LKALFPDVVT EGPDGASVNL DALAALVGAS 
AAAAADADEK YGLNWHGKRR ARRLALTPST GTLRPCPRES AGWASTRNLM IEGENLEVLK 
LLQKSYAGRV KLVYIDPPYN TGKDFVYPDN FTDSLRHYLE LTGQTTGGKR VTSHTDASGR 
FHTDWLNMIY PRLKLARDLL TEDGVIAVHI DEHEQHALVL VMREIFGEDN ELGVAVWDKR 
NPKGDARGIA YQHESIVLFA RDAERLFERA PLKRPKRNAQ RMLGAAREAV AGAATIADAN 
AAYRGWVKSQ TTLSGGEAMY DRISADGRVY RLVSMAWPNK KKAPDDYFVP LVHPVTGKPC 
PVPERGWRNP PATMRALIDK GLVEFGADET TQPQRIYFLD ENMYENVPSV LPFGGSDDAL 
MKSLGIPFDQ PKPVEFAASI IGWCTDGDDL IVDFFGGSGT TAHAVMALNA ADGGHRRYVL 
VQLPEPLDAD SKDQKAAADF CAAQRVPLNL AELTKERLRR AAARIAAEHP GTRADLGFRV 
FRLDSTNVSE WDPRGDDIQQ SLFAAVEHIK PNRSEEDLLY ELMLKLGLDL CAPIDARMIA 
GKAVYVIDGA IVACFDAHID RASTDALGEG IVGLIAEAAD AREVTCVFRD SGFADDVAKV 
NLSAILEQHG VKRIRSL