Gene BURPS1106A_A3044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A3044
Symbol
ID	4903723
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	2960076
End bp	2961236
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	62%
IMG OID	640146147
Product	ISBma1, transposase
Protein accession	YP_001077073
Protein GI	126456410
COG category	[L] Replication, recombination and repair
COG ID	[COG3464] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.932011
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAGTGGC CGCAGGGCGA TAGCCGCACG CTGTCGCTCT ACCTGAAGCC GGTCAGTCAG 
ATCATGTACT GCGAGCAATG CGGTGCGCGT TGCCAGCAGA TTCATGAAAC GACCGTACGG 
CGGGTACGTG ATCTGCCGTT GTTCGAGTAC CGGGTGGTGC TGCACGTGCC TCGACGCCGA 
GTCTGGTGCG AACGCTGCGG CGCAGCGCGG CTGGAGAAGC TGGACTGGCT GGGCCGCTAC 
CAGCGGGTGA CGGAGCGGTT TGCCAAGGCC TGCGAGAAGT TGCTGCAGGC CGCCAGCGTA 
CAGGCCGTGG CGGCCTTCTA CGAACTGGGC TGGCACACGG TCAAATCGAT CGACAAGATG 
CGCTTGCGCG CGCGCGTGGC CGAACCGGAC TGGTCGACGA TCCGTTATCT GGCGATGGAC 
GAGTTCGCGC TCCATAAAGG CCATCGCTAC GCCACGGTGG TGGTTGATCC GATCGGCCGA 
CAGGTCCTCT GGGTTGGGCC CGGACGGTCA CGCGAGACGG CGCGCGCCTT CTTCGAACAA 
CTCCCCGAAG GCGTGGCCGA GCGCATCGAA GCGGTCGCAA TCGACATGAC CACGGCCTAT 
GAGCTGGAGA TCAAGGAACA GTGCCCGCAG GCGGAAATCG TCTTTGACCT GTACCACGTC 
GTGGCCAAGT ACGGTCGCGA GGTGATCGAT CGGGTACGGG TGGATCAGGC CAACCAACTG 
CGACATGACA AGCCGGCCCG CAAGGTTCTG AAGTCCAGTC GCTGGTTGCT GCTGCGCAAC 
CGTCATAACC TGAAGCCAGA ACAGGCCGTG CATCTGAAGG AACTGCTGGC GGCCAATCAG 
TCGCTGTTAT GCGTCTATGT GCTGCGCGAC GAGCTCAAAC GGCTCTGGTT CTACCGCAAG 
CCGGCCTGGG CGGAAAAGGC TTGGGGGCAA TGGTTCGAAC AGGCTCAGCA AAGCGGGATC 
GCCGCCTTGC AAAAGTTCGC CCAGCGCTTG CAGGGTTACT GGCACGGAAT CGTGGCCCGC 
TGCCGCCATC CGCTCAATAC CAGCGTCGTC GAAGGCATCA ACAACACGAT CAAGGTCATC 
AAGCGCCGAG CTTACGGGTA CCGCGACGAG CAATACTTCT TCCTCAAGAT CCGCGCCGCG 
TTCCCCGGGA TTCAGCGATG A

Protein sequence

MEWPQGDSRT LSLYLKPVSQ IMYCEQCGAR CQQIHETTVR RVRDLPLFEY RVVLHVPRRR 
VWCERCGAAR LEKLDWLGRY QRVTERFAKA CEKLLQAASV QAVAAFYELG WHTVKSIDKM 
RLRARVAEPD WSTIRYLAMD EFALHKGHRY ATVVVDPIGR QVLWVGPGRS RETARAFFEQ 
LPEGVAERIE AVAIDMTTAY ELEIKEQCPQ AEIVFDLYHV VAKYGREVID RVRVDQANQL 
RHDKPARKVL KSSRWLLLRN RHNLKPEQAV HLKELLAANQ SLLCVYVLRD ELKRLWFYRK 
PAWAEKAWGQ WFEQAQQSGI AALQKFAQRL QGYWHGIVAR CRHPLNTSVV EGINNTIKVI 
KRRAYGYRDE QYFFLKIRAA FPGIQR