Gene BURPS1106A_A2989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2989
Symbol
ID	4906245
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	2912872
End bp	2913978
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	71%
IMG OID	640146092
Product	Ku protein
Protein accession	YP_001077018
Protein GI	126456321
COG category	[S] Function unknown
COG ID	[COG1273] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02772] Ku protein, prokaryotic

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0677507
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGCGCA TGATCTGGAA AGGCGCGATC AGCTTCGGGC TCGTGCACGT GCCGGTGCAG 
CTGTATCCGG CCACGCGCAC CGTGAAGCCT TCGTTTCGCC TGCTCGACAA GCGTTCGCTC 
GATCCGGTCG GCTATCGGCA GATCAACAAG CGAACCGGCA AGGCCGTGCC GCGCGAGGAC 
ATCGTGCGCG GCTACGAGTA CGAGAAGGAA CGTTACGTGA TCCTGACCGA CGAGGAGATT 
CGCGCGGCGA ATCCGGAATC GACGCAGACG GTCGACATCC TGACGTTCGT CGACGATGAG 
GCGGTGTCGT TCCTCTATCT CGACACGCCG TACTACCTCG TGCCCGATCG CGGCGGCGAG 
AAGGTCTACG CGCTGCTGCG CGACGCGCTG AAGCGCTCGG GCAAGATCGG CATCGCGCTC 
GTCGTGATGC GCGACCGGCA GCATCTGGGC GCGGTGATTC CGGTCGGGCC GCTGCTCGCG 
CTCGACACGC TGCGCTGGCA GGATGAGCTG CGGCCGCTCG CGGAGATCGA CGCGCCCGCC 
GCCGACGCGA AGAAGGCGGG CGTGAGCGCG CGCGAGTTCG AGATGGCGGC GAAGCTGATC 
GACGACATGT CCGGCGACTG GTCGCCCGAC GATTATCACG ACACGTTCCG CGACGACATC 
CTCGCGCTCG TCGACAGGAA GGTGCGCGAA GGGCGGGTCG AGGAAATTGC GCAGGAGGAC 
ACGGCGCCGG CGCGGCGCAC CGCGGACATC GTCGATCTGA CCGAGCTGCT CAAGCGCAGC 
CTCGGCCGCG CGAAGGGGCC GAGGCGCGCA CCGGACGGCG GCGCGAACGA ACGCGGCGAC 
AGCGGCGAAG GCGGCGACAG CGGCGAAGGC GGCGGACGAG GCGGCGGCGA ACTCGCGCGC 
GAGCTCGAGC GAAGCGTCGG CGGAACGCGC GGCGGGCGTG GCGGCGGCCG CAAGAAGGCC 
GAGCCGCATG CGCCGCCGCG CAAGCGCGCG CAGGCGGCCG CGACGAAGCG GGGGAAACAG 
GCGAAGCCGC GCGACGGCGC GTCGCGCGCG TCGGCGCGCA CGGCCGCGAA GAAGCCCGCC 
GCCGCGCGCA AGCGGCGCGC CGCCTGA

Protein sequence

MARMIWKGAI SFGLVHVPVQ LYPATRTVKP SFRLLDKRSL DPVGYRQINK RTGKAVPRED 
IVRGYEYEKE RYVILTDEEI RAANPESTQT VDILTFVDDE AVSFLYLDTP YYLVPDRGGE 
KVYALLRDAL KRSGKIGIAL VVMRDRQHLG AVIPVGPLLA LDTLRWQDEL RPLAEIDAPA 
ADAKKAGVSA REFEMAAKLI DDMSGDWSPD DYHDTFRDDI LALVDRKVRE GRVEEIAQED 
TAPARRTADI VDLTELLKRS LGRAKGPRRA PDGGANERGD SGEGGDSGEG GGRGGGELAR 
ELERSVGGTR GGRGGGRKKA EPHAPPRKRA QAAATKRGKQ AKPRDGASRA SARTAAKKPA 
AARKRRAA