Gene BURPS1106A_A2091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2091
Symbol
ID	4906310
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	2054027
End bp	2055313
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	70%
IMG OID	640145196
Product	type III secretion system protein PrgH/EprH
Protein accession	YP_001076124
Protein GI	126457081
COG category
COG ID
TIGRFAM ID	[TIGR02554] type III secretion system protein PrgH/EprH

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0979619
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAAC CAGATTCCGG ACTTGAAGCT CTGCAACTCC GAATCCTGTT CGGTCCGCTA 
TTCGGCTCGG ATATCGCGAT TCCGTCAGGG GAAGTATTTT TCTGCGTCGG CGAGCAGGTG 
ATCGACGATC GTCCGGCGGA GCATCCGGAA AATCGCGCCG GCCATTTACT GGAGCGCGCG 
GTCGATACGC TGTATATCCC GCACCGGGCC GGCGCGCCGA ATTTCCGCCT GCGTTTTCCG 
GGCGCGCCGA CGCAGGCGGC GCGAACCGCC GAAACCGGCG AAGCCGCGCC CGGCGATTTC 
GAAGTCGATT TTCTGTCGGC GGACGGTTGC GTCACGCAAC GCGCGGCATT CAACACCGTC 
TGCCGCTTCG GCGATATCGC GTTCGCGCTC AGGCGTCAGC GCGAGCCATG GAGCGAGGCG 
GTCATGCACT ACGCGCCGCA CGCGCCTTCG CGTGCGGCGG ACGCCGCCGA GCCGGGCGCG 
CCCGGTGAGC CCGGCGATGG CGGCGAGCGC GCATCGCGCT TCGCGCTGAA GCTCGGCGCG 
CTGCTCGTCG CGGGGGTCGC GCTCGCGGCG CTCGCGTACT GGCAGGTGCA GCGCTATGTC 
GGCGCGCAGA AGCTCGCGAG CGTCAACGGC GTGCTGGCGG GCGCGCCCGT GCCCAACGCG 
ATCCTGCCCG GCGACGACGG CCGGATCTAC GTGCTGAGCG CGTCGCAGGA CGGCGCCGAA 
TGGGACCGCG AGGCGCTGCT GAAGGCGGCG CTGCCGGAGA AGATCGAAGT CGCCGTGATC 
GGCGCGGAGC GGCAACGCGT CGAGCGCCGG CTCGACGAAG CCGGCGTCGA TTTCGTGACC 
GTGCGCCTCG ACGCGCCCGA GCACCCGGAG CTGATCCTCA CCGGCGCCGC GCCCGCCGCC 
GCGCGCGCAC GCGCGATCGG CGAGCTGCGG CACGCGGCCC CGTACGTCCG GGACGTGCGC 
GTGATCGACG CGAGCCTCGG CGCGATCGAG CAGGAGGCGC GCAACGCGCT CGACAAGGTG 
GGCGCGCGCT ACCGGCTGCT CGCGCGGCGC GGCGGCGCGA CGTTCGAGGT GGCGAGCTCG 
TTCGGCGACG AGGAGCTCGC CGCCTTGCAG AACCTCATGC GCTCGTTCGG CCACAAGTGG 
GGCACGCGCC GCGTCGATTT CAAGATCGCG CTGCGCACCG ACTGGCTGAA GGGCAAATCG 
TATCGGGAAG GCGGCGACGG CTACGTGCTG CTCGATCACG CGTCCTGGTA TTTCCCGCAA 
CCCCTGGAAG GAGCACATTA CCGATGA

Protein sequence

MNKPDSGLEA LQLRILFGPL FGSDIAIPSG EVFFCVGEQV IDDRPAEHPE NRAGHLLERA 
VDTLYIPHRA GAPNFRLRFP GAPTQAARTA ETGEAAPGDF EVDFLSADGC VTQRAAFNTV 
CRFGDIAFAL RRQREPWSEA VMHYAPHAPS RAADAAEPGA PGEPGDGGER ASRFALKLGA 
LLVAGVALAA LAYWQVQRYV GAQKLASVNG VLAGAPVPNA ILPGDDGRIY VLSASQDGAE 
WDREALLKAA LPEKIEVAVI GAERQRVERR LDEAGVDFVT VRLDAPEHPE LILTGAAPAA 
ARARAIGELR HAAPYVRDVR VIDASLGAIE QEARNALDKV GARYRLLARR GGATFEVASS 
FGDEELAALQ NLMRSFGHKW GTRRVDFKIA LRTDWLKGKS YREGGDGYVL LDHASWYFPQ 
PLEGAHYR