Gene BURPS1106A_A2202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2202
Symbol
ID	4906289
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	2151501
End bp	2152355
Gene Length	855 bp
Protein Length	284 aa
Translation table	11
GC content	72%
IMG OID	640145307
Product	YscJ/HrcJ family type III secretion apparatus lipoprotein
Protein accession	YP_001076235
Protein GI	126457668
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4669] Type III secretory pathway, lipoprotein EscJ
TIGRFAM ID	[TIGR02532] prepilin-type N-terminal cleavage/methylation domain [TIGR02544] type III secretion apparatus lipoprotein, YscJ/HrcJ family

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.357372
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATCATGA AACCACTCCG TCTCCCGATT TCCGCCGCCG GCGCGCGCCG CGCCGCCCGC 
CTCGCCGCGC TCGTCGCGTG CGTGGCGCTC TTCGCCGGCT GCCGGCAGGA GCTGTACGGC 
GGCCTCGCCG AGCGCGACTG CAACGAGATG ATGGCCGCGC TGCTGCAAAA CGGCGTCGAC 
GCGCAGAAGA AGACGCCCGA CGGCGGCAAG ACATGGACGC TCGCCGTCGA CGACAAGCAG 
ATCGTCAAGG CGATGGAAGT GCTGCGCGCG CGCGGGCTGC CCGCGACGCG CTACGACGAT 
CTCGGCGCGC TGTTCAAGAA GGACGGCCTC GTGTCGACGC CGACCGAGGA GCGCGTGCGC 
TTCATCTACG GCGTGTCGCA GGAGCTGTCG GACACGCTGT CGAAAATCGA CGGCGTCGTC 
GTCGCGCGCG TGCACATCGT GCTGCCGAAC AACGATCCGC TCGCGCAGGT CGCGAAGCCC 
TCGTCGGCCT CGGTGTTCAT CAAGTACCGG CCGAACGCGA ATCTCGCGAC GCTCACGCCG 
CAGATCAAGA ACCTCGTCGT TCATAGCGTC GAAGGGCTGA CGTACGACGA AGTGAGCGTC 
ACCTCCGTCG CGGCCGATCC GGTCGATCTC GTGTCGGCCG CGCAGCCCGC CGCGCAGAAC 
TCCCGCGGCG CGACGCTCGT CGGCGTGCTG ATCGCGCTCG CCGTGGGCGG CGCGCTCGCG 
GCCGCGGGCG GCGCGCTGTG GTGGCGCGCG CGCAAGCGCG GCGGCGGCGC GGGCGCGCAC 
GGGATCGCCG CGCGGCCGCG CGGCGGCGCC CGCGACGCGA AGGCCGCCGC GCCCCGGCAG 
GCCGGCGCGC AATGA

Protein sequence

MIMKPLRLPI SAAGARRAAR LAALVACVAL FAGCRQELYG GLAERDCNEM MAALLQNGVD 
AQKKTPDGGK TWTLAVDDKQ IVKAMEVLRA RGLPATRYDD LGALFKKDGL VSTPTEERVR 
FIYGVSQELS DTLSKIDGVV VARVHIVLPN NDPLAQVAKP SSASVFIKYR PNANLATLTP 
QIKNLVVHSV EGLTYDEVSV TSVAADPVDL VSAAQPAAQN SRGATLVGVL IALAVGGALA 
AAGGALWWRA RKRGGGAGAH GIAARPRGGA RDAKAAAPRQ AGAQ