Gene BURPS1106A_A2094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2094
Symbol
ID	4905529
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	2055946
End bp	2056893
Gene Length	948 bp
Protein Length	315 aa
Translation table	11
GC content	71%
IMG OID	640145199
Product	YscJ/HrcJ family type III secretion apparatus lipoprotein
Protein accession	YP_001076127
Protein GI	126456880
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4669] Type III secretory pathway, lipoprotein EscJ
TIGRFAM ID	[TIGR02544] type III secretion apparatus lipoprotein, YscJ/HrcJ family

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCGAT TCGTCTCTTT CTCGCTGCTG CCGGCGCTGC TGCTGCTCGC CGCATGCAAC 
CAGCAGGAGT TGCTGAAGAA CCTGACCGAG CAGCAGGCGA ACGACGTCGT CGCGGTGCTC 
CAGGCGCACG ATCTCGCCGT GCGCAAGGAG GACCTCGGCA AGACCGGCTA TGCGGTGAGC 
GTCGAGCAGG CCGACTTTCC GACCGCCGTC GATCTGCTGC GGCAATACAA CCTGCCGTCG 
CAGGCGCGCG TGCAGATCGC GCAGGCGTTT CCCGCCGACT CGCTCGTCGC GTCGCCGCAG 
GCCGAGCAGG CGAGGTTGCT GTCGGCCGTC GAGCAGCGCC TCGAGCAGAA TCTCGCCGCG 
CTGCAGAACG TCGTGAGCGC GCGCGTGCAG GTGAGCTATC CGCTCAAGCC CTCCGACAGC 
GGCAAGCCAG ACGCGCGGAT GCACGTGGCC GCCCTGCTCA CCTATCGCAA CGACGTGAAC 
GCGGACATCC TCGTGAGCGA AGTGAAGCGG TTCGTGAAGA ACAGCTTCAC GAACATCGAT 
TACGACGACA TCTCGGTGAT CCTGTATCGC GCGCCGTCGC TGTTCCGAGG CGCACCGACG 
ATGCCCGCGT CGCATGCGGG CGGCGCGTGG CTCGCCTGGC TCGCGGCGAT TCCGGTCGCG 
CTCGCGGCCG CCGCCGCGGG CGGGCTCGCC TACCTGCGCC GCCGGCGCGC CGGCGGCTCC 
GATACGCCGG CTCACGCGGC GCCGCGCGCC GAACCCGCGG CGCCGGCCGG CCCCGATGCA 
CGCGAGACGA CCGAGGTGCC GCCCCCGGGC GACGCATTCG ACATATCCGA TGCATCGGAC 
GCCTTCGATG CATCCGGCAC GTCCGCCTCG CCCGGCGCGG CCGCGGACGC CGCTGCGGCC 
GACGCGCCGG GCGCATCGCG CGGCGCGCCG TGGGAGCCGC GCCGATGA

Protein sequence

MKRFVSFSLL PALLLLAACN QQELLKNLTE QQANDVVAVL QAHDLAVRKE DLGKTGYAVS 
VEQADFPTAV DLLRQYNLPS QARVQIAQAF PADSLVASPQ AEQARLLSAV EQRLEQNLAA 
LQNVVSARVQ VSYPLKPSDS GKPDARMHVA ALLTYRNDVN ADILVSEVKR FVKNSFTNID 
YDDISVILYR APSLFRGAPT MPASHAGGAW LAWLAAIPVA LAAAAAGGLA YLRRRRAGGS 
DTPAHAAPRA EPAAPAGPDA RETTEVPPPG DAFDISDASD AFDASGTSAS PGAAADAAAA 
DAPGASRGAP WEPRR