Gene BURPS1106A_A2086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2086
Symbol
ID	4904522
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	2049868
End bp	2050989
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	74%
IMG OID	640145191
Product	type III secretion regulator YopN/LcrE/InvE/MxiC
Protein accession	YP_001076119
Protein GI	126455484
COG category
COG ID
TIGRFAM ID	[TIGR02511] type III secretion effector delivery regulator, TyeA family [TIGR02568] type III secretion regulator YopN/LcrE/InvE/MxiC

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.350134
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCTCGA TCATCGGCGG CGCGTCGGCC GCGCGGCGCG GCTTTTCGAT CGACGGCACG 
GGGAGCGCGG CGAACCGGCT CGACGCGGAG CCGTCGCTCG ACGACGCGCC GCAGACGGGG 
GCGGCGGGCG CGGCCGACGT GCAGGCGCAA CTCGCCGGCG TCGACGAGGA AGCCGCGAAC 
GCCGCCGCGC AATTCGGCCG GTTCCGCGCG TCGGAGCGCA AGGGGCGGCG CAGCGACGAG 
CTCGAACGGA TTCTCGACAC GGACGCCGAC GAGAAGCTCG ACGAGCTCGC CGCGCTGCTC 
GGCGGCCGCG CGGCGCGCGG CCGCGCGGAC CTCGCGACGC TGCTGCGCGA CGCGCGCGAG 
CGCTTTCGCG ACGAGAGCGA TCTGTTGCTC GCGCTGCGCG AGCTGCGCCG GCGGCGCCGG 
CTCGACGGCG AATCCGTCGA CGCGCTCGAG CGCGCGATCG ACGAACTGCT CGCGGGCGAC 
GGCGCCAAGC GGATCAAGGC GGGCATCAAC GCGGCGCTCA AGGCGAAGGT GTTCGGCGCG 
CGGATGCAGC TCGATGCGCG CCGGCTGCGC GAGCTGTACC GGCAGTTCCT CGAGTTCGAC 
GGCTCGCACC TCGTCATCTA CGAAGACTGG ATCGAGCAGT TCGGCGCGAG CCGCCGCAAG 
CGGATTCTCG ACTACGTGAG CGCCGCGCTG TCGTACGACA TGCAGTCGCA CGATCCGAGC 
TGCGGGTGCG CGGCCGAGTT CGGCCCGCTG CTCGGCACGC TGCATCGCGC GCGCATGCTC 
GCGTCGGCCG ACGAGCAGTT CGTCGGCCGG CTGCTCGACG ACGCGCTCGC GCGCGATTGC 
GGGCTCACCG AGGCGCGCGC GCTCGCGACG ATGCTGGGCG GCCTGCAACG GCCGTTCTCG 
GTCGCCGACG TGCTGCTGGG CACGCTCGGC GATCTGCTCG AGCCGCTCGC GCCCGCCCGT 
CGCTCGCAGT TGTTGCAGCT CGCGCTGCGC GCGTTCGCGG GCGTGCCGAT CGCGCTCTAC 
GGCGACGCCG ACGCGCGCCG CGCGGCGCTC GGCGCGCTCG AGGAACTGAT CGGCGCGACG 
TATGCGCGCG AGCGGCGGCA GGCGCGCCCG CGCGCCGACT GA

Protein sequence

MSSIIGGASA ARRGFSIDGT GSAANRLDAE PSLDDAPQTG AAGAADVQAQ LAGVDEEAAN 
AAAQFGRFRA SERKGRRSDE LERILDTDAD EKLDELAALL GGRAARGRAD LATLLRDARE 
RFRDESDLLL ALRELRRRRR LDGESVDALE RAIDELLAGD GAKRIKAGIN AALKAKVFGA 
RMQLDARRLR ELYRQFLEFD GSHLVIYEDW IEQFGASRRK RILDYVSAAL SYDMQSHDPS 
CGCAAEFGPL LGTLHRARML ASADEQFVGR LLDDALARDC GLTEARALAT MLGGLQRPFS 
VADVLLGTLG DLLEPLAPAR RSQLLQLALR AFAGVPIALY GDADARRAAL GALEELIGAT 
YARERRQARP RAD