Gene BURPS1710b_1940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_1940
Symbol
ID	3688900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	+
Start bp	2113730
End bp	2114776
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	73%
IMG OID	637728396
Product	CpaB family Flp pilus assembly protein
Protein accession	YP_333339
Protein GI	76810330
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3745] Flp pilus assembly protein CpaB
TIGRFAM ID	[TIGR03177] Flp pilus assembly protein CpaB

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0235089
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGTGCT GCCGACCACG CTCACGAGCC GCGCGACGGT GCAGATCAAC CCGACCAACA 
TCATATGAAG TACCCGAGCG ACTAGGCCGC AGCGGCGCGC CGCCGGTTTT CCCCAACGTC 
ATTCTCGCTG TTGCACTGAT AACAACCATG GCCAATCATC TGACCAAGAT CATCGCGGGG 
CTGCTGATCG GGATCGCGAT CCTGCTCGGC ATTTACGCAT GGCTGCTCGG GCGCAAGCCG 
GCGCCTGTCG CGCCGGGCGC CGCGCCCGCC GTGGCGACGG CGATGGTGCC CGTCGTCGTC 
GCGGCGCGCG CGCTGCCCGC CGGGCAGCCG ATTCCCGCCG ATGCGCTGAA GGTGCAGCAG 
ACGCCGACGC CGATCGCCGG CGCCTTCCCG AATCCGATGC TCGTGACGGG CCGCATCCCG 
GCGAGCGACA TCGGCGCGCA GGCGCCGGTG CTCGAGAGCG AGCTGATGTC GGGCCTCGCC 
GACCAGATCG CGCCCGGCGA GCGTGCCGTC GCGATCAAGG TCGACGATAC GAACGCGGTC 
GGCAACCGGC TGCGTCCCGG CAATTTCGTC GACGTGTTCG TGAACCTGAA GCGCGAAGGC 
GGCTTCGGTG CGACCGGCTC CGAGATCGCG CAGACCCAGG CGCGGCTGCT GCTGTCGCGG 
GTGCGCGTGC TGTCGTTCGG CGATGCGACG GTGGAGCGCG ACGGCACGCC GGGCCCGACG 
GGCGCGGGCG CGCGCACCGC GGTGCTCGCC GTGCCGACCG CGCAGGTCGA CGCGCTCACG 
CTCGCCGAGG CGAGCGGGCG GCTCGTGCTC GCGCTGCGCA GCCCGCGCGA CGAAGACATC 
GCCGCGCAGA CGGTGGCGAT CCGCGCGCCG GCCGGCGCCG GGCCGTCGAA TCAGGCGGCG 
ACGGGGCTCG TGCTGAGCGA ACTGTCGGGC AGCGGGGCTC CCGCGCAGGC GCCGCGCGCG 
GCTCCGACGC GAGTGACGGC CGCGCCGCAT GCGGCGGGCA GCATCGAAGT GATCCGGGGA 
GGGCGAGCCG AGACGCTCGC CTATTGA

Protein sequence

MRCCRPRSRA ARRCRSTRPT SYEVPERLGR SGAPPVFPNV ILAVALITTM ANHLTKIIAG 
LLIGIAILLG IYAWLLGRKP APVAPGAAPA VATAMVPVVV AARALPAGQP IPADALKVQQ 
TPTPIAGAFP NPMLVTGRIP ASDIGAQAPV LESELMSGLA DQIAPGERAV AIKVDDTNAV 
GNRLRPGNFV DVFVNLKREG GFGATGSEIA QTQARLLLSR VRVLSFGDAT VERDGTPGPT 
GAGARTAVLA VPTAQVDALT LAEASGRLVL ALRSPRDEDI AAQTVAIRAP AGAGPSNQAA 
TGLVLSELSG SGAPAQAPRA APTRVTAAPH AAGSIEVIRG GRAETLAY