Gene BURPS1106A_A2170 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2170
Symbol
ID	4903744
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	2124159
End bp	2125769
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	71%
IMG OID	640145275
Product	type IV pilus protein PilQ
Protein accession	YP_001076203
Protein GI	126458355
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2804] Type II secretory pathway, ATPase PulE/Tfp pilus assembly pathway, ATPase PilB
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.284038
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCACG ACGCGCAACG ACCCGACACG GCCGCCGCGC GCGCGACGCC GAGCGCCGCC 
GACGCCGCCG CGCCGCCGCG CGGCCCGCGC GCGGTCAGCG AGGCGGGCGA TTTCGCCGCG 
AGCGTCGAGG AGCGCAAGTT CGTCTGCCTG TTCGACGACG GGCGGCTGCT GATCGCCGAA 
GGCCACGAGA TGAATCCGTT CGTGCTGTCG TATCGCGCGC GCCTCGACCG GATGGGCCGG 
CCGTACCGGC CGACGCCGGC GACGCTGATG CAGGTGCGCG AGGCGTACCG CCAGCACGTG 
GCGGGCGGCG GCGAGCGGCT CGACCACACG GTGATGCAGG TGCTCGCGAA GGAGCTGATC 
GGCCGCGCGT GCCGCGAGCG CGCATCCGAC GTGCACATTC GCGTGCGCCG CTTCAGCACG 
GAGGTCTACT TCCGGATCCA CAACGAACTC ATGCGCGTGA ACGAGCACAC GCGCGAGCAC 
GGCGAGCGGC TGCTCGCGAC GCTGTATGGC GCGATGACGA CCGTCTCGGA CAACAGCTAC 
CGGCCGAGCG AGCGGCAGGA CGCGAGCATC GGCGACCGCG ACAAGCTGCC GGACGACCTG 
TACGGCGTGC GGATCGCGAC GACGCCGACG AGCGAGGGCA GCCTGATGGT GCTGCGGCTG 
CTGTACAACG ATGCGGGCGA CGCGACCGAT CTCGCGGCGC TCGGCTTCGC GCCCGAGCAC 
GTCGCCGCGT TCCGCATGCT GCGCGCGCAG CCGCACGGGA TGAACATCAT CAGCGGCCCG 
ACGGGCTCCG GCAAGTCGAC GACGCTGCAG CGCATGCTCG CCGCGCAGAT CGACGAATCG 
CACGGCAGCC TGCACGTGAT CACCGTCGAG GATCCGATCG AATATCCGAT CGACGGCGCG 
GTGCAGACGC CGGTGGCGAA CGCGCCGACG GAGGACGCCC GCGCGCTCGC GTTCGCGGCG 
GCGATCACCA ACGCGATGCG GCTCGATCCG GACACGATCA TGATCGGCGA GATCCGCGAT 
CGCGCGTCCG GGCAGACGGC GCTGCGCGCG TCGATGACGG GCCATCAGGT GTGGACGACC 
GTGCACGCGA ACAGTGCGCT CGCGATCGCC GATCGCCTGA TCGATCTCGG CCTGCACGCG 
CGGATGATCA CCGATCACAC GGTGATCTCC GGGCTCATCA GCCAGCGCCT CGTGAAGCTG 
CTGTGCCCGC ACTGCAAGGT GCGGCTCCTC GATCATGCGG AGCGGATCGA GCCGGGCCTG 
CTCGCGCGGC TGCGGCTCGC GCTCGACACC CGGATGAGCG AGGTCTGCAT CACGGGCGAC 
GGCTGCGAGC AGTGCGGCAT GGCCGGCACG ATCGGCCGCA CGGTGGTGGC CGAGGTGATC 
CTGCCCGACG CGCGGCTCTT CGAGTTCCTG CGCGACGGCG ACAAGGTCGG CGCGCTCGAG 
TACTGCACCC GCACGCTCGG CGCGATGACG CTCGCCGAGC ACGCACTGCG CAAGGTCGCG 
GCGGGGCTCG TCGATCCGCG CGGCGTCGAG CGCGTGGTCG GCGCGCTCGC GCCGGTGACG 
GGCGACGCGC GACAGCAGCT GTCGCTCGTC GGATTCAGCT ATGGCACTTG A

Protein sequence

MSHDAQRPDT AAARATPSAA DAAAPPRGPR AVSEAGDFAA SVEERKFVCL FDDGRLLIAE 
GHEMNPFVLS YRARLDRMGR PYRPTPATLM QVREAYRQHV AGGGERLDHT VMQVLAKELI 
GRACRERASD VHIRVRRFST EVYFRIHNEL MRVNEHTREH GERLLATLYG AMTTVSDNSY 
RPSERQDASI GDRDKLPDDL YGVRIATTPT SEGSLMVLRL LYNDAGDATD LAALGFAPEH 
VAAFRMLRAQ PHGMNIISGP TGSGKSTTLQ RMLAAQIDES HGSLHVITVE DPIEYPIDGA 
VQTPVANAPT EDARALAFAA AITNAMRLDP DTIMIGEIRD RASGQTALRA SMTGHQVWTT 
VHANSALAIA DRLIDLGLHA RMITDHTVIS GLISQRLVKL LCPHCKVRLL DHAERIEPGL 
LARLRLALDT RMSEVCITGD GCEQCGMAGT IGRTVVAEVI LPDARLFEFL RDGDKVGALE 
YCTRTLGAMT LAEHALRKVA AGLVDPRGVE RVVGALAPVT GDARQQLSLV GFSYGT