Gene BURPS668_A2256 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A2256
Symbol
ID	4885691
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	2187312
End bp	2188610
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	72%
IMG OID	640132193
Product	putative type IV pilus biogenesis protein
Protein accession	YP_001063250
Protein GI	126444180
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCGC AGGTGATTCA AATCGGCCGC CAGCGTTTCG TCGGCGGCCT GTTCTGGCAA 
TCGTTGTCGA GGCGCAACGA GTTGCGCGCC GAAGCGGTCG AGCTCGCGAA GAAACTGAAG 
TTCGACCTGA TGGTGCTGCG CATCGATCGC GGCGTCGCGG CGGCGGGCTA CGCGAACACG 
CGCGACGGCT TCGCGCCCGG GCATCTGTCG CTCGGCGCGA TGGTGTCGCG CGCGATCGCG 
CTGGAGGGCG CGTTCTACAA CGGCCGGCGT CAGCCCGCGC CGAACTGGCT CGGCGCGTTT 
GCGCTGCCCG ACGGGCGCTG GGCGTACTTC GCGGTGCGCG ACCACGCGTT CATGCCGAAC 
GGCGACTGGG TCGGCAGCCG CGAGGAGGCG CTCGAGCGGC TGCATACCGA TTACGCGTGG 
GGCGGCTGGA ACGTCGTGAT CGGCGAGCCG GAGCTCGAGC GGCAGGGCTT CCAGAATTTT 
CAGCCGAAGC GGCTCGACGA TCTGCTGCCG CGCCGCGGCG GCCGGCCGCG CACCGAGCGC 
TGGTGGGCGC TCAGGCCCGT CGAGCGGCGT CTGTCGCCGC GCGCCGCGCT GATCGCCGCG 
ACGGCGGCGT GCGTCGTGCT CGGCGGCGCG TTCGCGTACT GGCATCATCG CGCGAAGGTC 
GAGGCCGAGG AGCGCGAGGC GGCGCTCGAG CGCGTGCGCG CGGAGCTCGC CGCGCGGCAG 
GCGAGAAGCG GCCCCGTCGC GCCGCCGTGG GCGGCGCTGC CCGACGCGCT CGCGTTCGCG 
CGCGCGTGCG CGATGCGCTT CGGGCGGCTC GCGCCGGGCG GCTGGCGGCT CGAACGCTAC 
GAGTGCACGC CGGGCACCGC GCACTACGCG TGGGCGCGCA ACGGCTCGAA CGTGCGCTAC 
CTGCTCGTGG TGGAACCCGG CGCGACGCTC GATACCGACG GCGAGCGCGC GACGCTCGAC 
GTGCCGCTCA CCGCGCCGAC GGCGAACGAT ACGCCGCTTG CCGACGATTC GGTTGTCAGG 
ACACAACTTC TCGCACGTCT CCAATGGCTC GACGCGGCCG CTAAACTGGA GCGGCTGCTT 
CCCGAACAGG GGCCGCGCGC CCCGCTCGCG AATCTCGCGC AACAGGCGGC CGCCTTGCCC 
GCTTCGCCCA CGTGGCGCGC GTACCGGCTG AACGCGAATC TCGGCGGCAT CGCGCCGCCG 
GAGTTCGTGC GCGCGATCGA CGTGCCGGGG TTGCGCGTCG AGCGCATCGC TTACCAGAAC 
AATCAGTGGA CCCTCGAAGG AGTGCTCTAT GCGAAATAG

Protein sequence

MSAQVIQIGR QRFVGGLFWQ SLSRRNELRA EAVELAKKLK FDLMVLRIDR GVAAAGYANT 
RDGFAPGHLS LGAMVSRAIA LEGAFYNGRR QPAPNWLGAF ALPDGRWAYF AVRDHAFMPN 
GDWVGSREEA LERLHTDYAW GGWNVVIGEP ELERQGFQNF QPKRLDDLLP RRGGRPRTER 
WWALRPVERR LSPRAALIAA TAACVVLGGA FAYWHHRAKV EAEEREAALE RVRAELAARQ 
ARSGPVAPPW AALPDALAFA RACAMRFGRL APGGWRLERY ECTPGTAHYA WARNGSNVRY 
LLVVEPGATL DTDGERATLD VPLTAPTAND TPLADDSVVR TQLLARLQWL DAAAKLERLL 
PEQGPRAPLA NLAQQAAALP ASPTWRAYRL NANLGGIAPP EFVRAIDVPG LRVERIAYQN 
NQWTLEGVLY AK