Gene BURPS1106A_1793 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1793
Symbol
ID	4899856
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	1754657
End bp	1755667
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	73%
IMG OID	640135023
Product	type II secretion system protein
Protein accession	YP_001066062
Protein GI	126452133
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2064] Flp pilus assembly protein TadC
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.105995
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCCCA GCCGCCTCGG CGCAATCGCG CTCGTTCTCG GCGCAATCGG CGTGCTGATG 
CTCGCCGCGC TCGCGATCAT GCAGGCCGTG CTCGCGCGGC GCACCGGCCG CACGCTCGCG 
GACGCGCTCG ATCAGCGCGC CGCCGCGTTG GAGGCGGCCG CCGCGCGGGT CGCGGCGGGG 
GCGGCCGGCG CGGCGCGCGC GGGCATGCCC GAGGCGGCGC CTGACGCGCG CCGTCCGCGC 
TTCGCGGCGC TGCTCGATCG CGCGGGCCGG TTCGGAATGC GGCTGCTCGA TACGCGGCTC 
GGCAAGCAGA TCGTCGCCGA CGAAGACCGG ATGCTGCTCG AACAGTGCGG CTACGTCGAC 
GCGCACACGC GCGGCATCTT CCTGAGCGCG CGGATCGCGT GTGCGATCGC GCTGCCCGCC 
GCCGTCGCGC TCGTCGGCGG CGAGCCGGTC CGCACGCATC TGGGCGCGTG GGTCGCGCTG 
TCGGTGATCG CCGGCTTCAT GCTGCCGAAG ACCTACGTGC GCCGCCGCGC GGCGGCGCGC 
CGCCAGTCCG TCGTCGACGA GATGCCGCTG CTCGTCGACA TGCTGCGGCT CTTGCAGGGC 
GTCGGGCTGT CGCTCGACCA GAGCATCCAG GTCGTCACCA ACGACTTCAG GGGGATGCTG 
CCCGTGCTGT CGTCGGAGCT CGGGATCGCG CAGCGGCAGT TCGTCGCGGG GCGCACGCGC 
GAGCAGTCGC TGCAGCGTCT CGCGACGAGC TTCGACAACG AGGACCTGCG CGCGATCGTG 
CGCCTGCTGA TCCAGGTCGA CAAGCACGGC GGCGCGGTGC AGGAGCCGCT CAAGCAGTTC 
GGCGACCGGC TGCGCGAAGT GCGCCGCGCG ATGCTGCGCG AGCGCATCGG CCGCCTTACG 
GTGAAAATGA CGGGCGTGAT GATTCTCACG CTGCTGCCCG CGCTGTTCAT CGTGACGGCG 
GGGCCGGGGA TGCTCGCCGT CACGCATGCG CTCACGGCCG CGCGCCGCTA G

Protein sequence

MDPSRLGAIA LVLGAIGVLM LAALAIMQAV LARRTGRTLA DALDQRAAAL EAAAARVAAG 
AAGAARAGMP EAAPDARRPR FAALLDRAGR FGMRLLDTRL GKQIVADEDR MLLEQCGYVD 
AHTRGIFLSA RIACAIALPA AVALVGGEPV RTHLGAWVAL SVIAGFMLPK TYVRRRAAAR 
RQSVVDEMPL LVDMLRLLQG VGLSLDQSIQ VVTNDFRGML PVLSSELGIA QRQFVAGRTR 
EQSLQRLATS FDNEDLRAIV RLLIQVDKHG GAVQEPLKQF GDRLREVRRA MLRERIGRLT 
VKMTGVMILT LLPALFIVTA GPGMLAVTHA LTAARR