Gene BURPS1710b_1946 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_1946
Symbol
ID	3691533
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	+
Start bp	2119823
End bp	2120833
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	73%
IMG OID	637728402
Product	hypothetical protein
Protein accession	YP_333345
Protein GI	76808991
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2064] Flp pilus assembly protein TadC
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000366161
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCCCA GCCGCCTCGG CGCAATCGCG CTCGTTCTCG GCGCAATCGG CGTGCTGATG 
CTCGCCGCGC TCGCGATCAT GCAGGCCGTG CTCGCGCGGC GCACCGGCCG CACGCTCGCG 
GACGCGCTCG ATCAGCGCGC CGCCGCGTTG GAGGCGGCCG CCGCGCGGGT CGCGGCGGGG 
GCGGCCGGCG CGGCGCGCGC GGGCATGCCC GAGGCGGCGC CTGACGCGCG CCGTCCGCGC 
TTCGCGGCGC TGCTCGATCG CGCGGGCCGG TTCGGAATGC GGCTGCTCGA TACGCGGCTC 
GGCAAGCAGA TCGTCGCCGA CGAAGACCGG ATGCTGCTCG AACAGTGCGG CTACGTCGAC 
GCGCACACGC GCGGCATCTT CCTGAGCGCG CGGATCGCGT GTGCGATCGC GCTGCCCGCC 
GCCGTCGCGC TCGTCGGCGG CGAGCCGGTC CGCACGCATC TGGGCGCGTG GGTCGCGCTG 
TCGGTGATCG CCGGCTTCAT GCTGCCGAAG ACCTACGTGC GCCGCCGCGC GGCGGCGCGC 
CGCCAGTCCG TCGTCGACGA GATGCCGCTG CTCGTCGACA TGCTGCGGCT CTTGCAGGGC 
GTCGGGCTGT CGCTCGACCA GAGCATCCAG GTCGTCACCA ACGACTTCAG GGGGATGCTG 
CCCGTGCTGT CGTCGGAGCT CGGGATCGCG CAGCGGCAGT TCGTCGCGGG GCGCACGCGC 
GAGCAGTCGC TGCAGCGTCT CGCGACGAGC TTCGACAACG AGGACCTGCG CGCGATCGTG 
CGCCTGCTGA TCCAGGTCGA CAAGCACGGC GGCGCGGTGC AGGAGCCGCT CAAGCAGTTC 
GGCGACCGGC TGCGCGAAGT GCGCCGCGCG ATGCTGCGCG AGCGCATCGG CCGCCTCACG 
GTGAAAATGA CGGGCGTGAT GATTCTCACG CTGCTGCCCG CGCTGTTCAT CGTGACGGCG 
GGGCCGGGGA TGCTCGCCGT CACGCATGCG CTCACGGCCG CGCGCCGCTA G

Protein sequence

MDPSRLGAIA LVLGAIGVLM LAALAIMQAV LARRTGRTLA DALDQRAAAL EAAAARVAAG 
AAGAARAGMP EAAPDARRPR FAALLDRAGR FGMRLLDTRL GKQIVADEDR MLLEQCGYVD 
AHTRGIFLSA RIACAIALPA AVALVGGEPV RTHLGAWVAL SVIAGFMLPK TYVRRRAAAR 
RQSVVDEMPL LVDMLRLLQG VGLSLDQSIQ VVTNDFRGML PVLSSELGIA QRQFVAGRTR 
EQSLQRLATS FDNEDLRAIV RLLIQVDKHG GAVQEPLKQF GDRLREVRRA MLRERIGRLT 
VKMTGVMILT LLPALFIVTA GPGMLAVTHA LTAARR