Gene BURPS1106A_0234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0234
Symbol	fliF
ID	4903064
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	219248
End bp	221044
Gene Length	1797 bp
Protein Length	598 aa
Translation table	11
GC content	70%
IMG OID	640133464
Product	flagellar MS-ring protein
Protein accession	YP_001064517
Protein GI	126453288
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1766] Flagellar biosynthesis/type III secretory pathway lipoprotein
TIGRFAM ID	[TIGR00206] flagellar basal-body M-ring protein/flagellar hook-basal body protein (fliF)

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACTCGC AGGCCAACTC GCTGATCAAC CCCGACGCCC GTTCGAGCCT TGCGGGCGCA 
TCGCCGCAAG CCGCGGCCGC GGCGGGCGCG CTGCCGGGCG CGGCGGCGGG CGGCGCGGAT 
TTCGGCCTGG GCGGCTTCGC CGAACGCATC CCGGGCCTCT CGCGAATGAA GACGAACCCG 
CGGCTGCCGT TCCTGATCGG CGCGGCGCTC GCCATCGCCG CGATCGTCGC GCTCGTGCTC 
TGGAGCCGCG CGCCCGACTA CCGCGTGCTG TACAGCAACC TGTCCGACCG CGACGGCGGC 
GCGATCATCG CCGCGCTCCA GCAGGCAAAC GTTCCCTATA AGTTCGCCGA CGCGGGCGGC 
GCGATCCTCG TGCCCGCGAA CCAGGTGCAC GAGACGCGCC TGAAGCTCGC CGCGATGGGG 
CTGCCCAAGG GCGGCTCGGT CGGCTTCGAG CTGATGGACA ACCAGAAATT CGGCATCAGC 
CAGTTCGCCG AGCAGGTCAA CTACCAGCGC GCGCTCGAGG GCGAGCTGCA GCGCACCGTC 
GAATCGATCA ACGCGGTGCG CGCCGCGCGC GTGCATCTGG CGATTCCGAA GCCTTCGGTA 
TTCGTGCGCG ATCGCGAGGC GCCGTCGGCG TCGGTGCTCG TCGATCTGTA CCCGGGCCGC 
GTGCTCGACG AAGGGCAGGT GCTCGCCGTC ACGCGCATGG TTTCGTCGAG CGTGCCCGAC 
ATGCCCGCGA AGAACGTGAC GATCGTCGAC CAGGACGGCA ACCTGCTCAC GCAGACCGCG 
TCCGCCACCG GCCTCGACGC GAGCCAGCTC AAGTACGTGC AGCAGATCGA GCGCAACACG 
CAAAAGCGCA TCGACGCGAT CCTCGCGCCG ATCTTCGGCG CCGGCAACGC GCGCTCGCAG 
GTGAGCGCCG ACGTCGACTT CTCGAAGATC GAGCAGACCT CGGAGAGCTA CGGCCCGAAC 
GGCACGCCGC AGCAGAGCGC GATCCGCAGC CAGCAGACGA GCAGTTCGAC CGAGCTCGCG 
CAAAGCGGCG CGTCGGGCGT GCCGGGCGCG CTGTCGAACA CGCCGCCGCA GCCCGCGTCC 
GCGCCGATCG TCGCGAGCAA CGGCCAGCCG GCCGGCCCGG CCGCGACGCC CGTCAGCGAC 
CGCAAGGATT CGACGACGAA CTACGAGCTC GACAAGACCG TGCGGCACGT CGAGCAATCG 
ATGGGCACGA TCAAGCGGCT GTCGGTCGCG GTGGTCGTCA ACTATCAGCC GAGCACCGAC 
GCGAAGGGCC GCGTGACGAT GCAGCCGCTC GCCGCGGACA AGCTCGCGCA GGTCCAGCAG 
CTCGTGAAAG ACGCGATGGG CTACGACGAG AAGCGCGGCG ATTCGGTCAA CGTCGTCAAC 
AGCGCGTTCT CGGCCGCGGC CGATCCGTTC GCGAACCTGC CGTGGTGGCG CCAGCCGGAC 
ATGATCGAAC TCGGCAAGGA CATCGCGAAA TGGCTGGGCG TCGCCGCGGC GGCCGCCGCG 
CTGTACTTCA TGTTCGTGCG CCCGGCGCTG CGCCGCGCGT TCCCGCCGCC CGCGGAGCCC 
GCGGCGGCCG CCGTGCCGGC GCTCGACGGC CCGGACGACA TGCTCGCGCT CGACGGCCTG 
CCGAGCCCCG ACAAGAAGCA GCTTGCCGAG GAGGACGAAG AGCATCCGGC GCTCCTCGCC 
TTCGAAAACG AGAGGAACCG CTACGAACGC AATCTCGACT ACGCGCGCAC GATCGCGCGC 
CAGGATCCGA AGATCGTCGC AACCGTCGTG AAGAACTGGG TGTCCGATGA ACGCTGA

Protein sequence

MDSQANSLIN PDARSSLAGA SPQAAAAAGA LPGAAAGGAD FGLGGFAERI PGLSRMKTNP 
RLPFLIGAAL AIAAIVALVL WSRAPDYRVL YSNLSDRDGG AIIAALQQAN VPYKFADAGG 
AILVPANQVH ETRLKLAAMG LPKGGSVGFE LMDNQKFGIS QFAEQVNYQR ALEGELQRTV 
ESINAVRAAR VHLAIPKPSV FVRDREAPSA SVLVDLYPGR VLDEGQVLAV TRMVSSSVPD 
MPAKNVTIVD QDGNLLTQTA SATGLDASQL KYVQQIERNT QKRIDAILAP IFGAGNARSQ 
VSADVDFSKI EQTSESYGPN GTPQQSAIRS QQTSSSTELA QSGASGVPGA LSNTPPQPAS 
APIVASNGQP AGPAATPVSD RKDSTTNYEL DKTVRHVEQS MGTIKRLSVA VVVNYQPSTD 
AKGRVTMQPL AADKLAQVQQ LVKDAMGYDE KRGDSVNVVN SAFSAAADPF ANLPWWRQPD 
MIELGKDIAK WLGVAAAAAA LYFMFVRPAL RRAFPPPAEP AAAAVPALDG PDDMLALDGL 
PSPDKKQLAE EDEEHPALLA FENERNRYER NLDYARTIAR QDPKIVATVV KNWVSDER