Gene BURPS1710b_2044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_2044
Symbol	cpaF
ID	3689881
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	+
Start bp	2210839
End bp	2212404
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	71%
IMG OID	637728500
Product	component of type IV pilus
Protein accession	YP_333439
Protein GI	76810428
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4962] Flp pilus assembly protein, ATPase CpaF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.101478
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCGGCC GGCGTCCGGC CGCTTCATTC GCGCCCGGCG ACGCCGGCGG CGCGCACGAG 
TTCGCGCCCG ACGCCGCGCC GGCGGGTGCG GCGCCGGCCG GCGGCCACGC ATCGGCGCCC 
GACGCGAGCG GCGCGGCACG CGCGCGCGAG CCGGCCGGCG TATCGGGCGC GAGCGCGCCC 
GGCGGGGCGC CGCAGTCCGG CGTCGCGCCA AGCGGCCATC GGCCCGCATC GCGTGACGAC 
CGCATCGACC GCATCGATCG CGATGACGGC CACGACCGCG CGCCCGCGCA AGACCACCAC 
GAGGCGCTGA TCCGCTCGGA GACGTTCAAG ACGATCCGCG CGGTCGTGTT CTCGTCGATG 
AACATGTCGG CCGCGCTGAT GATGTCGCGC GCCGAAGTGC GCGAAGGCAT CGAGCAGGCG 
GCCGCCGACG TGATCGCGCG CGAGCGGCTG ACGGTGACGC TCGCCGAGCA GGCGCTCATC 
GTCGACGAGA TCCTCAACGA CATGTTCGGC GTCGGGCCGA TCGAGCCGTT GCTCGCCGAC 
GAACGCGTGA CCGACATCCT CGTCAACGGC CCCGATCAGG TGTACGTCGA GCGCGCCGGC 
AAGCTCGAGC TCACGCCGCT GAAGTTCCGC GACAACGCGC ACGTGATCAA CGTCGCGCAG 
CGGATCGCGG CGGCGGTCGG GCGGCGCGTC GACGAGAGCA GCCCGATGGT CGACGCGCGG 
CTCGCGGACG GCAGCCGCGT GAACGTCGTG CTGCCGCCGA TCGCGATCCG CGGCGCGTCG 
ATCTCGATCC GCAAGTTCGC CAAGCGCAAC ATCACGCTCG CGCGGATGGC GCAGCAGGGC 
AACCTGTCGC AGGCGATGGT CGAGGTGCTG AAGATCGCGA GCGCGTGCCG GCTGAACATC 
GTGATCTCGG GCGGCACGGG CTCCGGCAAG ACGACGCTGC TGAACGCGCT GTCGCACTTC 
ATCGATTCGC ACGAGCGCAT CGTGACGATC GAGGACGCCG CGGAGCTGCA ATTGCAGCAG 
CCGCACGTCG TGAGCCTCGA GACGCGCCCG GAGAACAGCG AGGGGCTGGG CGGCGTGTCG 
CAGCGCGATC TCGTGCGCAA CGCGCTGCGC ATGCGCCCCG ATCGCATCAT CCTCGGCGAG 
ACGCGCGGCC CGGAGGCGTT CGACGTGCTG CAGGCGATGA ACACCGGGCA CGACGGCTCG 
ATGACGACGA TCCATGCGAA CACGCCGCGC GATGCGATCA CGCGCCTCGA GAGCATGGTG 
ATGATGGCCA ACGGCAACCT GCCGCTCGTG TCGATCCGCC GGCAGATCGC GAGCGCGGTG 
CACATGATCC TGCAGATCGA GCGCATGCGC GACGGCGTGC GGCGCGTCAC GCGCGTGACC 
GAGATCGCCG GCATGGAGGG CGATGTCGTG ATCACGCAGG ATCTGTTCGC GTTCCGCTAC 
GACGCGAGCG CGTTCCAGGA GCAGGTGCAC GGAATGTTCG AATCGTCGTC GCTGCGCCCG 
GCGTTCGCGC AGCGCGCCGC GTATTACGGC CTCGAGGGCG CGCTGCTCGG CGCGTTGCAG 
CCGTGA

Protein sequence

MFGRRPAASF APGDAGGAHE FAPDAAPAGA APAGGHASAP DASGAARARE PAGVSGASAP 
GGAPQSGVAP SGHRPASRDD RIDRIDRDDG HDRAPAQDHH EALIRSETFK TIRAVVFSSM 
NMSAALMMSR AEVREGIEQA AADVIARERL TVTLAEQALI VDEILNDMFG VGPIEPLLAD 
ERVTDILVNG PDQVYVERAG KLELTPLKFR DNAHVINVAQ RIAAAVGRRV DESSPMVDAR 
LADGSRVNVV LPPIAIRGAS ISIRKFAKRN ITLARMAQQG NLSQAMVEVL KIASACRLNI 
VISGGTGSGK TTLLNALSHF IDSHERIVTI EDAAELQLQQ PHVVSLETRP ENSEGLGGVS 
QRDLVRNALR MRPDRIILGE TRGPEAFDVL QAMNTGHDGS MTTIHANTPR DAITRLESMV 
MMANGNLPLV SIRRQIASAV HMILQIERMR DGVRRVTRVT EIAGMEGDVV ITQDLFAFRY 
DASAFQEQVH GMFESSSLRP AFAQRAAYYG LEGALLGALQ P