Gene BURPS1106A_2087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2087
Symbol
ID	4901478
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	2081211
End bp	2082182
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	66%
IMG OID	640135317
Product	major fimbrial subunit protein
Protein accession	YP_001066352
Protein GI	126452242
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3539] P pilus assembly protein, pilin FimA
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGATTGA AACGCGAACG GCGTGCGCGG CGCTCCCGCC TGCCCGCGGC GGCAGGCGGC 
CTGTGGCTTG TCGTTGCCGC GCTGCCGCCC GGCGCACGGG CAGCGACTTG CGAAGGCGAC 
AAGACACTCG TCACGCTTCC GGCCATCGCG GTCGCGGCCG ACGCGCCGGT GGGAACGGTG 
CTGTGGCGTC AGAAGGGGAT CGCTTTCAGC ACCTATTGCA CGTTGGGATG GTTCGACACC 
AGCAACATTT ATGTCTGGCG CGCCGACCTG CGCTCGGCGC TGCAGCCATA TGGGCTGACG 
TTCTGGCTGA CTTACGGAGG GCAGGGCGGC AACACCGCGC TGCAAATCAA GGAGCCGATG 
GTCGTCGATC TCGGCGGAAA GGCCGGCTAT GCGAGCGGCT CCGTCGACCT GGAACTGAGG 
AAGACGGGCG TGACGCCGGC GCAAGGCGTC GTCGGCGCGG CGGACATCCC CGCGTTCTAT 
CTCGATAGCA ATACGAACTA CAACAAAGGC TCGCACTACA TCCGCGGGCT GACCAACATT 
TCGTTCGTCT CCTATACCTG CGACATCGAT ACGGGGTCGC GCAGCATGAA CGTGCCGCTC 
GGCGACGTGC GCGTCGATCG CTTCAGCGGC ATCGGCTCCA CCTTCGCGGA TCGGAATTTC 
GGCATCGGCA TGACGTGCAC GCAGCCGGCC GGCACGTACG ATATCGCGCT GACGTTTTCC 
GCGACGGCGG ACAGCTCCGG CGCACCGGGC GTGCTCGCGA TTACGCAAGG GGCGTCTTCC 
GCGTCCGGAG TCGGCATTCA GTTGCTGATG AACGGCTCGC CGGTGACTTT CGGCGCCGTC 
CTCGACGCGG GCAGCGCGAC CGCGGGCGCG ACGCTGACGA TCCCGATGAC GGCACGCTAT 
TATCAGACCG GCAGTGTCGT GACGCCGGGC GCGGCGAACG GGATCGCGAC GTTCGCCGTC 
AGCTACAAGT GA

Protein sequence

MRLKRERRAR RSRLPAAAGG LWLVVAALPP GARAATCEGD KTLVTLPAIA VAADAPVGTV 
LWRQKGIAFS TYCTLGWFDT SNIYVWRADL RSALQPYGLT FWLTYGGQGG NTALQIKEPM 
VVDLGGKAGY ASGSVDLELR KTGVTPAQGV VGAADIPAFY LDSNTNYNKG SHYIRGLTNI 
SFVSYTCDID TGSRSMNVPL GDVRVDRFSG IGSTFADRNF GIGMTCTQPA GTYDIALTFS 
ATADSSGAPG VLAITQGASS ASGVGIQLLM NGSPVTFGAV LDAGSATAGA TLTIPMTARY 
YQTGSVVTPG AANGIATFAV SYK