Gene BURPS668_A0161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A0161
Symbol
ID	4886132
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	140998
End bp	142347
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	62%
IMG OID	640130102
Product	hypothetical protein
Protein accession	YP_001061167
Protein GI	126444660
COG category	[S] Function unknown
COG ID	[COG3522] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03353] type VI secretion protein, VC_A0114 family

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTGGC ATAACAAAGT GGTGTGGAAC GAAGGACTGT TTCTTCTTCC CCAGCTGTTT 
CAACAACAGG AACGGTACTT CGAATATTTC GCGCACAAGC GGGCCGCGGT CCTCAGCCCG 
TTTTTCTGGG GATTCAGCCG ATACGAAATC GATCAGGAGT CGCTATCGTT CGGCAAGCTC 
GTGTTCAAGA GCGGTGCGGG AATATTTCCC GACGGAACGC CGTTCGACGT GCCGGGGCAC 
ACGCCGCCGC CGCCGCCGCT GACGATTGCC GCCGAGCATC AGGATCAGGT GATTTATCTC 
GCGGTGCCGC TGCGTCTGCC GAATACGGAG GAGACCGCGT TCGACGAACA AGCGGGATCG 
CTTGCGCGCT ATTCGGCGTT CGAGATCGAA TTGCGCGACA GCAATGCGAT CGGTCAAGGG 
CCCAAGCCGG TACAGCTCGC GAACATGCGG CTGCGCCTGC TGCCGGAAAA GGAGCTGACG 
CAGTCCTGGA TCGGTATTGC CTTGACGCGC GTGAAGACGC TTCACGCCGA CGGCTCGGTC 
GCGCTGTACG ACGGTGACCA CATCCCGCCC GTCAGCCAGT ACGGAGCGAA CCCGCTGCTG 
CGCGAATGGG CGACCCAGTT GCATGGCCTC GCGAAACTGC GAGCCGACGC GCTGGCGACG 
CGCCTGTCCG GCAGCGATGG CCGGGCCGGG GCGGCGGCCG AGGTGGCGGA TTATTTGTTG 
CTGCAGGTGC TGAACCGGTA TGAACCGCTG CTCGAGCACA TCTGCAGGAT TCGCGAAATG 
CCGCCCGTCA CGCTCTATCG CGAGCTGTCG ATGCTGGCAG GCGAATTGTC GACGTTCGTG 
CGCCCGCAAA CGCGCCGTCC GCGGCCGACG CCCGGTTACG ATCATGCGCA GTTGTATGCG 
AGCATTCGCC CGCTGGTCGA CGAGGTGCAC TACCTGTTGA ACCAGGTTCT GATTCGAGGC 
GCGCAGCCGA TCCCGCTCAC CGAGCAGCCG CACGGCATTC GCGTGGCCAC GATGTTGCCG 
TCGGAACTCG CGGGCTATTC GAGCCTCGTG CTCGCCGTGG GCGCGCAAAT GTCGCCGGAC 
GTGTTGCAGC AGCAGTTCGC ATCCCAAACG AAGATCAGCC ATCCGCAGCG GCTGCCGGAG 
CTCATTCGCT CTCATTTGCC GGGCATGACG ATGATTCCGT TGCCGGTGCC TCCGCGGCAG 
ATTCCGTTCA ATTCCAGCTA TATCTATTAC GAGCTATCCC GCACGGGGCC GTTCTGGGAA 
CAGATTGCGC AACAAGGCGG GCTGGCGATG CACATCGCGG GCCACTTCCC TGAACTCAAG 
CTCGAACTTT GGGGAGTGCG TCACAAATGA

Protein sequence

MSWHNKVVWN EGLFLLPQLF QQQERYFEYF AHKRAAVLSP FFWGFSRYEI DQESLSFGKL 
VFKSGAGIFP DGTPFDVPGH TPPPPPLTIA AEHQDQVIYL AVPLRLPNTE ETAFDEQAGS 
LARYSAFEIE LRDSNAIGQG PKPVQLANMR LRLLPEKELT QSWIGIALTR VKTLHADGSV 
ALYDGDHIPP VSQYGANPLL REWATQLHGL AKLRADALAT RLSGSDGRAG AAAEVADYLL 
LQVLNRYEPL LEHICRIREM PPVTLYRELS MLAGELSTFV RPQTRRPRPT PGYDHAQLYA 
SIRPLVDEVH YLLNQVLIRG AQPIPLTEQP HGIRVATMLP SELAGYSSLV LAVGAQMSPD 
VLQQQFASQT KISHPQRLPE LIRSHLPGMT MIPLPVPPRQ IPFNSSYIYY ELSRTGPFWE 
QIAQQGGLAM HIAGHFPELK LELWGVRHK