Gene BURPS668_3796 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3796
Symbol
ID	4882453
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	3709455
End bp	3710705
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	67%
IMG OID	640129724
Product	putative lipoprotein
Protein accession	YP_001060791
Protein GI	126440840
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.000000651588
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCAGC GGAATCTGAT CCTGGCGATG GCTTGCGCCG CGCCCTTTAT CTCGGCGTGC 
AGCGGCGGCG GCGGCGGCAG CGAATCGCAG CCGCTCGTCG AGGCGGCGCT CTGCCCTTCG 
TCGGTCGACT ACAACACCGT CTACACGGGC GGCGGCGGCG ACGGCGAACT GGTCAAGCTG 
CAGATCGACA CGACGAAGAT GACCTGGCAA ATCACCTTCG TCGAATCACC GGTTCCGAAG 
ACGACGGGCA CCGCGGCGCC GACGCGCGCG GGCACGACGC AAAGCGGCAC GCTCACGCAG 
GAAACGCTGC TGCCGACGCA GAAGCTCAAC AACTGCGCAT TCCGCCTGAA CGGCGCGAGC 
CTCGATCCGA ACCGGCCGGC GCGCATCTTC CTCGGCATGG GCATCGTGGG CGGCACGATC 
CCGGGCGCGG AAATCCAGTA TGGCGGCCTG CTCGGCCAGG GCGCGATTCC CGACACGACG 
TTCCCGTACT ACCCGTTCAT CGCGTTCTCG TCGCTCGAGA CCGACGTCAC GAAGCTCGCC 
GGCACGTACA GCCAGCTCGG CTACGGCCAG GTGGGTTCGC AGAACTTCGC GCCGACGACG 
ATCGACGCGA AGGTGACGAT CAACCCCGAC GGCACGTGGG TCCGCTGCGA CACGACGGGC 
ATTTACGCGG GCACCTGCCG GCAGCCGGGC ACGAACATCG TGCAATCGGC GGACGGCACG 
GGCGCGTTCG AGACCGATCA CTATCAGGGC CAGGTGAAGC CGACGCTCGC GACCATCCCG 
CAGGCGAAGG GCTACATCAT CGTCGGCAAG CTGCGCAACC AGCTCGTGCC GATCATGATC 
CGCACGGGCG TCGCGAACCC GAACCCGACG CCCGACGCGA ACGGTGTGCC GGGGCTCACC 
GCCGACGACG AATCCGGCAT CTCGATCCTC GCGCCGCAGA CGGCGATTGC GGTCGGCTCG 
CAAAACGGCG AGTACATCGG CGTGGACAGC CAGTTCGATT ACCGGACGAC CGCGCTCGTC 
AACGCGCAGG CGACGCTGCT CGATCCGTTC CAGGCGTCGC AGGCGTCGCT CGCGACGCCG 
CTGAACCTCG ACTACACGCA AGCGGTGCCG GGCACGGTCA CGTCGACCCA CGTCGGCGCG 
AGCAGCACGA CGCCGACCGG CAAGTTCATC TTCACGGGCG GGGTGTTCGG CTTCCTCGAC 
ATGTCCAACT CGTCGTCGCC GTACTTCACG GTCGGCGCCT TCGTGCAGTA A

Protein sequence

MKQRNLILAM ACAAPFISAC SGGGGGSESQ PLVEAALCPS SVDYNTVYTG GGGDGELVKL 
QIDTTKMTWQ ITFVESPVPK TTGTAAPTRA GTTQSGTLTQ ETLLPTQKLN NCAFRLNGAS 
LDPNRPARIF LGMGIVGGTI PGAEIQYGGL LGQGAIPDTT FPYYPFIAFS SLETDVTKLA 
GTYSQLGYGQ VGSQNFAPTT IDAKVTINPD GTWVRCDTTG IYAGTCRQPG TNIVQSADGT 
GAFETDHYQG QVKPTLATIP QAKGYIIVGK LRNQLVPIMI RTGVANPNPT PDANGVPGLT 
ADDESGISIL APQTAIAVGS QNGEYIGVDS QFDYRTTALV NAQATLLDPF QASQASLATP 
LNLDYTQAVP GTVTSTHVGA SSTTPTGKFI FTGGVFGFLD MSNSSSPYFT VGAFVQ