Gene BURPS668_3088 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3088
Symbol
ID	4884777
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	3029716
End bp	3030822
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	66%
IMG OID	640129016
Product	glycosyl transferase, group 4 family protein
Protein accession	YP_001060100
Protein GI	126439021
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0472] UDP-N-acetylmuramyl pentapeptide phosphotransferase/UDP-N-acetylglucosamine-1-phosphate transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCAGCT TCGCCGTCGG CTTCATCGTC TCGCTTCTCG TCACGCTGCT CATCGTCCGC 
TATGCGCACC TGCACGAACG ATTCTCGATC GACAACGATC TTGCCGGCGT GCAGAAATTC 
CATGCGCGGC CGGTGCCGCG CGTGGGCGGC ACCGGCATCC TGATCGGGCT CGTCGTCGCG 
ACGGCGCTGC TGTCGCGGCG ATACCCGGCG ATCGCGGGCG GCATCCTCGG GCTCGCCGCG 
TGCGGGCTGC CCGCCTTCGC CTCCGGGCTG ATCGAAGACC TGACGAAGAA GGTGACGCCC 
GCGGTGCGGC TCGTCTGCAC GATGGCGGCC GCGGCGCTCG CGTTCGCGCT GATGGGCATC 
GCGATCACGC GCATCAGCGT GCCGCCCCTC GACTTCCTGC TCGGCTATAC GGCGATCTCG 
GCCGCGGTCA CGGTGCTCGC CGTCGCCGCG CTCGCGAACG CGGTCAACAT CATCGACGGC 
TTCAACGGCC TCGCGTCGAT GGTCGCGTTC ATGATGTTCG CGTCGCTCGC GTACGTCGCG 
TTCCAGGTCG GCGACCCGGT CGTGATGTCC GGCTCGATCG TGATGATGGG CGCGATCATG 
GGCTTTTTCA TCTGGAACTT CCCGGCGGGC CTCATCTTCC TCGGCGACGG CGGCGCGTAC 
TTCATCGGCT TCATGCTCGC CGAGCTCGCG ATCTCGCTCG TGATGCGGCA CCGCGAAGTG 
TCCGCGTGGT ATCCGGTGCT GCTGTTCATG TACCCGATCT TCGAGACCTG CTTCTCGATC 
TACCGGAAGA AATTCGTTCG CGGCATGTCG CCGGGCATCC CGGACGGCGT GCATCTGCAC 
ATGCTCGTCT ACAAGCGGCT GATGCGCTGG GCGGTGGGCA CGCGCGCCGC GCACGAGCTC 
ACGCGCCGGA ACTCGCTGAC CTCGCCCTAT CTATGGCTGC TCTGCCTCGT CGCGGTGATC 
CCCGCCACCC TGTTCTGGCA GCATACGATC CACCTGTTCG CGTTCGTGAT CGTGTTCGCG 
CTCACTTACG TGTGGCTCTA CGTAAGCATC GTCCGGTTCA AGTCGCCGAG ATGGATGGTG 
ATCCGCAAGC GGCTGCCGAA ACGGTGA

Protein sequence

MLSFAVGFIV SLLVTLLIVR YAHLHERFSI DNDLAGVQKF HARPVPRVGG TGILIGLVVA 
TALLSRRYPA IAGGILGLAA CGLPAFASGL IEDLTKKVTP AVRLVCTMAA AALAFALMGI 
AITRISVPPL DFLLGYTAIS AAVTVLAVAA LANAVNIIDG FNGLASMVAF MMFASLAYVA 
FQVGDPVVMS GSIVMMGAIM GFFIWNFPAG LIFLGDGGAY FIGFMLAELA ISLVMRHREV 
SAWYPVLLFM YPIFETCFSI YRKKFVRGMS PGIPDGVHLH MLVYKRLMRW AVGTRAAHEL 
TRRNSLTSPY LWLLCLVAVI PATLFWQHTI HLFAFVIVFA LTYVWLYVSI VRFKSPRWMV 
IRKRLPKR