Gene BURPS668_3861 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3861
Symbol
ID	4883826
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	3765234
End bp	3766298
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	66%
IMG OID	640129789
Product	glycosyl transferase, group 1 family protein
Protein accession	YP_001060855
Protein GI	126441084
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCATCG CCCAAATCGC CCCGCTCTAC GAAGCCGTCC CGCCCAAACT CTACGGGGGC 
ACCGAGCGGG TCGTGTCCTA CCTGACCGAG GCGCTCGTCG AAATGGGGCA CGACGTCACG 
CTGTTCGCAA GCGGGGATTC CGTCACGTCG GCGCGCCTGG AAGCCGCATG GCCGCGCGCG 
CTGCGCCTCG ATCCGTCGAT CCGCGACGCG ATGGCGCCCC ATATGCGCTT GCTCGAGCAG 
GTCGCACGGG CCGCGCACAC GTTCGACATC CTGCACTTCC ACCTCGACTA CCTGCCGTTC 
CCACTGCTGT CGCGCCTCGA CGCGCCGTTC GTCACGACGC TGCACGGCCG CCTCGATCTG 
CCGGAGCTGC AGCCCGTGTT CGACGCGTTC CCGAACGCGC CCGTCGTGTC GATCTCGGAT 
TCGCAGCGCA CGCCGCTGCC GCAAGCCGGA TGGGCCGGCA CCGTCTACCA CGGGCTGCCC 
GACACGCTGC TCACGCCGCA AGCCGGCCGC AAGCCTGAAT ATCTCGCATT TCTCGGCCGC 
ATCTGCCCGG AAAAACGCGT CGACACCGCA ATCCGGATCG CCGCGCAAAG CGGCCTGCCG 
CTGAAGATTG CTGCGAAAGT CGACAAGGTC GACGAGGATT ATTTCAAGGC CGAGATCGAA 
CCGCTGCTCG ATTCCGCGCA CGTCGAGTTC ATCGGCGAGA TCAACGAAGC GCAGAAGCCC 
GCCTTCCTGT CGGGCGCGAA GGCGCTGCTG TTTCCGATCG ATTGGCCCGA GCCGTTCGGC 
CTCGTGATGA TCGAGGCGAT GGCATGCGGC ACGCCCGTCG TCGCGTTCAA CCGCGGCTCC 
GTGCCGGAAG TCATCGATGA CGGCCTGACG GGCTTCATCG TCGAGGACGT ACAGGGCGCG 
GTGGGCGCGC TGCACCGGAT CGACGAATTG TCACGCGATG CAATTCGTGC GCAATTCGAG 
CAACGTTTCA GCTCGCATGC AATGGCGCGG CGCTATATCG ACATCTATGA AACGCTGCGC 
GACGCAACCA AGCAACCGCA ATGGCAGCGC GTAGCGGCGG GTTAA

Protein sequence

MRIAQIAPLY EAVPPKLYGG TERVVSYLTE ALVEMGHDVT LFASGDSVTS ARLEAAWPRA 
LRLDPSIRDA MAPHMRLLEQ VARAAHTFDI LHFHLDYLPF PLLSRLDAPF VTTLHGRLDL 
PELQPVFDAF PNAPVVSISD SQRTPLPQAG WAGTVYHGLP DTLLTPQAGR KPEYLAFLGR 
ICPEKRVDTA IRIAAQSGLP LKIAAKVDKV DEDYFKAEIE PLLDSAHVEF IGEINEAQKP 
AFLSGAKALL FPIDWPEPFG LVMIEAMACG TPVVAFNRGS VPEVIDDGLT GFIVEDVQGA 
VGALHRIDEL SRDAIRAQFE QRFSSHAMAR RYIDIYETLR DATKQPQWQR VAAG