Gene BURPS1106A_3942 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3942
Symbol
ID	4902342
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	3849699
End bp	3850763
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	66%
IMG OID	640137168
Product	glycosyl transferase, group 1 family protein
Protein accession	YP_001068162
Protein GI	126454318
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.946253
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCATCG CCCAAATCGC CCCGCTCTAC GAAGCCGTCC CGCCCAAACT CTACGGGGGC 
ACCGAGCGGG TCGTGTCCTA CCTGACCGAG GCGCTCGTCG AAATGGGGCA CGACGTCACG 
CTGTTCGCAA GCGGGGATTC CGTCACGTCG GCGCGCCTGG AAGCCGCATG GCCGCGCGCG 
CTGCGCCTCG ATCCGTCGAT CCGCGACGCG ATGGCGCCCC ATATGCGCTT GCTCGAGCAG 
GTCGCACGGG CCGCGCACAC GTTCGACATC CTGCACTTCC ACCTCGACTA CCTGCCGTTC 
CCACTGCTGT CGCGCCTTGA CGCGCCGTTC GTCACGACGC TGCACGGCCG CCTCGATCTG 
CCGGAGCTGC AGCCCGTGTT CGACGCGTTC CCGAACGCGC CCGTCGTGTC GATCTCGGAT 
TCGCAGCGCA CGCCGCTGCC GCAAGCCGGA TGGGCCGGCA CCGTCTACCA CGGGCTGCCC 
GACACGCTGC TCGCGCCGCA AGCCGGCCGC AAGCCTGAAT ATCTCGCGTT TCTCGGCCGC 
ATCTGCCCGG AAAAACGCGT CGACACCGCA ATCCGGATCG CCGCGCAAAG CGGCCTGCCG 
CTGAAGATTG CTGCGAAAGT CGACAAGGTC GACGAGGATT ATTTCAAGGC CGAGATCGAA 
CCGCTGCTCG ATTCCGCGCA CGTCGAGTTC ATCGGCGAGA TCAACGAAGC GCAGAAGCCC 
GCCTTCCTGT CGGGCGCGAA GGCGCTGCTG TTTCCGATCG ATTGGCCCGA GCCGTTCGGC 
CTCGTGATGA TCGAGGCGAT GGCATGCGGC ACACCCGTCG TCGCGTTCAA CCGCGGCTCC 
GTGCCGGAAG TCATCGATGA CGGCCTGACG GGCTTCATCG TCGAGGACGT ACAGGGCGCG 
GTGGGCGCGC TGCACCGGAT CGACGAATTG TCACGCGATG CAATTCGTGC GCAATTCGAG 
CAACGTTTCA GCTCGCATGC AATGGCGCGG CGCTATATCG ACATCTATGA AACGCTGCGC 
GACGCAACCA AGCAACCGCA ATGGCAGCGC GTAGCGGCGG GTTAA

Protein sequence

MRIAQIAPLY EAVPPKLYGG TERVVSYLTE ALVEMGHDVT LFASGDSVTS ARLEAAWPRA 
LRLDPSIRDA MAPHMRLLEQ VARAAHTFDI LHFHLDYLPF PLLSRLDAPF VTTLHGRLDL 
PELQPVFDAF PNAPVVSISD SQRTPLPQAG WAGTVYHGLP DTLLAPQAGR KPEYLAFLGR 
ICPEKRVDTA IRIAAQSGLP LKIAAKVDKV DEDYFKAEIE PLLDSAHVEF IGEINEAQKP 
AFLSGAKALL FPIDWPEPFG LVMIEAMACG TPVVAFNRGS VPEVIDDGLT GFIVEDVQGA 
VGALHRIDEL SRDAIRAQFE QRFSSHAMAR RYIDIYETLR DATKQPQWQR VAAG