Gene BURPS668_A0814 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A0814
Symbol
ID	4885959
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	790106
End bp	791113
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	73%
IMG OID	640130754
Product	rhamnosyltransferase
Protein accession	YP_001061813
Protein GI	126443291
COG category	[R] General function prediction only
COG ID	[COG1216] Predicted glycosyltransferases
TIGRFAM ID	[TIGR01556] L-rhamnosyltransferase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0467732
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGACCT TGGGCGCGCT GGTGATTCTG TATTACCCGA CCGACGAGCA ACTGTCGGGC 
CTGGAGGCGC TCGCGCGCGA CAGCGACGCG CTCGCGGTGA TCGACAACAC GCCGCACGAG 
CACGCGGCGG CGCGCGAGCG GGTGCGCGCG CTGTCGGCGC GGGCGCACGG CGAAGCGCGC 
GTCGTGTGGC GGCACCACGG CAACCGCGGC GGGGTGGCGG GCGCGTACAA CGCGGGGCTG 
TCGGCGCTGT TCGCGCAGGG CGTGGAGGCG GTCGCGCTGT TCGACCAGGA CTCGACGGTG 
CCGGCCGCGT ACTTCGCGCG GATGCGCGAC GCGTGCGCGC AACTGGGCAC GCAACCGGGC 
CCGCATGCGG GCGCGCATGC GGGCGCGTTC ATCGCGGGCC CGCGGATCTA CGACGCGAAC 
GAGCAGCGCT TCCTGCCGGA GCTGATGACG AGCGGAGTGG CGGTGCGCCG CGTGCGGGTG 
GAAGGCGAGC GCGCGCCGCA GCGCTGCGCG TTCCTGATCT CGTCGGGCAG CGTGATCTCG 
CGGGGCGCGT ACGCGCGGCT CGGCCGCTTC GACGAGGCGC TGTTCATCGA CCACGTCGAC 
ACCGAGTACT GCCTGCGCGC GCTGGCGCAC AACGTGCCGC TGTACGTGGT GCCGTCGCTG 
GTGCTGACGC ACCGGATCGG CGCGCGGCGC CGGCACAAGG TGGGGCCGTT CGAGCTGACG 
GCGATGCATC ATGGGTGGCT GCGCCGATAC TACGGCGCGC GCAACGCGAT GCAGCTGGGG 
CTGCAGTACG GGTTGCGGTT TCCGGTGGCG CTGGTGCCGA ATCTGCTGAC GATCTGGCAG 
GTGGTCCAGG TGGTGCTGTG CGAGCGGGAG AAGGGCGCGA AGCTGCGCGG GATCGCGCTG 
GGCGTGCTCG ACGGGGTGTT CGGGCGCCTG GGGTCGTTCG AGGCGGCGCG CGCGGGCCAC 
CGCACGGCAC GCGAGGAGGC GATGCGCGAA GCGCGGCGGC AGTCGTGA

Protein sequence

MTTLGALVIL YYPTDEQLSG LEALARDSDA LAVIDNTPHE HAAARERVRA LSARAHGEAR 
VVWRHHGNRG GVAGAYNAGL SALFAQGVEA VALFDQDSTV PAAYFARMRD ACAQLGTQPG 
PHAGAHAGAF IAGPRIYDAN EQRFLPELMT SGVAVRRVRV EGERAPQRCA FLISSGSVIS 
RGAYARLGRF DEALFIDHVD TEYCLRALAH NVPLYVVPSL VLTHRIGARR RHKVGPFELT 
AMHHGWLRRY YGARNAMQLG LQYGLRFPVA LVPNLLTIWQ VVQVVLCERE KGAKLRGIAL 
GVLDGVFGRL GSFEAARAGH RTAREEAMRE ARRQS