Gene BURPS668_A1919 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1919
Symbol
ID	4887452
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	1865631
End bp	1866950
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	75%
IMG OID	640131857
Product	rhamnosyl transferase
Protein accession	YP_001062914
Protein GI	126445416
COG category	[C] Energy production and conversion [G] Carbohydrate transport and metabolism
COG ID	[COG1819] Glycosyl transferases, related to UDP-glucuronosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.000883643
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTAAGG TAATCGTGAC GGCGATCGGG TCGGCGGGGG ACGTGCACCC GCTGCTGGGG 
GTGAGCCGGG CGCTGGCCGC GCGCGGCCAC GACGTGGTGT TCTGCACGCA TGCGCCGTTC 
GAGGCGGCGG TGCGCGCGAG CGGCTTCGCG TTCGTGCCGG TGGGCACGGC CGAGGCGTAT 
GCGCAGGCGA TGGCGGACCC GGCGCTGTGG GATCCGCGCA CGTCGTTCCG GACGCTGTGG 
CGGGTGATCG CGCCGGTGCT GCGGCCGCAC TTCGATACGC TGCGCGCGCT GAGCGACGCG 
GACACGGTGC TGGTGGGCAC GCTGTGGGCG TTCTCGGCGC GGCTGATGCA GGAGCGCTTC 
GGCGCGCGCT ACGTGTCGGT GCAGGTGTCG CCGTCGACGC TGCTGTCGGC GCACGCGCCG 
CCGACGCACA AGCGGCTGAC GATCCCGAAG GGACTGCCGC TGGCGGTGAA GGCGGGGCTG 
ATGACGCTGA TCGAGCGGCA GGTGCTGGAC CGGGTGTGCG GCCCGGAGCT GAACGCGGCG 
CGGCGGGCGC TGGGGCTGGC GCCGGCCCGG CGGATCCTGG GGCGGTGGCT GCATTCGACG 
GACGGGGTGC TGTGCCTGTT TCCGTCGTGG TTCGCGCCGG CGCAGCCGGA CTGGCCGGCG 
AATCACCTGC AAAGCGGGTT TGCGCTGTTC AACGACGTGG GGCCGGTGCC GGCGGATGCG 
GAGCTGGACG CGTTCGTCGC GTCGGGCGAG GCGCCGGTGG TGTTCACGGC GGGCTCGACG 
CTGGTGGACG GGCACGCGTA CGAGCGGGCG GTGACGCAGG TGCTGCGGGC GACGGGCGTG 
CGGGGGATCC TGCTCGCGCC GGACGCGCCG GCGGCATCGG ATGGGACGAT GGGGCCAATG 
GAGAGGACGG CGGAGAGGAC GGCGCGGGCG AATGGCGTGG CGCTGCTCAA GCGCCGCTAC 
GTGCCGCTCG CGGCGCTGCT GCCGCGGTGC CGGGCGCTGG TGCATCACGG CGGGATCGGC 
ACGGCGTCGC TGGCGTACGC GGCGGGCGTG CCGCAGGTGG TGACGCCGTT CGCGCACGAT 
CAGTTCGACA ACGCGCAGCG GGTGGCGGCG AGCGGCTGCG GGGTGCGGCT GGACGCGCCG 
GTGCGCGGCG AGCCGCTGGC ACGGGCATTG GCGCGGGTGC TGGGCGACGC GGCGATGGCC 
GCGCGCTGCG CCGAGGTGCG CGCGCGCATG GCGGCGCAGC CCGACGGCTG CGACGAGGCG 
GCGCGCTTCA TCGAGCGCTT CGCGCCGGGC GTCGCGGCGC GGCAGGCGCA GCCGGCATGA

Protein sequence

MAKVIVTAIG SAGDVHPLLG VSRALAARGH DVVFCTHAPF EAAVRASGFA FVPVGTAEAY 
AQAMADPALW DPRTSFRTLW RVIAPVLRPH FDTLRALSDA DTVLVGTLWA FSARLMQERF 
GARYVSVQVS PSTLLSAHAP PTHKRLTIPK GLPLAVKAGL MTLIERQVLD RVCGPELNAA 
RRALGLAPAR RILGRWLHST DGVLCLFPSW FAPAQPDWPA NHLQSGFALF NDVGPVPADA 
ELDAFVASGE APVVFTAGST LVDGHAYERA VTQVLRATGV RGILLAPDAP AASDGTMGPM 
ERTAERTARA NGVALLKRRY VPLAALLPRC RALVHHGGIG TASLAYAAGV PQVVTPFAHD 
QFDNAQRVAA SGCGVRLDAP VRGEPLARAL ARVLGDAAMA ARCAEVRARM AAQPDGCDEA 
ARFIERFAPG VAARQAQPA