Gene BURPS668_2879 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_2879
Symbol
ID	4882624
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	2837453
End bp	2838622
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	66%
IMG OID	640128807
Product	tetratricopeptide repeat protein
Protein accession	YP_001059898
Protein GI	126439175
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2956] Predicted N-acetylglucosaminyl transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.223768
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCTCG ATTTCTGGTG GCTGCTCGCC ATTCCCGTCG CGTTCGCGCT CGGCTGGATG 
GCGTCGCGCT ACGACCTCAA CAAGCTGCTG TCCGAGAGCG CGAACCTGCC GCGCTCGTAT 
TTTCGCGGCC TGAATTTCCT GCTGAACGAA CAGCCGGACA AAGCGATCGA TGCGTTCATC 
GAAGTCGCGA AGCTCGATCC CGAAACGGTC GAGCTGCACT TCGCGCTCGG CAACCTGTTT 
CGCCGCCGCG GCGAGACGGA CCGGGCGATC CGCGTCCATC AGAATCTGCT GAGCCGCAAC 
GATCTGCCCG TGAGCGAGCG CGACCACGCG CTCTTCGAGC TCGGCCAGGA CTTCCTGAAG 
GCGGGCCTGC TCGATCGCGC GGAGGAGACG TTCCACATGC TGGCCGAGGG GGACTACGCG 
CTCGACGCGC AGCGCGCACT CCTCACGATC TACGAGATCG AGAAGGACTG GACCAAGTCG 
ATCGACACCG CGGCGAGGAT CGAAGCGATG GGCGCGCCGC GTCTCACGAC GGAGATCTCG 
CAATTCCATT GCGAGCTTGC TCAGGACGCG CTGCAGCGCA AGAGCGCCGA GCTCGCGGCC 
GAGCATCTGC ATGACGCGCT CGCGGTGAAT CCGCAGAACG CGCGCGCGGC GATCCTGTCG 
GGCGATACGG CCGCCGCGGC CGGCGACCAT CGCGCGGCGA TCGAGCACTG GCGCCGGATC 
GAGACGCAGA ATCCCGCTTA TCTGCCGCTC GTCGCCGACA AGCTGATGAA ATCGTACGCG 
GCGCTCGATC GGGCGGCCGA GGGCGCCGAG CTGCTGACGG GCTATGCGCA GCGCTATCCG 
TCGAACGATC TGCTCGATGT CGTCTATCAG TATGTCGCGC AACTGCGCGG CAACGACGTC 
GCGCATGCGC TCGCGCGCTC GCAGATGGAA AAGGCGCCGA ACCTCTCCGG CATGCTGCAC 
CTGCTCGACG CGCAGATCGC CGCGGCCGAC GAATCGCGGC GATCCGAGCT CGAGATGATG 
CGCGCGCTCG TCAAGCAGCG CACCAAGAAT TTGCCGCGAT ATACATGCCA GAATTGCGGT 
TTCCGGGCGC GCCTGTTCTA TTGGCAGTGC CCCGGATGCA GCGGATGGGA AACCTATGCG 
CCGCGGCGCG TCGAGCCCGC CGTTGCGTAA

Protein sequence

MDLDFWWLLA IPVAFALGWM ASRYDLNKLL SESANLPRSY FRGLNFLLNE QPDKAIDAFI 
EVAKLDPETV ELHFALGNLF RRRGETDRAI RVHQNLLSRN DLPVSERDHA LFELGQDFLK 
AGLLDRAEET FHMLAEGDYA LDAQRALLTI YEIEKDWTKS IDTAARIEAM GAPRLTTEIS 
QFHCELAQDA LQRKSAELAA EHLHDALAVN PQNARAAILS GDTAAAAGDH RAAIEHWRRI 
ETQNPAYLPL VADKLMKSYA ALDRAAEGAE LLTGYAQRYP SNDLLDVVYQ YVAQLRGNDV 
AHALARSQME KAPNLSGMLH LLDAQIAAAD ESRRSELEMM RALVKQRTKN LPRYTCQNCG 
FRARLFYWQC PGCSGWETYA PRRVEPAVA