Gene BURPS668_A2653 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A2653
Symbol
ID	4888933
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	2548279
End bp	2549355
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	71%
IMG OID	640132589
Product	phosphotransferase enzyme family protein
Protein accession	YP_001063645
Protein GI	126443002
COG category	[R] General function prediction only
COG ID	[COG3173] Predicted aminoglycoside phosphotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.95808
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGTGC GCCTCGACGA TGCGCGCGAC GTGCGCGACG AAGACCGGCT CGACGCGGCG 
AAGCTCGACG CGTACCTGAA GCCGCGCATT GCGGGGTTGA GCGGCGAGCC GCGCATCCGG 
CAGTTTCACG GCGGCGCGTC GAACCTGACC TATCTGATCG GCTATGGCGA TCGCGAGCTG 
GTGCTCAGGC GCCCGCCGGC GGGCGCGAAG GCGGGCGCCG CGCACGACAT GCTGCGCGAA 
GCGGCGGTGA TGGCGGCGCT CGGGCCCGAC TACCGTTACG TGCCGGCGAT CCTCGCGCGC 
TGCGACGATC CCGCGGTGCT CGGCAGCGAG TTCTACGTGA TGGAGCGCAT CGCCGGCGTG 
ATCCTGCGGC GCGAGCTGCC CGCCGAGCTG AAGCTCGATC GCGCGGACGT GCGCAAGCTG 
TGCGAGCGCT TCGTCGACCG GCTGATCGAG CTGCACGCGA TCGACGCGTC GCGCCCGGAG 
ATCGCGGCGC TCGGCAAGGG CGAAGGCTAC GTCGCGCGGC AGTTGAGCGG CTGGATGCAG 
CGCTGGCGCA ACGCGCTCAC CGACGGCACG AACCCGTGCG ACGACGTGCT CGCGTGGCTC 
GAGCGCCATC GCCCGGCGGG CGAGCGGCGC ATCTGCGTGA TCCATAACGA TTTTCGCTTC 
GACAACGTCG TGCTCGATCC GGCCGATCCG CTGTCGATCG TCGGCGTGCT CGACTGGGAG 
ATGGCGACGC TCGGCGATCC GCTGATGGAC CTCGGCGGCT CGCTCGCCTA CTGGGCGCAG 
GCCGACGACG ATCCCGCGTT CGTCGCGATG CGCCGCCAGC CGACGCACGC GGACGGGATG 
ATGACGCGCC GCGAGCTCGT CGAATACTAC GGCGCGCGCA CGGGGCTCGA CGTCGGCGGC 
TTCGTGTTCT ACGAAGTGTT CGGCCTGTTC CGGCTGATGG TGATCGCGCA ACAGATCTAC 
CGGCGCTTCG TGCTCGGCCA CACGACGAAC GAGCAGTTCG CGGGCCTCGG CGCGGTCGTG 
CGCTATCTCG GCGAGCGTTG CCGGCGCGTG ATCGACGCGG CCGGGGGCGC GCGATGA

Protein sequence

MSVRLDDARD VRDEDRLDAA KLDAYLKPRI AGLSGEPRIR QFHGGASNLT YLIGYGDREL 
VLRRPPAGAK AGAAHDMLRE AAVMAALGPD YRYVPAILAR CDDPAVLGSE FYVMERIAGV 
ILRRELPAEL KLDRADVRKL CERFVDRLIE LHAIDASRPE IAALGKGEGY VARQLSGWMQ 
RWRNALTDGT NPCDDVLAWL ERHRPAGERR ICVIHNDFRF DNVVLDPADP LSIVGVLDWE 
MATLGDPLMD LGGSLAYWAQ ADDDPAFVAM RRQPTHADGM MTRRELVEYY GARTGLDVGG 
FVFYEVFGLF RLMVIAQQIY RRFVLGHTTN EQFAGLGAVV RYLGERCRRV IDAAGGAR