Gene BURPS668_A3055 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A3055
Symbol
ID	4886239
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	2901425
End bp	2902585
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	63%
IMG OID	640132991
Product	radical SAM domain-containing protein
Protein accession	YP_001064046
Protein GI	126442706
COG category	[R] General function prediction only
COG ID	[COG0535] Predicted Fe-S oxidoreductases
TIGRFAM ID	[TIGR03470] hopanoid biosynthesis associated radical SAM protein HpnH

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.615551
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTCTATTC CGCTGCTCCA GCAAGTCCGC GTTGGCGCAT ACATCATGCG CCAGCACCTG 
TCCGGCAACA AACGCTATCC GCTCGCGCTG ATGCTCGAGC CCCTCTTCCG CTGCAACCTC 
GCGTGCAACG GCTGCGGCAA GATCGACTAT CCGGATCCGA TCCTGAACCA GCGCCTGTCC 
GTCGAGGAAT GCCTGCAGGC CGTCGACGAG TGCGGCGCGC CCGTGGTGTC GATCGCGGGC 
GGCGAGCCGC TGCTGCACAA GGAAATGCCG GAAATCGTCA AGGGCATCAT GAAGCGCAAG 
AAGTTCGTCT ACCTGTGCAC GAACGCGCTG CTGATGGAAA AGAAGATGGA CGATTACGCG 
CCGAGCCCGT ACTTCGTCTG GTCGGTCCAT CTCGACGGCG ACCGGGAGAT GCACGATCAC 
TCGGTGTCGC AGGAAGGCGT GTACGACAAG GCCGTCGCGG CGATCCGCGA AGCGAAGCGC 
CGCGGCTTCC GCGTGAACAT CAACTGCACG CTGTTCAACG ATGCGCTCCC CGAACGCGTC 
GCGAAGTTCT TCGATACGCT GGGGCCGATC GGCGTCGACG GCATCACCGT GTCGCCGGGC 
TACGCGTACG AGCGCGCGCC GGATCAGCAG CACTTCCTGA ACCGCGACAA GACGAAGAAC 
CTGTTCCGCG AAGTCTTCAA GCGCGGCGAA GGCGGCAAGC GCTGGTCGTT CAGCCAGTCG 
TCGCTGTTCC TCGATTTCCT CGCCGGCAAC CAGACGTACA AGTGCACGCC GTGGGGCAAC 
CCGGCGCGCA CGGTGTTCGG CTGGCAGAAG CCGTGCTACC TGGTCGGCGA AGGCTACGTG 
AAGACCTTCA AGGAGCTGAT GGAATCGACC GACTGGGACA ACTACGGCGT CGGCAACTAC 
GAAAAGTGTG CGGACTGCAT GGTCCACTGC GGCTTCGAGG CCACCGCCGT GATGGATACG 
ATCGCGCATC CGCTGAAGGC GCTGAAGGTG TCGATGAGCG GCATCCGGAC CGAAGGCGCG 
TTCGCGCCGG ATATTCCGAT CGACAACCAG CGTCCGGCCG AGTATGTGTT CTCGCGCCAC 
GTGGAAATCA AGCTCGAGGA GATCCAGCGC GCGGGCAAGG GCAAGCTGCA GAAGGCGCCG 
AAGCCCGCCG CGACGGCCTG A

Protein sequence

MSIPLLQQVR VGAYIMRQHL SGNKRYPLAL MLEPLFRCNL ACNGCGKIDY PDPILNQRLS 
VEECLQAVDE CGAPVVSIAG GEPLLHKEMP EIVKGIMKRK KFVYLCTNAL LMEKKMDDYA 
PSPYFVWSVH LDGDREMHDH SVSQEGVYDK AVAAIREAKR RGFRVNINCT LFNDALPERV 
AKFFDTLGPI GVDGITVSPG YAYERAPDQQ HFLNRDKTKN LFREVFKRGE GGKRWSFSQS 
SLFLDFLAGN QTYKCTPWGN PARTVFGWQK PCYLVGEGYV KTFKELMEST DWDNYGVGNY 
EKCADCMVHC GFEATAVMDT IAHPLKALKV SMSGIRTEGA FAPDIPIDNQ RPAEYVFSRH 
VEIKLEEIQR AGKGKLQKAP KPAATA