Gene BURPS668_2737 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_2737
Symbol
ID	4883535
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	2705275
End bp	2706720
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	62%
IMG OID	640128665
Product	radical SAM domain-containing protein
Protein accession	YP_001059761
Protein GI	126441620
COG category	[C] Energy production and conversion
COG ID	[COG1032] Fe-S oxidoreductase
TIGRFAM ID	[TIGR03471] hopanoid biosynthesis associated radical SAM protein HpnJ

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCAGG CTACCGGAGC ATTCATGAAA ACGCTGTTCT TGCAGGCACC GTCGTACGAC 
GGCTTCGACG GCGGCGCGGG CTCCCGCTAC CAGGCGAAGC GCGAGATCCG ATCCTTCTGG 
TATCCGACCT GGCTCGCGCA GCCGGCCGCG CTCGTGCCGG GCAGCCGCGT CGTCGACGCG 
CCCGCGGACG GCCTGTCGGT CGAGGACACG CTCAAGATCG CGAAGGACTA CGATCTCGTG 
ATCATCCACA CGAGCACGCC GTCGTTCCCG ACCGATGCGA TGTTCGCGGA AGACCTGAAG 
AAGATGAAGC CGTCGATGCT CGTCGGCATG GTCGGCGCGA AGGTCGCGGT CGATCCGCAC 
AACTCGCTCA CCGCGACGCA AGCGATCGAT TTCGTCTGCC GCGAGGAATT CGACTACACG 
TGCAAGGACA TCGCCGAGGG CAAGCCGTTC GCCGAGATCC TCGGGATGAG CTACCGCGCG 
AAGGACGGCT CGATCGAGCA TAACGGCCCG CGTCCGATGA TCGAGAACAT GGACGAGCTG 
CCGTTCGTCG CGCCCGTCTA CAAGCGCGAC CTGAAGATCG ACAACTACTT CATCGGCTAT 
CTGAACTACC CGTACGTGTC GATCTACACG GGCCGCGGCT GCCGCTCGAA GTGCACGTTC 
TGCCTGTGGC CGCAGACGGT CGGCGGCCAT CGCTACCGCG TGCGCTCGGT CGAGAGCGTG 
CTCGCGGAAG TGAAGTGGAT CCGCGACAAC ATGCCGGAAG TGAAGGAGAT CATGTTCGAC 
GACGACACCT TCACCGATTT CAAGCCGCGC GTCGAGGAAA TCGCGCGCGG GCTCGGCAAG 
CTCGGCGTCA CGTGGTCGTG CAACGCGAAG GCGAACGTGC CGTATTCGAC GCTGAAGATC 
ATGAAGGAGA ACGGCCTGCG GCTGCTGCTC GTCGGCTACG AGTCGGGCGA CGACCAGATC 
CTGCTGAACA TCAAGAAGGG CTTGCGCACG GACATCGCGC GCCGCTTCAA CGAGGATTGC 
AAGAAGCTCG GCATCAAGAT CCACGGCACC TTCATCCTCG GCCTGCCGGG CGAGACGAAG 
GAAACGATCA AGAAGACGAT CGAGTACGCG AAGGAAATCA ATCCGCACAC GATCCAGGTG 
TCGCTCGCCG CGCCGTATCC GGGCACGCGC CTGTACAACC AGGCGATCGA GAACGGCTGG 
ATGGAAGAGA ACAAGACGAT CAATCTCGTC AGCAAGGAGG GGGTGCAGCT CGCCGCGATC 
GGCTATCCGC ACCTGCCGAA GGAGGAGATC TATCATCAGC TCGAGCATTT CTATCGCGAG 
TTCTATTTCC GCCCGTCGAA GATCTGGGAA ATCCTGCGCG AGATGCTGAC GAGCTGGGAC 
ATGATGAAGC GCCGCCTGCG CGAGGGCGTC GAGTTCTTCC GCTTCCTGCG CGCGCACGAG 
GCGTGA

Protein sequence

MQQATGAFMK TLFLQAPSYD GFDGGAGSRY QAKREIRSFW YPTWLAQPAA LVPGSRVVDA 
PADGLSVEDT LKIAKDYDLV IIHTSTPSFP TDAMFAEDLK KMKPSMLVGM VGAKVAVDPH 
NSLTATQAID FVCREEFDYT CKDIAEGKPF AEILGMSYRA KDGSIEHNGP RPMIENMDEL 
PFVAPVYKRD LKIDNYFIGY LNYPYVSIYT GRGCRSKCTF CLWPQTVGGH RYRVRSVESV 
LAEVKWIRDN MPEVKEIMFD DDTFTDFKPR VEEIARGLGK LGVTWSCNAK ANVPYSTLKI 
MKENGLRLLL VGYESGDDQI LLNIKKGLRT DIARRFNEDC KKLGIKIHGT FILGLPGETK 
ETIKKTIEYA KEINPHTIQV SLAAPYPGTR LYNQAIENGW MEENKTINLV SKEGVQLAAI 
GYPHLPKEEI YHQLEHFYRE FYFRPSKIWE ILREMLTSWD MMKRRLREGV EFFRFLRAHE 
A