Gene Dole_2024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2024
Symbol
ID	5694864
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	2452252
End bp	2453580
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	62%
IMG OID	641264622
Product	phosphoglucosamine mutase
Protein accession	YP_001529905
Protein GI	158522035
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1109] Phosphomannomutase
TIGRFAM ID	[TIGR01455] phosphoglucosamine mutase

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00000439649
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACGGCGC GGCTTTTTGG CACCGACGGC ATTCGAGGCG CTGCCAACTC CTGGCCCATG 
ACACCGGAAA CAGCCATGGC CGTGGGCAGG GCCGTGGCCC GGTTCATGAC GGCAGACGGT 
CAATCCCCCC CCCGGATTCT GGTGGGTAAA GACACCCGGC TTTCCGGCGA CATGCTGGAA 
AGCGCCCTGT GCGCTGGTAT CTGCGCTTCA GGCGTGGACG CAATCCGCGT GGATGTGCTT 
CCCACCCCGG CGGTGGCCTA CCTTACCGCC ATGCTGAAAG CCGGCGCCGG CATCATGGTG 
TCGGCCTCTC ACAACCCCTG GACCGACAAC GGCATCAAGA TTTTTTCCCA CAAAGGGCAT 
AAGCTTTCCC CGGTTCAGGA GGCCGAGCTG GAGGCGTTGA TTCTCTCCCC GGAGCCGATG 
GCGGCCGCCA ATCCACCGGT GCCCGGCCGG GTCTTTCATC TCATGGATGC CGAAGAACCT 
TATGTCGAAT GCCTGAGCAA CATCACCGCG GTCGGCTCCC TCTCCCTGGT ATTAGACTGC 
GCCAATGGCG CCGCTGCTCG TGTGGCCCCC CGTCTTTTTC CCGATGCCCG CCTGTTGTCT 
GCTGATCCCG ACGGGCGGAA CATTAACGAA AACTGCGGTT CCGAGCACAC AGAAGCGCTT 
CGGGCCGAGG TGGTGAAATA CCGTGCCGAT GCCGGATTTG CCTTTGACGG TGACGCCGAC 
CGGCTGATCG CCGTGGATGA AACCGGGGCG CCGGTCACCG GGGACCGGAT TATCGCCATC 
TGCGCCGGTT TCATGAAATC CGAGAACCTG CTGAAAAACA ATACCGTGGT CAGCACCGTC 
ATGAGCAACA TCGGCCTGAA CCGCGCGCTT CGGGATATGG GGATTTATCA CGTGGTCACC 
GATGTGGGGG ACCGCCATGT GACGGCGGCC ATGCTGGAAA AGGGCGCCTC CCTGGGTGGC 
GAGGACTCGG GCCACATCGT TTTTTCTGAT TACCAGACAA CAGGTGACGG CCTGCTCACG 
GCCCTGATGC TCTGCCGGAT CATGAACCAT ACCGGCAAGC CCCTGTCGGA GCTGGCCGCG 
TGCATGGATG TTTTTCCCCA GGTGCTGATC AACGTGAAAG TGGCCCGTAA ACCGGACCTC 
GCCTCGGTGC CTGAGGTATG GCAGGTCGTC AGGGATGTTG AGGCCCGTCT TGGCCGGGAG 
GGGCGGGTAC TGGTCCGTTA TTCCGGCACC CAGCCCATGT GCCGGGTCAT GGTGGAAGGC 
CCTTCGGAAG ACGAAACCCG GCAATGCGCC GGGCAGATTG CCAAAGCAGT TGTGCAGGCC 
CTGGGATAA

Protein sequence

MTARLFGTDG IRGAANSWPM TPETAMAVGR AVARFMTADG QSPPRILVGK DTRLSGDMLE 
SALCAGICAS GVDAIRVDVL PTPAVAYLTA MLKAGAGIMV SASHNPWTDN GIKIFSHKGH 
KLSPVQEAEL EALILSPEPM AAANPPVPGR VFHLMDAEEP YVECLSNITA VGSLSLVLDC 
ANGAAARVAP RLFPDARLLS ADPDGRNINE NCGSEHTEAL RAEVVKYRAD AGFAFDGDAD 
RLIAVDETGA PVTGDRIIAI CAGFMKSENL LKNNTVVSTV MSNIGLNRAL RDMGIYHVVT 
DVGDRHVTAA MLEKGASLGG EDSGHIVFSD YQTTGDGLLT ALMLCRIMNH TGKPLSELAA 
CMDVFPQVLI NVKVARKPDL ASVPEVWQVV RDVEARLGRE GRVLVRYSGT QPMCRVMVEG 
PSEDETRQCA GQIAKAVVQA LG