Gene Daud_0471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_0471
Symbol
ID	6025788
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	+
Start bp	507570
End bp	509168
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	70%
IMG OID	641593311
Product	carbohydrate kinase, YjeF related protein
Protein accession	YP_001716649
Protein GI	169830667
COG category	[G] Carbohydrate transport and metabolism [S] Function unknown
COG ID	[COG0062] Uncharacterized conserved protein [COG0063] Predicted sugar kinase
TIGRFAM ID	[TIGR00196] yjeF C-terminal region, hydroxyethylthiazole kinase-related [TIGR00197] yjeF N-terminal region

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGGTGG TCACCGCGGC CGAAATGCGG GAGATAGACC GGCGGGCCAC CGAGGAGTAC 
GGCGTCTTGG GACTCGTCCT TATGGAGAAC GCGGGCCTTA AGGTGTTTGA GTGTGTGCGC 
CGGGTCCTGG GCGGGGTGGA CGGGAAACAG GTGATAGTCC TGGCCGGAAA AGGGAACAAC 
GGCGGAGACG GGTTGGTGGC CGCCCGCCAC CTGCTGCAGC ACGGGGCCCG GGTGAAAGTA 
ATGCTTAGCG GCGAACCCGC GGATGTGACG GGCGATGCGG GCATTAACCT GGAGATCTGG 
AAGCGGTTGG GGCAGCGGCT GTACCTGATG CAGGACCGTA ACGCCATTCA GCTGCTGCAA 
CTTGCCCTGA TGCAGACGGA CCTGGTGGTG GACGCGCTCT TCGGCACGGG TTTCCGTGGC 
GAGATCAGGG ACCGGGCCCG CAAAGTTATC GAGGCCGTCA ACGAGTCGGG CAAACCGGTG 
GTGGCCGTGG ACATCCCGTC CGGGGTGGAG GCCGACACCG GCGCGGTGCG CGGGCCGGCC 
ATCCAGGCGA CCCACACGGT CACGTTCGGT CTGCCCAAGC TCGGGCTGGT CCTGGAACCG 
GGGGCGGGGA GGACCGGCGA GCTGCACGTG GCGGACATCT CCCTGCCGCG GCCGCTGGTG 
GAGGCGGAGG GTGGCCGTTA CCTGCTCACT CCGGCGCTCG TTCGGGACTG GCTGCCCCGA 
CGCGAGGCGG AGGCGCACAA GGGACGATTC GGTCACGTTC TGTTGGTGGC GGGGTCGAGG 
GGGATGGTCG GCGCGGCCGT TCTGGCCGCC CGCGCGGCGG CTCTGACGGG TGCCGGGTTG 
GTTACCCTGG CGGTGCCCCG CAGCATCCAG AACGTGGCCG CCGGTTTCCA GCCGGAGATT 
ATGACCCTGG GATTGCCCGA GACCGGCGCG GGAACCCTGA GCCGGGCAGC CCGGGAGCAG 
ATCGAGGAGT TCCTGCCGCG TGCCTCCGTG CTCGCCCTGG GTCCGGGACT CACCACCCAC 
CCGGAGACGG CGGAACTGGT CCGGGAGCTT TTGCCCGGGG TGCGGGTGCC GTGCGTCCTG 
GACGCCGACG GCCTGAACGC CTTCGGGGGT GGGGAACGGG AGACCGACCG GAATTCGGCC 
GGGACGCCCG TCGGAGAGAG CCTCCCGCCC GGCGGCTTCC GGGAGAAACC CGACCTGGTG 
CTCACGCCGC ACCCGGGGGA AATGGCGCGG CTTCTGGGTT TGAAGAGCGC GGCCGAAGTG 
CAGGCCGACC GGCTCGGTGT CGCCGAGCGC ACGGCCGCCG CCTGGCGGTG CACGGTGGTG 
CTGAAAGGGG CCCGCACGCT GGTGGCCGAA CCGGGCAAGA CTTACATCAA CCCGACGGGG 
AACCCCGGGA TGGCCACGGG CGGAACCGGA GACGTTCTGA CCGGGGTGAT TGCCGGGCTT 
CTGGCGCAGG GTCTGGAACC CGGTCCAGCG GCGGCCGCCG CCGCCTTCCT GCACGGGCGG 
GCCGGCGACC TGGCGGCCGC CGAACGTGGG CAGGCGTCCC TACTGGCCGG AAACCTGCTG 
GAGTATCTGC CCGCAGCTTT CCACGAACTC GGCGCCTGA

Protein sequence

MRVVTAAEMR EIDRRATEEY GVLGLVLMEN AGLKVFECVR RVLGGVDGKQ VIVLAGKGNN 
GGDGLVAARH LLQHGARVKV MLSGEPADVT GDAGINLEIW KRLGQRLYLM QDRNAIQLLQ 
LALMQTDLVV DALFGTGFRG EIRDRARKVI EAVNESGKPV VAVDIPSGVE ADTGAVRGPA 
IQATHTVTFG LPKLGLVLEP GAGRTGELHV ADISLPRPLV EAEGGRYLLT PALVRDWLPR 
REAEAHKGRF GHVLLVAGSR GMVGAAVLAA RAAALTGAGL VTLAVPRSIQ NVAAGFQPEI 
MTLGLPETGA GTLSRAAREQ IEEFLPRASV LALGPGLTTH PETAELVREL LPGVRVPCVL 
DADGLNAFGG GERETDRNSA GTPVGESLPP GGFREKPDLV LTPHPGEMAR LLGLKSAAEV 
QADRLGVAER TAAAWRCTVV LKGARTLVAE PGKTYINPTG NPGMATGGTG DVLTGVIAGL 
LAQGLEPGPA AAAAAFLHGR AGDLAAAERG QASLLAGNLL EYLPAAFHEL GA