Gene Daud_1778 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_1778
Symbol
ID	6027234
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	-
Start bp	1869148
End bp	1870200
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	53%
IMG OID	641594595
Product	polysaccharide biosynthesis protein CapD
Protein accession	YP_001717906
Protein GI	169831924
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1086] Predicted nucleoside-diphosphate sugar epimerases
TIGRFAM ID	[TIGR03589] UDP-N-acetylglucosamine 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCACTTA AGAATACGCA ACCAGGCTCA TTATCTCAAG ATGTGAAGGT CGGAGGCGGG 
GCAGGCGTGC TAAACGGCGG ATCTGTTCTG GTCACGGGGG GTACGGGCTC GTTCGGGCAG 
AAATTTGTGG AGACGGTGCT CCAACGGTAC AAACCGCGCC GGCTGATTAT CTTAAGCCGG 
GATGAACTGA AACAATACGA AATGCAGCAG GTTTTCGATC CAGCCAAATA CGATTGCCTA 
CGTTACTTCC TTGGCGATGT GCGCGACAAG AACCGGTTGT ACCGGGCGTT CTACGGCGTT 
GATGTTGTGG TGCACGCGGC GGCGCTCAAA CAGGTGCCGG CGGCCGAGTA TAACCCCTTT 
GAAGTAGTCC AGACCAACAT AATCGGCACA CAGAATGTTA TTGACGCCGC CATCGACAAC 
GGGGTCCAAA AGGTCATCGC CCTGAGCACT GATAAGGCGG TGAACCCGGT AAACCTTTAT 
GGGGCGACCA AGTTGTGCTT GGAGAAACTG GTCGTGGCGG CCAATTCTTA CGCCGGTGGC 
CGCACCAGAT TCAGCGTGGT CCGCTACGGC AACGTGGTCG GCAGCCGGGG CAGCGTGGTG 
CCCGTGTTCC TCAAGCAGAA AAAGACGGGG ACTTTGACCG TCACTGACGA GCGGATGAGC 
CGTTTTTGGA TCACCCTGGA ACAGGGGGTT TCTTTTGTTC TCAATTGCAT TGAGAACATG 
CAGGGCGGCG AGGTTTTTGT ACCAAAGATT CCTAGTATGC GGATTATGGA TCTTGCCCAA 
ACTGTTTGTC CCCACTGCGA GATTCGGTTT ATCGGCGTCC GCCCGGGAGA GAAGCTGCAC 
GAATTGCTCA TCTCTAAGGA TGAGGCACGT AACGTTGTGG ATTGTGGAGA TTTTTTCGTT 
GTAAAACCGT CTTTTCCGTT TTGGATGTCC AAGATTGAAC AGCAAGGGCA ACCGGTTCCG 
GAGGAATGGG AATATGCAAG CAATACTAAC GAACAATGGC TTGAAAAAGG TCAGCTGCAG 
AAGCTGATCA ATCAGTTCTC CCAGCATTCT TAA

Protein sequence

MSLKNTQPGS LSQDVKVGGG AGVLNGGSVL VTGGTGSFGQ KFVETVLQRY KPRRLIILSR 
DELKQYEMQQ VFDPAKYDCL RYFLGDVRDK NRLYRAFYGV DVVVHAAALK QVPAAEYNPF 
EVVQTNIIGT QNVIDAAIDN GVQKVIALST DKAVNPVNLY GATKLCLEKL VVAANSYAGG 
RTRFSVVRYG NVVGSRGSVV PVFLKQKKTG TLTVTDERMS RFWITLEQGV SFVLNCIENM 
QGGEVFVPKI PSMRIMDLAQ TVCPHCEIRF IGVRPGEKLH ELLISKDEAR NVVDCGDFFV 
VKPSFPFWMS KIEQQGQPVP EEWEYASNTN EQWLEKGQLQ KLINQFSQHS