Gene Daud_1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_1039
Symbol
ID	6026506
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	+
Start bp	1089611
End bp	1090852
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	61%
IMG OID	641593851
Product	glycosyl transferase, group 1
Protein accession	YP_001717183
Protein GI	169831201
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGATGCTTT CATGGGAGTA CCCTCCAAAG ACGATCGGCG GCCTGGCCCA ACACGTGTAC 
GATCTAAATG CAGCCTTGAG TCGGGAGGGC GTAGAAGTTC ACCTGTTAAC CTGCTCGGCT 
CCGGGGGCGT CCGACTACGA GATGCAGGGA AACATTCATA TCCACCGCGT GCACCCCTTC 
CAGGTTTCGG CGCCGGACTT CGTGACCTGG GTGTTGCAGT TCAACAACGC CATACTGGAA 
CGGGCGATCA GCCTGTTCGA AAGGGTGGGC GCCTTCCGGG TGGTCCACGC CCACGACTGG 
CTGGTGGCCT TTGCGGCCCG GGCAGTCAAG CACGCCAGGC ATCTCCCGCT GGTGGCCACA 
ATTCACGCTA CCGAATTCGG CCGGAACCAG GGACTGCACA ACGCGACCCA AAACTACATC 
AGCAACGTGG AGTGGTGGCT GACGTTTGAA GCGTGGAAGG TGATCGTGTG CAGCAGGTAC 
ATGGAGAATG AACTCAAGTA CATCTTCCAG CTCCCGGCGG ACAAGATCCG GGTGATTCCC 
AACGGGGTGG ATCCGGAGAA CTACAGGCTG CGTTCGGACC GGGTCAAGCG CAGCTTCTAC 
GCGGCGCCGG AGGAAAGAAT CGTGTTCTAC GTCGGCCGCC TGGTCCAGGA AAAGGGGGTG 
CAGGTGCTCT TGGACGCCGT GCCTCAGATT CTTGCGCGGA TGCCCAACAC CAAGTTTGTC 
ATCGGCGGTA AGGGGCCGCA CCTGGAAGAA TTGCGGGCCC AGGTGGACAG AATGGGTATC 
GCGCCGCGCA TCTACTTCAC CGGCTACATC GACGACGAGG TCAGGAACGC GCTTTACCAC 
TGGGCCGACG TGGCGGTGTT CCCGAGCCTA TATGAACCGT TCGGTATCGT GGCCCTGGAG 
GCGATGGCGG CCAAGACGCC GGTGGTGGCC TCCAATACCG GGGGTTTGAG CGAGATCATT 
GAGCACGGCC TGGACGGCTT CAAGGTGCCG CCGGGGGACA GTCGGGCATT GGCCGAGCAC 
ATTCTCCTGG TGCTTCAAAA CCCGGCCCAG GCGAAAATGC TCCATGAACG CGCTTTCCGG 
AAGGTGCGGG AACAGTACGG TTGGAGGAAA GTCGCCCGCG AAACCGCCCG GCTGTACCGG 
GAGGTCTGGA GCGAACGCCA GTCCGCGCCG TGGCCGACCC TTGAAGACCG GCCCGGACGG 
ATCCTCGGCC GGGTGTATCA GCTCTTCGAA CGCTATTCCT AA

Protein sequence

MMLSWEYPPK TIGGLAQHVY DLNAALSREG VEVHLLTCSA PGASDYEMQG NIHIHRVHPF 
QVSAPDFVTW VLQFNNAILE RAISLFERVG AFRVVHAHDW LVAFAARAVK HARHLPLVAT 
IHATEFGRNQ GLHNATQNYI SNVEWWLTFE AWKVIVCSRY MENELKYIFQ LPADKIRVIP 
NGVDPENYRL RSDRVKRSFY AAPEERIVFY VGRLVQEKGV QVLLDAVPQI LARMPNTKFV 
IGGKGPHLEE LRAQVDRMGI APRIYFTGYI DDEVRNALYH WADVAVFPSL YEPFGIVALE 
AMAAKTPVVA SNTGGLSEII EHGLDGFKVP PGDSRALAEH ILLVLQNPAQ AKMLHERAFR 
KVREQYGWRK VARETARLYR EVWSERQSAP WPTLEDRPGR ILGRVYQLFE RYS