Gene Daud_0445 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_0445
Symbol
ID	6026784
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	+
Start bp	483672
End bp	484709
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	65%
IMG OID	641593285
Product	N-acetylglucosamine-1-phosphodiester alpha-N-acetylglucosaminidase-like exopolysaccharide biosynthesis protein
Protein accession	YP_001716623
Protein GI	169830641
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4632] Exopolysaccharide biosynthesis protein related to N-acetylglucosamine-1-phosphodiester alpha-N-acetylglucosaminidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.809516
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCCGCG TTAACCTGTT CTTCTTCTTT CTCGCAGCGC CCCTGATCGG GGTGTTGATT 
GCCGTTTCTT CCTTCAGCCG GGGGGCGCAG GGCCTGGAGC TGCCGGTTGC CGAGCTTCAG 
CCGGCCGTGG GGCTATTGGC GGACGGGGTG TACCAGCTAC GCTACACGGT CGGCTCCGTT 
CACGAATCCC TGGAGGAACA GCAGCAGCGC TACGAGGAGC AGCAGGAACT CCTCAGGACC 
CTGGCCGCCA AAAGCGCCGA GCACAAGCAG CTTTCCGACG ACATCTATGA GCAGCACATC 
CTGGACAAGC TGGGGCCGCC GGTCCGCGTA CACCGTTCGG CGCGGGTGGA GGTCAAGATT 
TTTGAACTAA AGGGGATCGG GTACCGCGGC TACATCGCCA AGGTCAAGCC CTTCGACCCG 
GGTGTGCTCC GGGTGACGTA CCGGGAGGGG CCGGGTGAAA CCACCAGTGA GGCCGTCCGG 
CGCACCGGGG CGGTCTTGGG GGTGAACGGG GGCGGTTTCT ACCGGGCTCC GGTTGACGGG 
CTGATGCACA CCCTGCCCAT TGGGAACACG ATGGTGGACG GAAAACTGGT CGGGGGCTTC 
CAGCCGCCAC GCGAAGACCT GTTTTTCGCT GGCTTTGACG GCCGGGGGCG GCTCGTGGGC 
GGAATCTTCA ACGACCGCAC GGCCTTGCTG GGTACAGGCG CCAGGCAGGG GGTCAGCTTC 
GTGCCGATCC TGATCAAAGA CCGCCAGCCG GTGCCGATCC CGGAGAAGTG GCGGAACCAG 
CGGCAGCCGC GCACTATCCT GGGCGAGTAC GCCAACGGCG ACCTGATCAT GATCGTGGTC 
GACGGGCGGC AGGCCGACTG GAGCAGCGGG GTGACTCTGG AGGACCTGCA GGTGACGCTG 
ATCAAGTTCG GAGTGATCGA CGCCTACAAC CTGGACGGCG GCGGATCGAG CGTGTTCGTG 
TTCGGCAACC AGATCCTGAA CCGCCCCTCG GACGGCCGGG AGCGGGTGGT GGCCACGAAC 
ATTGTGGTTT TGCCGTAG

Protein sequence

MRRVNLFFFF LAAPLIGVLI AVSSFSRGAQ GLELPVAELQ PAVGLLADGV YQLRYTVGSV 
HESLEEQQQR YEEQQELLRT LAAKSAEHKQ LSDDIYEQHI LDKLGPPVRV HRSARVEVKI 
FELKGIGYRG YIAKVKPFDP GVLRVTYREG PGETTSEAVR RTGAVLGVNG GGFYRAPVDG 
LMHTLPIGNT MVDGKLVGGF QPPREDLFFA GFDGRGRLVG GIFNDRTALL GTGARQGVSF 
VPILIKDRQP VPIPEKWRNQ RQPRTILGEY ANGDLIMIVV DGRQADWSSG VTLEDLQVTL 
IKFGVIDAYN LDGGGSSVFV FGNQILNRPS DGRERVVATN IVVLP