Gene Daud_1687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_1687
Symbol
ID	6026805
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	-
Start bp	1780357
End bp	1781427
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	67%
IMG OID	641594508
Product	glucose-1-phosphate thymidyltransferase
Protein accession	YP_001717819
Protein GI	169831837
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1209] dTDP-glucose pyrophosphorylase
TIGRFAM ID	[TIGR01208] glucose-1-phosphate thymidylylransferase, long form

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAGGCTC TGGTTTTATC CGGCGGGAAG GGGACGCGGC TGCGGCCCCT GACCTATACC 
ACGGCGAAGC AGCTTATCCC GGTGGCGAAT AAGCCCATCC TGCACTTCGT CCTGGAGCAG 
ATCGCTACTG CGGGGATCGA GGACGTGGGG GTGATCATTT CGCCCGAGAC CGGCGGCATG 
GTGCAGGATG CGCTCGGCGG CGGGGCGGGG TTCGGCCTGC GGCTGACCTT TATTGTGCAG 
GACGAGCCCC TGGGCCTGGC GCACGCGGTC AAGACGGCCC GCGCTTTCCT CGGCGATTCG 
CCGTTCCTGA TGTTCCTGGG GGACAACCTG GTGCAGGGCG GGGTGGCCCC GCTGGCGGCC 
GATTTCCGGC GGGACACTTC CACGTCGATT ATTCAGTTGA AGAAGGTTCC CGACCCCCGG 
GCCTTCGGGG TGGCGGTGCT GGACGGCGGC GGCAGGGTGG CGCGGCTGGT GGAGAAGCCG 
AAGGAGTTCA TTTCCGACCT GGCGCTGGTG GGCATTTACG CCTTTTCTCC CGCCGTCCAC 
GCGGCCATCG AACGGATTAA GCCGTCCTGG CGGGGAGAGC TGGAGATCAC CGACGCCATT 
CAGGAGCTGA TTAACATGGG CCACGCGGTG GCGCCGCGCC TGCTGGAAGG CTGGTGGCTG 
GACACCGGGA AGAAGGACGA CATCCTGGAG GCCAACCGGG TGGTGCTCGA CGAGTTCACC 
CGCCGCCGGG TCGAGGGCAC GGTGGACGAG GCCTCGCAGG TCGTGGGCCG GGTGGAGATC 
GAGGCCGGCG CCGTGGTGGA GAGGAGCGTC ATCCGGGGGC CGGCGGTGGT GGGGGCCGGG 
GCGAAGATCG TAGACAGCTT CATCGGTCCC TACACGGCCA TCGGCCGGGG AACCGCCGTG 
GAGGATTGCA GCGTGGAACA TTCCGTGATC CTGGATAACT GCCGGCTGCG GGCGGTGCAC 
CACATCGAGG ACAGCCTCAT CGGCTCCGGT GCGCGCCTGA CGCGGGACGA TAGCCGCCGC 
CGGGTTCTAC GCTTTTTTAT TGGCGACGAG TGCCAGATTA CCCTTAGTTA G

Protein sequence

MKALVLSGGK GTRLRPLTYT TAKQLIPVAN KPILHFVLEQ IATAGIEDVG VIISPETGGM 
VQDALGGGAG FGLRLTFIVQ DEPLGLAHAV KTARAFLGDS PFLMFLGDNL VQGGVAPLAA 
DFRRDTSTSI IQLKKVPDPR AFGVAVLDGG GRVARLVEKP KEFISDLALV GIYAFSPAVH 
AAIERIKPSW RGELEITDAI QELINMGHAV APRLLEGWWL DTGKKDDILE ANRVVLDEFT 
RRRVEGTVDE ASQVVGRVEI EAGAVVERSV IRGPAVVGAG AKIVDSFIGP YTAIGRGTAV 
EDCSVEHSVI LDNCRLRAVH HIEDSLIGSG ARLTRDDSRR RVLRFFIGDE CQITLS