Gene Dtox_1091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_1091
Symbol
ID	8428030
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	1116965
End bp	1117960
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	40%
IMG OID	645033426
Product	spore coat protein, CotS family
Protein accession	YP_003190600
Protein GI	258514378
COG category	[R] General function prediction only
COG ID	[COG2334] Putative homoserine kinase type II (protein kinase fold)
TIGRFAM ID	[TIGR02906] spore coat protein, CotS family

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGATG TCAAATCGTT AAGACAAGTG CTGGCCGAGT ACGGTTTGGA TAATGCGAAG 
TGCAGCCTTT TAAGTGATAA AGGTAAGAAA TCAGTCTGGA AGATTGAGAC TAGTAATGGT 
TATGCTGTCT TAAAAAAGAT GCCCGGTTCA CCTTCGAGAA CGTCCTGGTT GGCCCGTGCA 
GTTGATCATT TGGGGCGCTC GGGTGTTAAT CTTGCCCCGT TAATTCCATC CTTGAAGGGC 
AGTCTCTCTG TTACTGCAGA TCAGTCCGGT TTTATTTTAT ACCGCTGGTT GAGCGGCAGG 
CAGCCTGAAT TTAACCGTGA TCTTGATGCT ATACTGGAGT CTATGGCTTG CTTTCACCGG 
GGAGGGAAAG GTTTTCAATT AAGTCCTGAA GAGCATATGC GTTCGCATCT GGGCAAATGG 
CAGGATGACT ACGCAAAGAA GAGGATAATC TTAACACAGA TAAGGGATGA AAAATGCCAT 
ATAATGTTTG ATAAATTTTC CCGACAGGTG TTTAAATACA TTAATCACTT TATTGACAAA 
ATTGTCCGAA TGGAAAAGCA GCTTAAAGCA TCCTGTTACA AGGAATGGGT TAACCGACTG 
GGCGTGAATA CATGTTTCTG CCACCAGGAT TTTTCTCCGA AAAACCTGCG TTGGCATGAG 
GGTAAAGTTT ATATATTCGA TTATGATTCT CTTACTCTGG ATATACCGGC CAGGGATATT 
CGTAAGTTAA TTAATAAGCT GATGAAGAAA AAGTCTCTCG ACAAGATACT GCTTAATAAT 
ATTTACCAAC TCTACAACAA GTATAATCAA ATAACTGAAA GTGAGTGGCG TGTTGTCTTA 
ACTGATTTGC TGTTTCCACA TCTGTTTTAT GGTATTGTTA CCAAGTATTA TTTTAAACGT 
GCACAGGATT GGTCAAAAGA AAAATATATC AAAAAGTTAG AGAGTATGAT CAATGTTGAG 
CTGGAAAAAG ATATTGTTCT GTCCGGCCTA ATTTGA

Protein sequence

MSDVKSLRQV LAEYGLDNAK CSLLSDKGKK SVWKIETSNG YAVLKKMPGS PSRTSWLARA 
VDHLGRSGVN LAPLIPSLKG SLSVTADQSG FILYRWLSGR QPEFNRDLDA ILESMACFHR 
GGKGFQLSPE EHMRSHLGKW QDDYAKKRII LTQIRDEKCH IMFDKFSRQV FKYINHFIDK 
IVRMEKQLKA SCYKEWVNRL GVNTCFCHQD FSPKNLRWHE GKVYIFDYDS LTLDIPARDI 
RKLINKLMKK KSLDKILLNN IYQLYNKYNQ ITESEWRVVL TDLLFPHLFY GIVTKYYFKR 
AQDWSKEKYI KKLESMINVE LEKDIVLSGL I