Gene Dtox_0998 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_0998
Symbol
ID	8427937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	-
Start bp	1020501
End bp	1021571
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	41%
IMG OID	645033334
Product	hypothetical protein
Protein accession	YP_003190508
Protein GI	258514286
COG category	[R] General function prediction only
COG ID	[COG3943] Virulence protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.000000000328283
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGAGTGATA AGAAGAAGAA AAAAAGTGTA CAGCTTCGCA ACAGCACAGC CGAGTTTTTA 
ATATTTTCAT ATCAGGTCGG CGGTGATGGT GTTGAAGTCC GTGTTCAGAA CGGAACAATA 
TGGCTGAGCC AGAAGCAGAT GGGATTGTTA TTTGACACTT CATCTGGTAA CATTGGCCTT 
CATCTAAAAA ATATTTTTAA AGAAGAAGAA TTGAAACAAG ATTCAGTTAC CGAGGAATTC 
TCGGTAACTG CCGAAGACGG CAAAAATTAT CGTGTCAAGC ATTATAACCT TGATGCCATC 
ATTGCTGTAG GTTATCGTGT AAATTCAAAA CGAGCGACAG CCTTTCGACA ATGGGCAACA 
GGAGTTTTGC GTGATTATGC TCTGCATGGC TACTTGCTCG ATAGAAAGCG GATGGAAAAC 
GGCGCTTTTC TTGATGAGGA TTATTTCGAA CGTCTGCTTG AAGAGATTCG GGAAATACGA 
CTCTCAGAAC GACGCTTTTA TCAAAAAATC ACCGACATCT ATTCAACTGC GATGGATTAT 
GATAAAGATT CGCCCATAAC AAAAGAGTTC TTTGCAAAGG TTCAAAATAA AATGCATTTT 
GCCGTTCACG GGAGTACTGC TGCCGAATTG ATTGTTGAAC GTGCCGACGC TAAAAAAGAT 
TATATGGGAT TAACCAGCTG GGCGAATAGT CCTGACGGGA AGATTCTCAA AAGCGATGTT 
ACTATCGCCA AGAATTATCT GACGGCTGAA GAACTTGCTG ATTTAGGCGC TATTGTGAAT 
GCTTACTTGG ACTTGGCTGA AAGGCGCGCC AAACGCAGAA TCCCAATGAC TATGGAAGAC 
TGGGCTAATA GACTCGATAT CTTCCTGCAG GCTGATGACA GGGAGCTTTT AACAAACGCA 
GGAAAAATAT CGGCACAAAT TGCAAAGGAT CATGCAGAAA GCGAATATGA AAAGTATAGA 
GTCATCCAGG ACAAGCTGTT TGAGAACGAT TTTGACAAGC AAATGAAAAT TCTTGAACAG 
GAGATTGCAA AATCAGAAAA AGATAAAGAT TCTAATGGCG ACAAAAACTG A

Protein sequence

MSDKKKKKSV QLRNSTAEFL IFSYQVGGDG VEVRVQNGTI WLSQKQMGLL FDTSSGNIGL 
HLKNIFKEEE LKQDSVTEEF SVTAEDGKNY RVKHYNLDAI IAVGYRVNSK RATAFRQWAT 
GVLRDYALHG YLLDRKRMEN GAFLDEDYFE RLLEEIREIR LSERRFYQKI TDIYSTAMDY 
DKDSPITKEF FAKVQNKMHF AVHGSTAAEL IVERADAKKD YMGLTSWANS PDGKILKSDV 
TIAKNYLTAE ELADLGAIVN AYLDLAERRA KRRIPMTMED WANRLDIFLQ ADDRELLTNA 
GKISAQIAKD HAESEYEKYR VIQDKLFEND FDKQMKILEQ EIAKSEKDKD SNGDKN