Gene Dtox_0249 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_0249
Symbol
ID	8427173
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	267210
End bp	268322
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	43%
IMG OID	645032636
Product	Shikimate/quinate 5-dehydrogenase
Protein accession	YP_003189825
Protein GI	258513603
COG category	[R] General function prediction only
COG ID	[COG5322] Predicted dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00032725
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.391108
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGAAAT TTGCATTTGT AATACACCCT TTAGATATTA GAGACATTTA TAGAAAATAC 
CCTTTTGCCA GGTACCTGCC TGATAAGTTG GTGGAGAAAG CAGTTACCTG TCTACCGGCT 
ATGAAGGTAT CGCACATCAC CGGTGTAGCT TCCTCATATA ATAAAGCTGA AGGTTGGTTT 
GTTACTTGTC CGCTCACAGC TAAGCAAATG GTTGAACTGC CGGAGGGGTA TGTCATTAAT 
AGAATAATCG GTGCTGCCCG TGTGGCAGAA AAGCTGGGTG CCAAAATACT TGGTTTAGGC 
GCGTTCACAT CAGTAGTTGG AGATGCGGGG ATTACAATAG CCCAAAACTC AAACATTGCG 
GTGACTACCG GCAATAGTTA TACAGTAGCA TCAGCCATTC AAGGAGTTAA AAAAGCTGCT 
GCTCTGATGG GTTATGATAT TTGTCAGGCT GATATTGTGA TTATCGGAGC AACCGGTTCA 
ATCGGCAAGG TATGTGCCAG GTATTTGGCC AGAGAAGTAA AAAATTTGAC CCTGGTAGCT 
CGTGACACAT CAAAATTAGA GGAAATTGCT GCTAAAATAT TGTTTGATTA TGGACTGGCG 
GTAAAAGTAA CACCATATAG TCGCAGTGCT TTGCGGAAAG CAGATGTGAT TATAACTGTA 
ACTAGTGCTG TAGATACTAT TATCGGCCCC GGCGACTTGA AGCCCGGTGC AGTTGTTTGC 
GATGTTTCCC GCCCGCGAAA TGTCTCGAAA AAAGTAGCGG AAGAAAGAGA TGACGTACTG 
GTCATAGAAG GTGGTATAGT GGAAGTCCCC CATGGGGTTA ATTTTAATTT TAATTTTGGC 
TTTCCCGAAG GCACAGCGTA TGCTTGTATG GCTGAAACAA TGATTTTAGC CCTGGAGGGC 
CGCTATGAAT CTTTTACTTT GGGAAGGGAT TTGACTCTGG AACAGATTGA GGAGATAGAG 
AGACTGGCGA ATAAGCATGG GTTTAAGGTA GCCGGTTTCA GAAGTTTTGA GAAGGCGGTT 
TCTTTGGAAG AAATTAAAGC AATTAAGCAA AAAGCCTTTA TAAAAAATTG CTCCCAGATC 
AAAAAACCAC AGGTAGTGAG TAACCTTCCT TAA

Protein sequence

MEKFAFVIHP LDIRDIYRKY PFARYLPDKL VEKAVTCLPA MKVSHITGVA SSYNKAEGWF 
VTCPLTAKQM VELPEGYVIN RIIGAARVAE KLGAKILGLG AFTSVVGDAG ITIAQNSNIA 
VTTGNSYTVA SAIQGVKKAA ALMGYDICQA DIVIIGATGS IGKVCARYLA REVKNLTLVA 
RDTSKLEEIA AKILFDYGLA VKVTPYSRSA LRKADVIITV TSAVDTIIGP GDLKPGAVVC 
DVSRPRNVSK KVAEERDDVL VIEGGIVEVP HGVNFNFNFG FPEGTAYACM AETMILALEG 
RYESFTLGRD LTLEQIEEIE RLANKHGFKV AGFRSFEKAV SLEEIKAIKQ KAFIKNCSQI 
KKPQVVSNLP