Gene SAG1637 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1637
Symbol	adh
ID	1014446
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	+
Start bp	1639845
End bp	1640900
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	37%
IMG OID	637316806
Product	alcohol dehydrogenase, zinc-containing
Protein accession	NP_688628
Protein GI	22537777
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000634163
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGCTG CAACTTATCT TTCAGCTAAT GAATTATCAC TTACTGATAA GGCTAAACCT 
CAAGTAATAA AACCCACAGA TGCGGTTGTA AGACTTGTCA AAACAACCAT TTGTGGTACT 
GATCTACATA TCCTTGGTGG CGATGTTCCT GCTTGTAAAC CAGGAACAAC TTTAGGTCAT 
GAAGGCATTG GTATCGTCGA AGAAGTTGGT TCTGCTGTCA ATCATTTTAA AGTCGGAGAT 
AAAGTAATTA TTTCTTGTGT CACTGCCTGT AATACTTGCT ATTACTGTAA GCACCAGTTG 
CCTTCACATT GTGAAGATGG CGGGTGGATT TTAGGACATC TTATTGAAGG TACTCAAGCA 
GAATATGTTC ATATTCCACA TGCAGATGGT AGCCTTTATC ATGCACCTGA AGGTGTTTGT 
GACGATGCAT TGGTTATGTT ATCTGATATT TTACCAACTT CATACGAAAT CGGCGTCTTA 
CCTTCTCACA TTAAACCAGG TGATACTGTT TGTATTGTAG GCGCTGGACC AATTGGACTA 
TCTGCCTTAC TAACTGCACA ATTCTATTCT CCTGCCAAAA TTATTATGGT TGATTTATCT 
CAAAAACGAC TTGAAGCCTC TAAAAAATTT GGTGCAACAC ACACCATTCT ATCAACGTCT 
ACTCAAGAAG TTAAAGAAGA AATTGATAAA ATTACCAAAG GCCGTGGCGT TGATGTCGTA 
TTAGAATGTG TTGGTTATCC TGCAACATTT GATATTTGTC AAAATGTAGT TTCTATTGGA 
GGACATATCG CAAATGTTGG TGTTCATGGT AAACCTGTTG AATTTAACCT CCAAGATTTA 
TGGATAAAAA ATATAACCCT TAATACTGGA TTAGTTAATG CTAATACAAC TGAAATGCTC 
CTTGAAGTTC TTGAGACAGG CAAAATCGAT GCAACACAAC TAGTAACACA TCACTTCAAG 
CTATCTGAAA TCGAAGAAGC TTATAAGGTA TTTAAAGCTG CTGAAGAAAA CAATACTCTC 
AAAGTTATCA TCGAAAACGA TATTACTCCA GCCTGA

Protein sequence

MRAATYLSAN ELSLTDKAKP QVIKPTDAVV RLVKTTICGT DLHILGGDVP ACKPGTTLGH 
EGIGIVEEVG SAVNHFKVGD KVIISCVTAC NTCYYCKHQL PSHCEDGGWI LGHLIEGTQA 
EYVHIPHADG SLYHAPEGVC DDALVMLSDI LPTSYEIGVL PSHIKPGDTV CIVGAGPIGL 
SALLTAQFYS PAKIIMVDLS QKRLEASKKF GATHTILSTS TQEVKEEIDK ITKGRGVDVV 
LECVGYPATF DICQNVVSIG GHIANVGVHG KPVEFNLQDL WIKNITLNTG LVNANTTEML 
LEVLETGKID ATQLVTHHFK LSEIEEAYKV FKAAEENNTL KVIIENDITP A