Gene Svir_20250 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Svir_20250
Symbol
ID	8387352
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharomonospora viridis DSM 43017
Kingdom	Bacteria
Replicon accession	NC_013159
Strand	-
Start bp	2160085
End bp	2161545
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	69%
IMG OID	644976088
Product	benzaldehyde dehydrogenase (NAD+)
Protein accession	YP_003133870
Protein GI	257056038
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.177841
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.892194
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACAGCTA GTACAGCCGG TCCGGTCGGT GACAGCCCCA CTCGCTGGTC TTCCTCGGCG 
GCCACGGGCG GTACTTTGAC GGTGACGGCG CCTGCCACGG GCAGTGTCCT CGCCGAGGTC 
GACGCGGCTT CCCCCGCCGA TGTCGACCGT GCCGTCGCCA AGGCGAAGCA GGCCCAGCGG 
GACTGGGCCG CCACCACCTA CGACCAGCGC GCCGCGGTGC TGCGGCGGGC CGCTCGACTG 
TTGGAAGCCG ACCCCGACCG GTTGCGCCGT TGGCTCGTCC CCGAATCGGG TTCGGCGATG 
GGCAAGGCGT CGTTCGAGGT CGGCCTGGTG GTCTCGGAAC TCGACGAATG CGCGGCGCTG 
GCCTCTCATC CCTACGGTGA ACTGCTGCAC TCCACCAAAC CGCGCCTGTC GCTGGCACGT 
CGCGTACCGG TCGGCGTGGT GGGGGTGATC TCGCCGTTCA ACTTCCCCGG AATCCTGTCG 
ATGCGGTCCG TCGCGCCCGC GTTGGCGGTG GGCAACGCCG TGGTGTTGAA ACCCGATCCC 
CGCACGCCGA TCTCGGGTGG TCTCGCGCTC GCCGAGCTGC TCGCCGAGGC GGGGTTGCCC 
GACGGGTTGC TCACCGTGTT GCCCGGCGGC GCGGAGGTCG GACAGGCGCT GGTGGCCCAC 
CCCGACGTGC CGTGCATCTC GTTCACCGGA TCCACCCCGG CCGGACGCAA GATCGCGGAG 
GCCGCCGCGC CGCTGCTCAA GCGCGTGCAC CTGGAACTCG GGGGCAACAA CGCACTACTC 
GTGCTCCCGG ACGCCGACGT CGAAGCCGCC GCCTCGGCCG CCGCGTGGGG TTCGTTCCTG 
CACCAGGGAC AGATCTGCAT GACGGCGGGG CGGCACCTCG TGCACTCGTC GATCGCGGAC 
GAGTTCACGG CGTTGCTCGC GAAGAAGGCC GAGGCCATCA CCGTCGGAGA CCCGACGGAC 
GAGAACAACG CACTCGGCCC GATCATCGAC GAACGGCAGC GGGAGCAGAT CCACCGCATC 
GTGACCGACA CGGTGGACGC GGGCGCGAAA CTGCTCGCCG GAGGGAAGTA CGACGGCCTG 
TTCTACCGGC CGACGGTCCT GGGGAACGTC CCGGTCGACA GCCCGGCGTT CCGGCAGGAG 
ATCTTCGGTC CGGTGGCCCC CGTGGTCACG TACGACACCG TGGACGAGGC GATCGAGCTC 
ATCAACGACA GCGAGTTCGG CCTCAGCGTC GGCATCCTGA CCTCCGACGC GTTCCGGGCA 
TACGAGCTCG CGGACCGGAT CGAGTCGGGC ATGGTCCACA TCAACGACCA GACGGTCGAC 
GACGAGGCCA CGATCCCGTT CGGTGGCGTG AAGGCCTCCG GGGCGGGCGG CCGCTTCGGT 
GGTGCGCGGG CCAACCTGGA GTCGTTCACC GAGATCCAGT GGATCACGAT GCAGTCGTCG 
ATCGAGCGTT ATCCGTTCTG A

Protein sequence

MTASTAGPVG DSPTRWSSSA ATGGTLTVTA PATGSVLAEV DAASPADVDR AVAKAKQAQR 
DWAATTYDQR AAVLRRAARL LEADPDRLRR WLVPESGSAM GKASFEVGLV VSELDECAAL 
ASHPYGELLH STKPRLSLAR RVPVGVVGVI SPFNFPGILS MRSVAPALAV GNAVVLKPDP 
RTPISGGLAL AELLAEAGLP DGLLTVLPGG AEVGQALVAH PDVPCISFTG STPAGRKIAE 
AAAPLLKRVH LELGGNNALL VLPDADVEAA ASAAAWGSFL HQGQICMTAG RHLVHSSIAD 
EFTALLAKKA EAITVGDPTD ENNALGPIID ERQREQIHRI VTDTVDAGAK LLAGGKYDGL 
FYRPTVLGNV PVDSPAFRQE IFGPVAPVVT YDTVDEAIEL INDSEFGLSV GILTSDAFRA 
YELADRIESG MVHINDQTVD DEATIPFGGV KASGAGGRFG GARANLESFT EIQWITMQSS 
IERYPF