Gene Spro_1956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_1956
Symbol
ID	5607423
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	+
Start bp	2137153
End bp	2138250
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	59%
IMG OID	640937494
Product	alcohol dehydrogenase
Protein accession	YP_001478187
Protein GI	157370198
COG category	[C] Energy production and conversion
COG ID	[COG1062] Zn-dependent alcohol dehydrogenases, class III
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0230313
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAATAA CAGCCGCAGT CAGTGAAAAA GCGACGGAGG GATTCTCCCT CAAACAGTTA 
CAGCTTGGAG AACCCCGCGC CGATGAGGTG TTGGCAAAAC TGGTCGCGAC CGGCCTGTGC 
CATACCGATA TCGCCGCGCA CAAAGGCGTT ATATCGATGC CTGCGCCGGT GGTGCTCGGC 
CATGAAGGCG CCGGGGTCGT AGTGCGGGTC GGGGCCGGGG TCAGTAAGGT GGCGCCCGGC 
GATCATGTGG TGCTGTCGCT GGCCTCATGC GGCGTCTGCG ACAAGTGTAG CATCGGCATG 
CCGACCTATT GCCGTCAACA TGTGCCATTG AACTGGCTGG CGCAGCGCAC CGACGGTTCG 
GTCAGCCTGC ATGATGAAAA TGGCGATGTG CACAGCCATT TCTTCGGTCA GTCCTCTTTT 
GCGCAGTATG CCGTGGTCAA TGTCAGCAGC ATTGTCCCTG TCGATAAGGC GATCCCGTTG 
GAATACCTTG GGCCATTGGC CTGCGGACTG ATGACCGGCG CGGGCGCAGT GATGAACACT 
CTGCGGCCGC ATGCGGGTTC TACGCTGGTG GTCTTTGGTC TTGGCGCGGT GGGCCTGGCG 
GCGGTGATGG CAGCCCGGGT GGTGGGTTGC GGCCACATCG TCGCGGTGGA TATCAAAGAG 
AACCGTCTGG CGTTAGCCAA AGAGTTGGGC GCTACAGAGG TGATCAACCC GAAAACGGCG 
AATGTGGATG AAGTGCTTAA TCAACTGACC GAGGGACGCG GTGCGGACTA CAGCGTTGAA 
GCCGCCGGGA ACGCGGGCGT CATGGCCGAT GCGGTGCGGG TGTTGGCGGA AAATGGCAAA 
TGCGTACTGA CCGGCGTGGT ACCGGAGGGC GAATCTTTGC CGCTCGACAT TATGCACTTT 
ATCCGCGGCC GCACGGTGCA GGGTTCGATC ATGGGCGATG CGGCACCGGC GATGTTTATC 
CCGATGCTGG CGCAGCTATT CCAGCAAGGG CGGTTCCCGA TCGATCGCCT TATCCGTTTT 
TATGCCATGA ATGAGATCAA CCAGGCGATG GCGGACTCAC AATCCGGTGA AACCATTAAA 
GCCGTTATTC GTATGTAA

Protein sequence

MEITAAVSEK ATEGFSLKQL QLGEPRADEV LAKLVATGLC HTDIAAHKGV ISMPAPVVLG 
HEGAGVVVRV GAGVSKVAPG DHVVLSLASC GVCDKCSIGM PTYCRQHVPL NWLAQRTDGS 
VSLHDENGDV HSHFFGQSSF AQYAVVNVSS IVPVDKAIPL EYLGPLACGL MTGAGAVMNT 
LRPHAGSTLV VFGLGAVGLA AVMAARVVGC GHIVAVDIKE NRLALAKELG ATEVINPKTA 
NVDEVLNQLT EGRGADYSVE AAGNAGVMAD AVRVLAENGK CVLTGVVPEG ESLPLDIMHF 
IRGRTVQGSI MGDAAPAMFI PMLAQLFQQG RFPIDRLIRF YAMNEINQAM ADSQSGETIK 
AVIRM