Gene Spro_4226 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_4226
Symbol
ID	5602790
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	4684931
End bp	4685989
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	59%
IMG OID	640939786
Product	alcohol dehydrogenase
Protein accession	YP_001480448
Protein GI	157372459
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGAAAA TGTTGGCGGC TTATTTACCC GGAAACGCCA CGGCAGAACT GCGCGAGGTG 
GATATTCCGC AACCGGGCAT TGGCCAGGTA TTAATTAAAA TGAAATCGTC CGGTATTTGC 
GGCAGCGATA TTCATTATAT TTATCATCAG CATCGTGGTA CGGCGGCCGC ACCGGATCAA 
CCCTTGTACC GGGGGTTTAT TAACGGTCAC GAGCCTTGTG GCCAGATTGT GGCGCTGGGG 
GCCGGCTGCC GCCACTTCCG CGAGAGCGAT CGCGTGCTGG TGTACCATAT TTCCGGCTGC 
GGCTTTTGCA GCAACTGCCG GCGAGGCTAT CCGATTTCCT GCACCGGCGT TGGCAAGGCC 
GCCTATGGCT GGCAGCGGGA TGGCGGCCAT GCCGACTACC TGTTGGCGGA GGAAAAGGAT 
TTGATTCATC TGCCGGATTC GCTCAGCTAT GAAGACGGCG CTTTTATCTC CTGTGGGGTC 
GGCACGGCTT ATGAAGGTAT CGTGCGTGGC GAGGTCTCCG GCAGCGACCA CGTACTGGTC 
GTGGGGCTGG GCCCGGTCGG TATGATGGCG ATGATGCTGG CGAAGGGACG CGGGGCAAAA 
ACGGTGATTG GCGTTGATGT TATCCCGGAG CGTCTGGCGA CCGCGAAACG CCTGGGGCTG 
ATGGATCACG GCTTCCTGAG CGGTGACGAC GTGACAGAAC GCATTCGCCA ATTGACCGCT 
GGCGGGGCCA ACGTCACGCT CGACTGTTCC GGCAACGCCA AAGGGCGCCT GCTGGCGCTG 
CAGGCCTCTT CGGACTGGGG AAGAGTGATC TACATTGGCG AAACCGGCAA GGTGGAATTC 
GAGGTCAGCG CAGACCTGAT GCATCACCAG CGGCGGATCA TCGGCTCTTG GGTCACCAGC 
CTGCACCACA TGGAAAAATG CTGCACCGAC CTGCACGACT GGAAAATGCA CCCGCATCAG 
GCGATCACCC ACCGTTTTAA ACTCGGGCAG GCTGCCGAGG CCTATGCTCT GATGGCTTCT 
GGCCAGTGCG GCAAAGTGGT GATCAATTTC GCCGATTAA

Protein sequence

MGKMLAAYLP GNATAELREV DIPQPGIGQV LIKMKSSGIC GSDIHYIYHQ HRGTAAAPDQ 
PLYRGFINGH EPCGQIVALG AGCRHFRESD RVLVYHISGC GFCSNCRRGY PISCTGVGKA 
AYGWQRDGGH ADYLLAEEKD LIHLPDSLSY EDGAFISCGV GTAYEGIVRG EVSGSDHVLV 
VGLGPVGMMA MMLAKGRGAK TVIGVDVIPE RLATAKRLGL MDHGFLSGDD VTERIRQLTA 
GGANVTLDCS GNAKGRLLAL QASSDWGRVI YIGETGKVEF EVSADLMHHQ RRIIGSWVTS 
LHHMEKCCTD LHDWKMHPHQ AITHRFKLGQ AAEAYALMAS GQCGKVVINF AD