Gene Spro_3828 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_3828
Symbol	tas
ID	5606664
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	+
Start bp	4235449
End bp	4236489
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	57%
IMG OID	640939388
Product	putative aldo-keto reductase
Protein accession	YP_001480052
Protein GI	157372063
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0132972
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.503981
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATACC ACCGTATTCC CCACAGTTCT TTAGAAGTGA GCGTGCTGGG ACTGGGCACC 
ATGACCTTTG GCGAACAGAA CAGTGAAGCC GATGCCCATG CGCAACTCGA CTATGCATTA 
GCCGCTGGCG TCAACCTGAT TGACACCGCA GAGATGTACC CGGTACCGCC CCGCCCTGAA 
ACCCAGGGGC TGACCGAGCA ATACATCGGC AGTTGGATCA AGGCACGCGG CAACCGTGAA 
AAGATAGTGC TGGCCAGCAA GATTGCCGGG CCGGTGCGCG GTACCGACAG CAGCATCCGC 
CCGCAGCAGG CGCTGGATCG CAAAAATATT CGTGTCGCGC TGGACGCCAG CCTGAAACGA 
CTCAACACCG ATTATCTCGA TCTCTACCAA TTGCACTGGC CGCAGCGCCC GACCAACTAC 
TTCGGCAAGC TCAATTATCA ATACACCGAC GATAAGGCCA CCGTCACCCT GCTGGAAACG 
CTGGAAGCGC TGACCGAACA GGTACGCGCC GGTAAAATCC GCTATATCGG GGTGTCTAAC 
GAAACGCCAT GGGGCGTAAT GCGTTACCTG CAACTGGCTG AAAAACATGA GTTGCCGCGC 
ATCGTCTCGA TTCAAAACCC CTATAGCCTG CTGAACCGCA GTTTTGAGAT TGCCCTGGCG 
GAGATCAGCC AGCACGAAGG GGTTGAACTG TTGGCCTATT CCAGCCTGGC GTTCGGCACC 
CTGAGCGGCA AGTATCTCAA CGGTGCCAAG CCTGCCGGTG CACGCAACAC GCTATTCACT 
CGCTTTAACC GCTACTCTGC GCCACAAACG CAGTTGGCGA TTGCCGAGTA TGTCGCGTTA 
GCCAAAAAGC ACGGGTTGGA TCCGTCGCAG ATGGCACTGG CGTTTGTGCG CCAGCAGCCG 
TTCGTTGCCA GCACCCTGCT GGGTGCAACC ACGCTGGAAC AGCTGAAAAC CAACATCGAC 
AGTTTCGACG TGGTATTGAA TGAAGACGTA CTGCAGGGGC TGGAAGAGAT CCACACCCGC 
TTTACTATTC CGGCACCATA A

Protein sequence

MQYHRIPHSS LEVSVLGLGT MTFGEQNSEA DAHAQLDYAL AAGVNLIDTA EMYPVPPRPE 
TQGLTEQYIG SWIKARGNRE KIVLASKIAG PVRGTDSSIR PQQALDRKNI RVALDASLKR 
LNTDYLDLYQ LHWPQRPTNY FGKLNYQYTD DKATVTLLET LEALTEQVRA GKIRYIGVSN 
ETPWGVMRYL QLAEKHELPR IVSIQNPYSL LNRSFEIALA EISQHEGVEL LAYSSLAFGT 
LSGKYLNGAK PAGARNTLFT RFNRYSAPQT QLAIAEYVAL AKKHGLDPSQ MALAFVRQQP 
FVASTLLGAT TLEQLKTNID SFDVVLNEDV LQGLEEIHTR FTIPAP