Gene TM1040_0106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0106
Symbol
ID	4078691
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	112632
End bp	113774
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	62%
IMG OID	638005393
Product	saccharopine dehydrogenase (NADP+, L-glutamate forming)
Protein accession	YP_612101
Protein GI	99079947
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1748] Saccharopine dehydrogenase and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTATTC ACTGGTGCGG CACCGGCCTC TCCGCCATTC CCGGCCTGCG TCGCCTGCTC 
GAAGCGGGTC ACGACGTCGC CGTCTGGAAC CGCACACCCG AAAAAGCCGC CGAGGCTGTT 
GGGGATCTGA CCACCAACAT CCACAAATTC TCCATTGCAC GCCTCTCGGA GCTTCTGAGC 
CCGGCGGACG TCGTGGTCTC CATGCTGCCC GGCGACTGGC ATGTGGAACT CGCCGAGCTC 
GCAATTTCCA AGGGGGCGCA TTTTGTGTCC TCCTCCTACA TCTCGCCGGA GATGCGCGCC 
CTCGACCAAA AGGCCAAAGA CGCCGGAGTC GCGCTGGTCA ATGAGGTCGG GCTTGATCCG 
GGCATCGATC ACCTGATGGC CCATGCCCTC GTGGCTGAAT ACGCGGAATC TCCGGCCTTC 
GACGCGGACA ATGAGATCAG CTTTCTGTCC TATTGCGGCG GCATCCCAAA GATCCCGAAC 
CCATTTCGCT ACAAGTTCAG CTGGTCGCCC CTCGGCGTGC TGAAGGCCCT GCGCTCGCCC 
TCGCGCTCGA TCCGCGATTT TGAGGTTCTG GACGTGGCGC GCCCCTGGGA TGCGATCTCG 
AGCTATGACG CGCCGCTTGC GACGCCCGAA ACCTTTGAGG TTTATCCCAA CCGCGACAGT 
CTGCCGTTCA TGGAGCAGTA TCACTTCGAC AAGGACTGGA AGGTCAAAAC CTTCGTGCGC 
GGCACCCTAC GTCTGAATGG CTGGACCGAG GCCTGGGCGG ATGTCTTCAA AGAAGTCGAA 
ACGCTTGAAG GCCCCGAAGG CGATGCTCGC CTCAAGGAAA TGTCCGATCA GTTCTGGGAC 
GAAAACGCCT ATGACGAAGG CGAGCCGGAT CGCGTGGTGC TCTGTGTGGA CCTCAAGGCG 
GAAAAAGACG GCCAGACCAA GTGGCACAAG ACCTATGTGA TGGACGCATG GGGCGACGAG 
CGCGGAAGCG CCATGGCGCG TCTGGTGTCC TATCCGGTGT CCTACGCCAT TGAGGCCGCG 
ATGAACGGCA AGATCGCACC CGGCGTCAGC GCCGCGCCCA GCGATCCGGC GCTGGTGGAC 
AGCTGGATGG GGCGCATCGG CGCACTGGCG CAGCACCTTC AGGTGGTGTC CCACCGCTCC 
TGA

Protein sequence

MTIHWCGTGL SAIPGLRRLL EAGHDVAVWN RTPEKAAEAV GDLTTNIHKF SIARLSELLS 
PADVVVSMLP GDWHVELAEL AISKGAHFVS SSYISPEMRA LDQKAKDAGV ALVNEVGLDP 
GIDHLMAHAL VAEYAESPAF DADNEISFLS YCGGIPKIPN PFRYKFSWSP LGVLKALRSP 
SRSIRDFEVL DVARPWDAIS SYDAPLATPE TFEVYPNRDS LPFMEQYHFD KDWKVKTFVR 
GTLRLNGWTE AWADVFKEVE TLEGPEGDAR LKEMSDQFWD ENAYDEGEPD RVVLCVDLKA 
EKDGQTKWHK TYVMDAWGDE RGSAMARLVS YPVSYAIEAA MNGKIAPGVS AAPSDPALVD 
SWMGRIGALA QHLQVVSHRS