Gene TM1040_2656 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2656
Symbol
ID	4077567
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2791376
End bp	2792497
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	61%
IMG OID	638007980
Product	saccharopine dehydrogenase
Protein accession	YP_614650
Protein GI	99082496
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1748] Saccharopine dehydrogenase and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATGGA ACATCTGTGT TGTGGGCGCG GGCAAGATCG GCCAGGCGAT TGCCACGTTT 
TTAAAGACAT CTGCCAACTA TCAGGTGACC CTCGCGGATC ATGACCTGAA TGCGCTGGGC 
GCGGTGGCGG AGCTGGGGGT GCCGACCCGG CAGATCGACG CCAAGGATCC GGTGTCGCTG 
GCAAAGGGGC TTCAGGGGTT TGACGCGGTG ATTTCTGCCG CGCCGTTCTT TTTGACGCCA 
ATGATAGCGG AGGCCGCAAA AACCGCCGGC GCGCATTATT TCGACCTCAC CGAGGATGTG 
GCCGCCACCG AAGCGGTGCG CAAACTGGCC GAAGGCAGCG AGACGGTGTT CATGCCCCAG 
AGCGGCCTTG CGCCCGGTTT CGTGGGCATC GCGGGCGCGT CACTGGCGGC AGAATTCGAT 
GAGCTGGACA GCCTGCACAT GCGGGTCGGC GCGCTGCCGA AGTTTCCGAC CAACGCGTTG 
AAATATAATC TCACCTGGTC CACCGACGGG CTGATCAACG AGTATTGCAA CCCCTGCGAT 
GCCATCGTGA ATGGCGCGCG CACCAAGACA GCGCCGCTCG AAGATTACGA GCGTCTGAGC 
CTTGATGGGG TTGAGTATGA ATGCTTCAAC ACCTCGGGTG GGCTTGGCAC CTTGCCAGAG 
ACGCTGGACG GGAAGGCGCG GGCGGTCTCG TATCGGTCGA TCCGCTATCC CGGTCACTGC 
GACATCCTGA AAATGCTGCT GCATGATCTG GGGCTGGAAC GCCGCCGCGA CCTGATGAAA 
GAGATTTTCG AGAGCGCATT GCCGCGCACC GATCAGGACG TGGTGCTGGT CTATTGCACC 
GCGCGGGGCC GCATCAATGG CGAGCTGCGT GAAAAGAGCC TCATCAACAA GAGCTATGCC 
CGCCAGATCG GCGGCAAGAC CTGGAGCGCG ATCCAAGTCA CCACCACCGC CGGGGTGCTG 
GGGGTTGTGG ATCTGGTGCG GCAAGGCGTC CTGCCCGCGC GCGGCTTTGT AAGCCAGGAA 
CAGGTGAAGC TGCAGGACTT CCTCGAGACA GAATTTGGCC AGCTCTACCG GGCGGGCGAC 
ATCGACCACA TGACAGACAC AACAAAATTG GCAGCTGAGT GA

Protein sequence

MQWNICVVGA GKIGQAIATF LKTSANYQVT LADHDLNALG AVAELGVPTR QIDAKDPVSL 
AKGLQGFDAV ISAAPFFLTP MIAEAAKTAG AHYFDLTEDV AATEAVRKLA EGSETVFMPQ 
SGLAPGFVGI AGASLAAEFD ELDSLHMRVG ALPKFPTNAL KYNLTWSTDG LINEYCNPCD 
AIVNGARTKT APLEDYERLS LDGVEYECFN TSGGLGTLPE TLDGKARAVS YRSIRYPGHC 
DILKMLLHDL GLERRRDLMK EIFESALPRT DQDVVLVYCT ARGRINGELR EKSLINKSYA 
RQIGGKTWSA IQVTTTAGVL GVVDLVRQGV LPARGFVSQE QVKLQDFLET EFGQLYRAGD 
IDHMTDTTKL AAE