Gene TM1040_3762 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3762
Symbol
ID	4075470
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	816768
End bp	817871
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	61%
IMG OID	638005283
Product	3-isopropylmalate dehydrogenase
Protein accession	YP_611991
Protein GI	99078733
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR00169] 3-isopropylmalate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAACC CATCGATTCT GATTTTGCCC GGTGACGGCA TCGGCCCCGA AGTGATGGCC 
GAGGTCAGAA AGGTCATTTC CTGGTTCGGC GCCAAGCGCG ATATTCAGTT CGATGTGAGC 
GAAGATCTGG TTGGCGGCTC TGCCTATGAC GCCCATGGCA CGCCCCTGCA TGACGATACC 
ATGGCAAAGG CGCAAGAGGT GGACGCTGTG CTTCTCGGCG CGGTGGGTGG CCCGAAATAC 
GACGCACTCG ATTTCTCGGT AAAGCCCGAG CGCGGCCTTC TGCGCCTGCG CAAGGAAATG 
GATCTTTATT CCAACCTGCG TCCGGCCCAG TGCTTTGATG CGCTGGCGGA TTTCTCCTCG 
CTCAAGAAGG ACGTCGTGGC CGGGCTCGAT ATCATGATCG TGCGCGAACT GACCTCCGGG 
ATCTACTTTG GCGAGCCGCG CGGCATCATC GAAGAAGGCA ACGAGCGCGT TGGCATCAAC 
ACCCAGCGCT ATACCGAATC CGAGATCGAG CGTGTTGCGC GTTCGGCGTT TGAACTGGCC 
ATGCGTCGCG GCAAGAAACT CTGCTCGATG GAAAAAGCCA ACGTGATGGA GAGCGGCATC 
CTGTGGCGCG AAGTTGTCAC CGAGGTGAGC AAGGACTACC CCGAGGTGGA ACTTTCGCAC 
ATGTACGCGG ATGCCGGTGC CATGCAGCTC TGCCGCTGGC CCAAGCAGTT TGACGTGATT 
GTCACCGACA ATCTCTTTGG CGATCTGCTT TCCGATGCTG CGGCCATGCT GACGGGATCC 
TTGGGCATGC TCCCCTCCGC GTCGCTTGGC GCGCCGATGG CCAATGGTCG CCCCAAGGCG 
CTTTATGAGC CCGTGCACGG CTCGGCCCCT GACATCGCCG GTCAGGGCAA GGCCAACCCG 
ATTGCCTGCA TCCTCTCTTT TGCCATGGCG CTGCGCTACA GCTTTGACAT GGGCACCGAG 
GCGGACCGCC TTGAAGCGGC TGTCGAGAAA GTGCTCGCCG ATGGCGTGCG CACCGCGGAC 
CTTCTGGGCG AAGAGGGCGT GACCCCGGTC AGCACCTCCG AGATGGGCGA TGCCGTGGTC 
GAGGCGCTCA ACGCAAGCCT CTAA

Protein sequence

MSNPSILILP GDGIGPEVMA EVRKVISWFG AKRDIQFDVS EDLVGGSAYD AHGTPLHDDT 
MAKAQEVDAV LLGAVGGPKY DALDFSVKPE RGLLRLRKEM DLYSNLRPAQ CFDALADFSS 
LKKDVVAGLD IMIVRELTSG IYFGEPRGII EEGNERVGIN TQRYTESEIE RVARSAFELA 
MRRGKKLCSM EKANVMESGI LWREVVTEVS KDYPEVELSH MYADAGAMQL CRWPKQFDVI 
VTDNLFGDLL SDAAAMLTGS LGMLPSASLG APMANGRPKA LYEPVHGSAP DIAGQGKANP 
IACILSFAMA LRYSFDMGTE ADRLEAAVEK VLADGVRTAD LLGEEGVTPV STSEMGDAVV 
EALNASL