Gene TM1040_2508 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2508
Symbol
ID	4076510
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2649508
End bp	2650911
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	63%
IMG OID	638007832
Product	isopropylmalate isomerase large subunit
Protein accession	YP_614502
Protein GI	99082348
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR00170] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCCCA AAACACTCTA TGACAAGATC TGGGATGCGC ATGTCGCGCA AGAAGCCGAA 
GACGGCACCT GTCTGCTTTA TATCGACCGT CACCTCGTTC ACGAGGTGAC AAGCCCGCAA 
GCCTTTGAAG GGCTGCGCAT GGCAGGTCGC AAGGTGCACG CGCCAGAGAA AACCATCGCG 
GTGCCAGATC ACAACGTCCC CACCACTGCA GGACGCGAAA ACCCCGACCA GATGCCGGAG 
GACAGCCGCA TCCAGGTAGC CGCCCTTGAC ACCAACGCGC GTGAGTTCGG CGTGCATTAC 
TATCCGGTGA CCGACATCCG CCAGGGTATC GTGCACATCG TCGGCCCCGA GCAAGGCTGG 
ACCCTGCCCG GTATGACCGT GGTCTGTGGC GACAGCCACA CCGCGACCCA CGGTGCCTTT 
GGCGCGCTGG CGCATGGCAT TGGCACCTCG GAGGTGGAGC ATGTGCTTGC CACCCAGACG 
CTGATCCAGA AGAAGTCCAA GAACATGAAG GTCGAGATCA CCGGCAAGCT GTCGCCGGGC 
GTGACCGCCA AGGACATCGT TCTGACCATC ATTGGCGAAA CCGGCACCGG TGGCGGCACT 
GGCTATGTCA TCGAGTATTG CGGTGAAGCG ATCCGCGATC TGTCGATGGA AGGCCGCATG 
ACAATCTGCA ACATGGCCAT TGAGGGCGGC GCACGCGCCG GCCTGATCGC GCCCGACGAG 
ACCACCTTTG AATACGTCAA AGGCCGCCCG CATGCCCCCA AAGGCGCGCA GTGGGAAGCC 
GCCGTGAACT GGTGGAAAAC GCTCTACTCT GACGACGACG CCCATTGGGA CAAGATTGTG 
ACCATCCGCG GCGAAGACAT CGCGCCGACC GTCACATGGG GCACCAGCCC CGAAGACGCG 
CTGCCGATCA CCGCAACCGT CCCCGCCCCC GAGGATTTCA CTGGTGGCAA AGTCGAGGCC 
GCGCGCCGCG CGCTTGACTA CATGGGCCTC ACCCCCGGGA TGAAGCTGTC GGACATCGAG 
ATCGACACCG TGTTCATCGG CTCCTGCACC AACGGCCGCA TCGAAGATCT GCGCGCCGCT 
GCGGATGTAG TCAAAGGCAA GAAGATCAAG GACGGCATGC GCGCCATGGT GGTTCCGGGT 
TCCGGCCTCG TGCGCGCCCA GGCAGAAGAA GAGGGCCTTG CCGAGATCTT CAAGGATGCC 
GGTTTCGAAT GGCGTCTGGC GGGCTGCTCC ATGTGTCTGG CAATGAACCC CGACCAGCTG 
AGCGAGGGCG AGCGCTGCGC CTCCACCTCC AACCGGAACT TTGAAGGCCG TCAGGGCTTT 
AAGGGACGCA CGCACCTGGT GTCGCCAGCC ATGGCCGCCG CTGCTGCCGT TACCGGCAAA 
CTCACCGACG TTCGCGAGCT CTGA

Protein sequence

MSPKTLYDKI WDAHVAQEAE DGTCLLYIDR HLVHEVTSPQ AFEGLRMAGR KVHAPEKTIA 
VPDHNVPTTA GRENPDQMPE DSRIQVAALD TNAREFGVHY YPVTDIRQGI VHIVGPEQGW 
TLPGMTVVCG DSHTATHGAF GALAHGIGTS EVEHVLATQT LIQKKSKNMK VEITGKLSPG 
VTAKDIVLTI IGETGTGGGT GYVIEYCGEA IRDLSMEGRM TICNMAIEGG ARAGLIAPDE 
TTFEYVKGRP HAPKGAQWEA AVNWWKTLYS DDDAHWDKIV TIRGEDIAPT VTWGTSPEDA 
LPITATVPAP EDFTGGKVEA ARRALDYMGL TPGMKLSDIE IDTVFIGSCT NGRIEDLRAA 
ADVVKGKKIK DGMRAMVVPG SGLVRAQAEE EGLAEIFKDA GFEWRLAGCS MCLAMNPDQL 
SEGERCASTS NRNFEGRQGF KGRTHLVSPA MAAAAAVTGK LTDVREL