Gene TM1040_3504 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3504
Symbol
ID	4075183
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	540502
End bp	541899
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	62%
IMG OID	638005019
Product	dihydrolipoamide dehydrogenase
Protein accession	YP_611738
Protein GI	99078480
COG category	[C] Energy production and conversion
COG ID	[COG1249] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide dehydrogenase (E3) component, and related enzymes
TIGRFAM ID	[TIGR01350] dihydrolipoamide dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.305711
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATCCT ATGACGTCAT CGTAATCGGC GCCGGTCCCG GCGGCTATGT CAGCGCAATC 
CGCTGCGCCC AGCTGGGCCT CAAGACCGCC ATCGTAGAAG GCCGCGAAAC CCTTGGCGGC 
ACCTGCCTCA ACGTGGGCTG CATCCCCTCC AAGGCGCTCT TGCACGCAAC CCATATGCTG 
CATGAAGCAG AGCACAACTT CGGCGCCATG GGTCTCAAGG GCAAAAGCCC CTCGGTCGAC 
TGGAACCAGA TGAAATCCTA CAAGGATGAG GTCATCGGCC AGAACACCGG CGGTGTCGAG 
TTCCTCATGA AGAAGAACAA GATCGACTGG ATCAAGGGCT GGGCGTCGAT CCCCGAGGCG 
GGCAAGGTCA AAGTGGGCGA CGACACCCAT GAGGCCAAGA ACATCATCAT CGCCTCCGGC 
TCCGTGCCCT CCGCCCTGCC GGGTGTCGAG GTCGACAACG ACAAGGGCCT TGTGGTCGAC 
AGCACCGGCG CTCTGGAACT GCCCAAAGTC CCGAAGAAAA TGGTCGTGAT CGGCGCAGGC 
GTCATTGGCC TCGAGCTCGG CTCGGTCTAC GCGCGCCTTG GCGCAGAGGT CACCGTGGTC 
GAATATATGG ACGCGGTCTG TCCCGGCATG GACAAGGACG TCCAGCGCGG CTTCAAACGC 
ATCCTTGAAA AGCAGGGCCT CAGCTTCATC ATGGGGGCCG CCGTCAAGGG CGTTGAAACC 
ACGAAATCCA AGGCCAAAGT CTCTTATGAG CCCAAAAAAG GCGGCGACGC AGAGGTCATC 
GAGGCCGATG TGGTGCTCGT CGCCACGGGG CGCAAACCCT ATGCCGAAGG CCTTGGCCTC 
GACGCGCTTG GCGTCAAGAT GACCGAACGC GGCCAGATCG CCACCGACGC GCAATGGGCC 
ACGAACGTCA AAGGCATCTA CGCCATCGGC GACGTCATCG AGGGTCCGAT GCTCGCGCAT 
AAGGCCGAAG ACGAAGGCAT GGCCGTGGCC GAAGTGATCG CGGGCAAACA TGGCCACGTG 
AATTACGGCG TCATTCCCGG TGTGGTCTAC ACCACCCCAG AGGTGGCGAC CGTCGGTGCC 
ACCGAAGACG CGCTCAAGGC CGAAGGTCGC AAGATCAAGG TGGGCAAGTT CATGTTCATG 
GGCAACGCCC GCGCCAAGGC CGTGCATCAG GCCGAGGGTG GTTTTGTGAA ACTGATTGCC 
GACAAGGAAA CCGACCGCAT CCTCGGTGCG GCCATCATCG GCCCCGGTGC AGGCGATCTG 
ATCCACGAGA TCTGTGTGGC GATGGAATTT GGCGCCTCCG CCGAGGATCT GGCGCTGACC 
TGCCACGCGC ATCCGACCTA TTCCGAGGCC GTGCGCGAAG CAGCCCTTGC CTGCGGCGAC 
GGCGCGATCC ACAGTTAA

Protein sequence

MASYDVIVIG AGPGGYVSAI RCAQLGLKTA IVEGRETLGG TCLNVGCIPS KALLHATHML 
HEAEHNFGAM GLKGKSPSVD WNQMKSYKDE VIGQNTGGVE FLMKKNKIDW IKGWASIPEA 
GKVKVGDDTH EAKNIIIASG SVPSALPGVE VDNDKGLVVD STGALELPKV PKKMVVIGAG 
VIGLELGSVY ARLGAEVTVV EYMDAVCPGM DKDVQRGFKR ILEKQGLSFI MGAAVKGVET 
TKSKAKVSYE PKKGGDAEVI EADVVLVATG RKPYAEGLGL DALGVKMTER GQIATDAQWA 
TNVKGIYAIG DVIEGPMLAH KAEDEGMAVA EVIAGKHGHV NYGVIPGVVY TTPEVATVGA 
TEDALKAEGR KIKVGKFMFM GNARAKAVHQ AEGGFVKLIA DKETDRILGA AIIGPGAGDL 
IHEICVAMEF GASAEDLALT CHAHPTYSEA VREAALACGD GAIHS