Gene TM1040_3713 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3713
Symbol
ID	4075420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	771666
End bp	773009
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	64%
IMG OID	638005233
Product	betaine-aldehyde dehydrogenase
Protein accession	YP_611942
Protein GI	99078684
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0945015
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCGACTG CTACGGCGAA GGATGTCGAC CGCGCGGTGG TCTCGGCCCG GCGCGCTTTT 
GACGACGGTC GCTGGTCAGG GCTGGCCCCG GCGGCGCGCA AAAAGGTTCT GCACCGGATT 
GCCGACAAGA TCGAGGCCGA GGCGCTGGCG CTCACGGTGC TTGGCGTGCG TGACAATGGC 
ACCGAGTTCA ATATGGCGTT GAAGGCCGAG GCCGGATCTG CTGCAGGGAC TTTCCGCTAC 
TACGCCGAGG CGCTGGACAA AGTCGCAGGC GAGGTCGCGC CCACCGCGCC GGACGTTCTG 
GGACTCGTGC ATCGCGCGCC CGTTGGTGTC GTGGGCGCAA TCGTGCCATG GAACTTTCCG 
CTGATGATCG GCGCCTGGAA GCTCGCGCCC GCGCTCGCGA TGGGCAATTC CGTGGTGCTG 
AAGCCGGCTG AGACTGCCTC GCTGTCGCTG CTACGTCTTG CTGAGATCTG CGCAGACTGC 
GGCCTGCCGG ATGGGGTGTT GAATGTAGTG ACCGGGCCGG GCGCCGTGAC TGGCGCCGCC 
CTATCGGAGC ATATGGATGT GGACGTGATG GTCTTTACCG GTTCTGGCGC GACGGGGCGG 
CGCCTGCTGG TGGCCTCGGC GCGGTCCAAC CTCAAGCGCT GCTACCTCGA GCTGGGAGGC 
AAGTCCCCCA ATATCGTTTT TGCGGATGCA AAGGATCTCG ATCACGTGGC CAAGGTCTCG 
GCCATGGGGA TTTTCCGCAA TTCCGGTCAG GTCTGTGTCG CAGGATCGCG CCTTTTGGTG 
GAGGCCTCCA TCCACGAGGA ATTTGTGGCC CGGGTCGTGG CCCATGCACA GGCGCTTCGG 
GTTGGCGACC CCCTGGATAT GAACACTCAG ATTGGCGCCG TGAATTCAGA GACCCAGCTT 
GCAGCAAACC TTGCCCACGT GGAGCGTGCC GCCGCCCAAG GGGGCGAGGT GCTCTGCGGG 
GGCGGTCGCA TCCTCTCCGA GACGGGTGGA ACCTACATGG CGCCGACCGT TGTGGCGGGT 
GTCACGCAGG ACGCGGACCT CTTTCAAAAG GAGGTGTTTG GTCCGGTGCT CTCGGTCACG 
GCGTTTGAGA GCGAAGACGA AGCACTTCGG CTTGCCAATG CCACCGACTA TGGGCTTGCG 
GCAGGGGTCT GGTCGCAGGA TCTGTCGCGC GCGCATCGCT GCGTGGCCGG TATCCGCGCA 
GGCGTCGTGC ATGTGAACAC CTATGGCGGG GCTGATAATA CGGTGCCTTT GGGTGGGGTT 
GGCCAATCCG GTAACGGTCA CGACAAATCC CTGCATGCGC TCGAGAAATA CGTCGATCTG 
AAAACGGCCT GGATTCAGCT TTGA

Protein sequence

MATATAKDVD RAVVSARRAF DDGRWSGLAP AARKKVLHRI ADKIEAEALA LTVLGVRDNG 
TEFNMALKAE AGSAAGTFRY YAEALDKVAG EVAPTAPDVL GLVHRAPVGV VGAIVPWNFP 
LMIGAWKLAP ALAMGNSVVL KPAETASLSL LRLAEICADC GLPDGVLNVV TGPGAVTGAA 
LSEHMDVDVM VFTGSGATGR RLLVASARSN LKRCYLELGG KSPNIVFADA KDLDHVAKVS 
AMGIFRNSGQ VCVAGSRLLV EASIHEEFVA RVVAHAQALR VGDPLDMNTQ IGAVNSETQL 
AANLAHVERA AAQGGEVLCG GGRILSETGG TYMAPTVVAG VTQDADLFQK EVFGPVLSVT 
AFESEDEALR LANATDYGLA AGVWSQDLSR AHRCVAGIRA GVVHVNTYGG ADNTVPLGGV 
GQSGNGHDKS LHALEKYVDL KTAWIQL