Gene TM1040_0860 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0860
Symbol
ID	4076035
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	913262
End bp	914491
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	60%
IMG OID	638006162
Product	5-aminolevulinate synthase
Protein accession	YP_612855
Protein GI	161899030
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0156] 7-keto-8-aminopelargonate synthetase and related enzymes
TIGRFAM ID	[TIGR01821] 5-aminolevulinic acid synthase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.63511
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGTGG ACTATACCGC ACAACTCGAC GCAGCGATTG AACGCCTTCA CGAAGAAGGC 
CGCTACCGGA CGTTCATTGA TATCGAGCGT CGCCGGGGGC AGTTTCCGCA TGCGGTCTGG 
ACCCGTCCCG ATGGCAGCGA ACAGGACATC ACCGTCTGGT GCGGCAACGA CTATCTCGGC 
ATGGGGCAGC ACCCGGTTGT GCTGAAGGCG ATGCGCGATG CAATTGATGC CACTGGTGCG 
GGCTCTGGCG GGACGCGCAA TATCTCCGGC ACCACTGTCT ATCACAAAGA ACTCGAGAGC 
GAGCTTGCCG ATCTGCACGG CAAGGAAGCG GCGCTTTTGT TCACCTCCGC CTACATTGCC 
AACGATGCCA CGCTGTCGAC CCTGCCGAAA CTGCTGCCGG GTCTCATTAT CTATTCCGAC 
GCTTTGAACC ACGCGTCCAT GATCGAGGGT GTGCGCCGAA ATGGCGGGGC CAAGCGAGTC 
TTTCGCCATA ATGATGTCGC CCACCTGCGC GAACTCCTCG AGGCTGACGA TCCCGCCGCG 
CCCAAGCTCA TCGCATTTGA GAGCGTCTAC TCGATGGATG GCGACTTTGG CCCGATTGCG 
GAAATCTGCG ATCTCGCCGA TGAATTCAAC GCGCTGACCT ATATCGACGA AGTCCACGCC 
GTCGGCATGT ATGGCCCTCG CGGCGGTGGC GTCACAGAGC GTGACAACCT CGCCCATCGT 
ATCGACATCA TCAACGGCAC GCTCGCCAAG GCCTATGGCG TCATGGGCGG CTATATCGCC 
GCCTCTGCCA AGATGTGCGA TGCGATCCGG TCCTATGCGC CGGGCTTTAT CTTCACCACC 
TCGCTTGCGC CTTCGATTGC GGCCGGGGCC GCGGCCTCCG TGCGTCATCT CAAGACAGCG 
CAGGACCTGC GCGATAAGCA TCAGGAGCAG GCGCGCTATC TCAAAACCCG CCTCAAGATG 
ATGGGACTGC CCGTGATCGA TCACGGCAGC CACATCGTTC CGGTGATCGT TGGCGATCCG 
GTTCATACCA AGAAACTGTC GGATATGTTG CTCTCGGACT TTGGTATCTA TGTGCAGCCG 
ATCAACTTCC CGACCGTGCC GCGTGGTACA GAGCGCCTAC GATTCACGCC ATCGCCAGTG 
CATGGGCCCA GCGAAATGGA CCATTTGATC CGCGCAATGG ATAAGCTTTG GTCGCATTGT 
GCGCTGAATC GCGCCGAATT GGCCGGATAA

Protein sequence

MTVDYTAQLD AAIERLHEEG RYRTFIDIER RRGQFPHAVW TRPDGSEQDI TVWCGNDYLG 
MGQHPVVLKA MRDAIDATGA GSGGTRNISG TTVYHKELES ELADLHGKEA ALLFTSAYIA 
NDATLSTLPK LLPGLIIYSD ALNHASMIEG VRRNGGAKRV FRHNDVAHLR ELLEADDPAA 
PKLIAFESVY SMDGDFGPIA EICDLADEFN ALTYIDEVHA VGMYGPRGGG VTERDNLAHR 
IDIINGTLAK AYGVMGGYIA ASAKMCDAIR SYAPGFIFTT SLAPSIAAGA AASVRHLKTA 
QDLRDKHQEQ ARYLKTRLKM MGLPVIDHGS HIVPVIVGDP VHTKKLSDML LSDFGIYVQP 
INFPTVPRGT ERLRFTPSPV HGPSEMDHLI RAMDKLWSHC ALNRAELAG