Gene TM1040_1351 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1351
Symbol
ID	4076368
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	1441498
End bp	1442535
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	59%
IMG OID	638006661
Product	delta-aminolevulinic acid dehydratase
Protein accession	YP_613346
Protein GI	99081192
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0113] Delta-aminolevulinic acid dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACCCA TGTGCACCGG AACAGAATAC GAGACCGAGA TGCCCCATAT CAGCGCTTCC 
TTTCCTGCCT CCCGCCCCCG TCGCCTGCGT GCCTCTGCCG CTTTGCGCGA CCTCACGCGG 
GAGAACGAAC TCTCGGTGAA TGACCTGATC TGGCCGGTTT TTGTACGCGA TGGGGAGGGG 
ATCGAGGAGC CGGTTCCCTC GATGCCAGGC GTGGTGCGGC GCTCTGTCGA CAAGGTGGTT 
GAGGCCGCCG TCGAAGCGCA GGCACTCGGA ATTCCGGCGA TCTGCCTCTT TCCCTACACG 
GATCCGTCTT TGAAAACAGA GGATTGTGCC GAGGCTTGGA ACCCGGAGAA CCTCTGCAAT 
CGGGCCATCC GTGGGATCAA GGCCGCGGCG CCCGATCTCG CCGTGATGAC CGATGTCGCG 
CTAGATCCCT ATAATATCAA CGGCCACGAC GGCTTTGTGA TTGATGGCGA AATTCGCAAC 
GACGAAACCG TCGAGGCGCT GGTCAAGATG ACCCTCGCAC AGGCCGAGGC CGGGGCGGAT 
ATCATCGGCC CCTCTGACAT GATGGACGGG CGCATCGGAG CCATGCGGTC TGCATTGGAA 
AGGAAGGGAT TTCAGAATGT TACGATCCTG TCCTACTCTG CAAAATACGC GTCTGGATTT 
TATGGACCGT TTCGTGATGC GGTCGGCGCC TCGGGGGCCC TGACCGGCGA CAAGAAGACC 
TATCAGATGG ACCCCGCCAA CACCAATGAA GCCCTTCGCA TGATTGAACG CGATCTGCGC 
GAGGGGGCGG ATATGGTGAT GGTGAAACCC GGATTGCCCT ATCTCGACAT CTGCCACCGC 
GTGAAAGAGA CCTTCCAGGT CCCGACCTTT GCCTACCAGG TGTCAGGAGA ATACGCGATG 
ATCCAAGCGG CGGCTCTGAA TGGTTGGATC GATGGGGAAA AAGTTATGCT AGAAAGCCTC 
ATGGCCTTCC GTCGGGCTGG ATGTGATGGT GTGCTTACCT ATTTTGCGCC ACAGGTCGCG 
AAACTGTTGA ACGGCTAA

Protein sequence

MQPMCTGTEY ETEMPHISAS FPASRPRRLR ASAALRDLTR ENELSVNDLI WPVFVRDGEG 
IEEPVPSMPG VVRRSVDKVV EAAVEAQALG IPAICLFPYT DPSLKTEDCA EAWNPENLCN 
RAIRGIKAAA PDLAVMTDVA LDPYNINGHD GFVIDGEIRN DETVEALVKM TLAQAEAGAD 
IIGPSDMMDG RIGAMRSALE RKGFQNVTIL SYSAKYASGF YGPFRDAVGA SGALTGDKKT 
YQMDPANTNE ALRMIERDLR EGADMVMVKP GLPYLDICHR VKETFQVPTF AYQVSGEYAM 
IQAAALNGWI DGEKVMLESL MAFRRAGCDG VLTYFAPQVA KLLNG