Gene TM1040_1776 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1776
Symbol
ID	4076805
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	1869523
End bp	1870563
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	62%
IMG OID	638007091
Product	dihydroorotase
Protein accession	YP_613771
Protein GI	99081617
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0418] Dihydroorotase
TIGRFAM ID	[TIGR00856] dihydroorotase, homodimeric type

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.130496
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.212063
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAGA GCCTGACGAT CACCCGCCCC GACGACTGGC ATCTGCATCT GCGCGACGGC 
GACATGCTGC GCGCGGTGCT GCCGGAAACA GCCCGCCATT TTGGCCGCGC CATCATCATG 
CCCAATCTCG TGCCCCCGGT TGTCACCGGC GCCGAGGCCA GCGCCTATCG CGACCGCATT 
CTTGCCGCAC TCCCTGAGGG CATGACGTTC GAGCCCCTGA TGACGCTCTA TCTCACCGAG 
GACACGGACC CTGCAGATGT CGCAGCCGCC CATGCCTCGG GTCTGGTCAA AGCCGTCAAG 
CTCTACCCCG CTGGCGCCAC CACCAACTCC TCGTCCGGTG TGCGCGATTT CGACAAGGTC 
CGCCCCGTGC TTGAGAAAAT GGCCGAAATC GGCCTGCCGC TCTGCACCCA TGGCGAGGTC 
ACCGACCACG ACATCGACAT CTTTGACCGC GAGGCCGTCT TTATCGATCG CGTGCTGGAC 
CCGATCCGCC AATCCACACC GGGCCTGCGT GTGGTGATGG AGCATATCAC CACCAAGGAC 
GCGGCGGATT ATGTGCGATC GCAGGACAAG GATCTTGGCG CGACAATCAC CACGCACCAC 
CTGATCATCA ATCGCAACCA CATCCTCGTG GGCGGGATCA AGCCACACTA TTACTGCCTG 
CCTGTCGCCA AGCGCGAAGA GCACCGCCTC GCCCTGCGCC AAGCTGCGAC CTCCGGTGAT 
GCGCGGTTCT TCCTTGGTAC CGACTCAGCG CCCCACACCG ATGCCAACAA GCTCCAGACC 
TGTGGCTGCG CGGGTTGTTT CACGGCGACC AACACCATGG CTCTGCTGGC CCATGTATTT 
GAGGAAGAAG GCGCGCTCGA CAAGCTCGAA GGGTTTGCCT CCAAGAACGG CCCCGCCTTT 
TATCGCTTAC CCGAAAACGA TGGTCAGATC ACACTGGTGA AACAGGACGC GCCCGTCGCT 
TTCCCGGAAC AGATCGACAC GCCGGACGGC CCCGTGACCG TCTTTGATCC AAGCTTTGCG 
GTGCATTGGA CCGTCACCTG A

Protein sequence

MTQSLTITRP DDWHLHLRDG DMLRAVLPET ARHFGRAIIM PNLVPPVVTG AEASAYRDRI 
LAALPEGMTF EPLMTLYLTE DTDPADVAAA HASGLVKAVK LYPAGATTNS SSGVRDFDKV 
RPVLEKMAEI GLPLCTHGEV TDHDIDIFDR EAVFIDRVLD PIRQSTPGLR VVMEHITTKD 
AADYVRSQDK DLGATITTHH LIINRNHILV GGIKPHYYCL PVAKREEHRL ALRQAATSGD 
ARFFLGTDSA PHTDANKLQT CGCAGCFTAT NTMALLAHVF EEEGALDKLE GFASKNGPAF 
YRLPENDGQI TLVKQDAPVA FPEQIDTPDG PVTVFDPSFA VHWTVT