Gene TM1040_1500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1500
Symbol
ID	4077056
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1606078
End bp	1607382
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	59%
IMG OID	638006813
Product	dihydropyrimidine dehydrogenase
Protein accession	YP_613495
Protein GI	99081341
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01037] dihydroorotate dehydrogenase (subfamily 1) family protein

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.190066
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGATC TTACAACAGA ATTCCTCGGT ATCAAATCGC CGAATCCTTT CTGGCTGGCC 
TCCGCGCCGC CCACCGACAA AGAATATAAC GTGCGCCGCG CCTTTGAGGC GGGCTGGGGC 
GGTGTGGTCT GGAAGACCCT CGGCGCCGAA GGGCCACCGG TTGTCAACGT GAACGGGCCG 
CGGTATGGCG CGATCTGGGG GGCGGACCGC CGTCTTCTGG GGCTCAACAA CATCGAACTG 
ATCACGGATC GCCCGCTGGA TGTGAACCTC GAGGAGATGA CCCGCGTCAA AAAGGACTAC 
CCGGATCGCG CGCTGATTGC GTCGATCATG GTGCCCTGTG AAGAGGCGGC TTGGAAAGCG 
ATCCTGCCGC GTGTGGCGGA AACAGGATGT GACGGGATCG AGCTCAACTT TGGCTGCCCG 
CATGGGATGG CCGAGCGCGG CATGGGTTCT GCTGTGGGGC AGGTTCCGGA ATACATTCAG 
ATGGTCACCG AATGGTGCAA ACAGTATTAT GACAAGCCGG TGATCGTGAA GCTCACGCCC 
AATATCACCG ACATTCGTCA TCCGGCGCGG GCCGCGAAGG CCGGCAATGC CGATGCTGTG 
TCTCTGATCA ACACCATCAA TTCGATCACC TCGGTCAACC TTGATGCAAT GTCGCCCGAA 
CCGATGATTG GCGGCAAGGG CACCCATGGC GGCTATTGCG GCCCGGCGGT GAAACCGATC 
GCCATGAATA TGGTGGCCGA AATTTCCCGC GATCCGCAAA CCGCAGGTCT GCCTATTTCC 
GCCATTGGCG GCGTGACAAC ATGGCGCGAT GCGGCGGAGT TCATCGCTCT TGGGGCTGGC 
AATGTGCAGG TTTGCACGGC GGCCATGACC TATGGGTTCA AGGTCGTTGA AGAGATGATT 
TCGGGCCTGT CGGATTGGAT GGACGAGAAG GGCTATTCCT CGATCGAGGA CTTCCGTGGC 
ATGGCGGTTC CGAATGTGAC CGACTGGCAG TATCTGGACC TCAACTATGT GACCAAGGCC 
AAGATCTCTC AGGATGACTG CATCAAATGC GGACGTTGCT ATGCGGCCTG CGAGGATACC 
TCGCATCAGG CGATTGAGAT GTCGGCGGAT CGGACCTTTA CCGTGAAGGA CGACGAATGC 
GTGGCGTGTA ACCTGTGCGT CAACGTCTGT CCGGTTGAAG GCTGTATCAC CATGGAAGAG 
GTTGCCGTGG GCGCCATTGA TGAACGCACC GGCAAGGTGG TGAGCGGCGA ATATGGCAAC 
TGGACCCAGC ACCCTAATAA TCCGTCTGCA ACGGCTGCGG AATAA

Protein sequence

MADLTTEFLG IKSPNPFWLA SAPPTDKEYN VRRAFEAGWG GVVWKTLGAE GPPVVNVNGP 
RYGAIWGADR RLLGLNNIEL ITDRPLDVNL EEMTRVKKDY PDRALIASIM VPCEEAAWKA 
ILPRVAETGC DGIELNFGCP HGMAERGMGS AVGQVPEYIQ MVTEWCKQYY DKPVIVKLTP 
NITDIRHPAR AAKAGNADAV SLINTINSIT SVNLDAMSPE PMIGGKGTHG GYCGPAVKPI 
AMNMVAEISR DPQTAGLPIS AIGGVTTWRD AAEFIALGAG NVQVCTAAMT YGFKVVEEMI 
SGLSDWMDEK GYSSIEDFRG MAVPNVTDWQ YLDLNYVTKA KISQDDCIKC GRCYAACEDT 
SHQAIEMSAD RTFTVKDDEC VACNLCVNVC PVEGCITMEE VAVGAIDERT GKVVSGEYGN 
WTQHPNNPSA TAAE