Gene TM1040_1497 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1497
Symbol
ID	4077053
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1602053
End bp	1603507
Gene Length	1455 bp
Protein Length	484 aa
Translation table	11
GC content	60%
IMG OID	638006810
Product	phenylhydantoinase
Protein accession	YP_613492
Protein GI	99081338
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR02033] D-hydantoinase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.204674
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACAG TCATCAAGAA CGGCACCATT GTGACCGCGG ATCTAACCTA TAAGGCGGAT 
GTCCTGATCG AGGGCGGCGT CATCACCGAA ATCGGCCCGG ATCTGAAGGG CGATGAGGTG 
CTGGATGCCA GCGGTTGCTA TGTCATGCCT GGCGGGATTG ATCCGCATAC CCATCTGGAG 
ATGCCGTTCA TGGGCACCTA TTCTTCGGAT GATTTTGAAA GTGGCACCCG TGCCGGGCTT 
GCGGGCGGGA CCACCATGGT GGTCGATTTT GCGCTTCCGC AGCCGGGTGA GAGCCTGCTC 
GATGCGCTCA AGCGCTGGGA CAACAAGTCG ACTCGCGCCA ATTGTGACTA TTCCTTCCAT 
ATGGCGGTGA CCTGGTGGGG CGAGCAGGTC TTTGATGAGA TGAAGACCGT CATCGAGACC 
CGGGGCATCA ACACCTTCAA GCATTTCATG GCCTACAAGG GCGCCTTGAT GGTGAATGAT 
GATGAGCTTT ATGCGTCATT TCAGCGTCTT GCGGAGTTGG GTGGCATCGC CATGGTGCAT 
GCCGAGAACG GCGATGTGGT GGCGGAGTTG AGTGCCAAGC TTTTGGCCGA GGGCAATACC 
GGCCCCGAAG CGCATGCTTA TTCGCGCCCG CCGCAGGTGG AAGGCGAAGC CACCAACCGG 
GCGGTCATGA TTGCGGATAT GGCCGGTGTG CCGCTCTATG TGGTGCACAC CTCCTGTGAA 
GAGAGCCACG AGGCCATTCG TCGGGCGCGC ATGCTTGGCA AGCGGGTCTG GGGCGAGCCG 
CTCATCCAGC ATCTGACACT GGATGAGAGC GAGTATTTCA ACCCCGATTG GGATCACGCT 
GCGCGGCGCG TGATGTCGCC ACCGTTTCGC AACAAACAGC ATCAGGACAG CCTCTGGGCG 
GGGCTTCAGT CCGGGTCCCT GTCGGTGGTC GCGACCGATC ACTGCGCGTT CTCGACCGAG 
CAGAAAAGAT ACGGCGTGGG CGATTTCACC AAGATCCCCA ACGGCACGGG CGGGCTTGAG 
GACCGGATGC CGATGCTCTG GACGCATGGT GTCGAAACTG GCCGCCTGAC GCCCAATGAG 
TTTGTCGCGG TGACCTCGAC CAATATTGCC AAGATCCTGA ACTGCTATCC CAAGAAGGGG 
GCTGTGCTTG TGGGGGCGGA TGCAGATCTG GTGGTCTGGG ATCCCAAGAA AACCAAGACG 
ATCTCTGCCG AGAGCCAGCA ATCTGCCATT GATTACAACG TGTTCGAGGG CAAAGAGGTG 
AAGGGCCTGC CGCGCTACAC CCTGACCCGT GGACAGGTCG CCGTGATGGA CGGTGAGATC 
AAGACCCAGG AAGGTCACGG CAAATTTGTG GAGCGCGCGC CCAACACCGT GGTGAACAAG 
GCGCTCAGCA CCTGGAAAGA GCTGACCGCG CCGCGCCCGG TTGAGCGCAG CGGCATTCCC 
GCCACTGGCG TCTAA

Protein sequence

MTTVIKNGTI VTADLTYKAD VLIEGGVITE IGPDLKGDEV LDASGCYVMP GGIDPHTHLE 
MPFMGTYSSD DFESGTRAGL AGGTTMVVDF ALPQPGESLL DALKRWDNKS TRANCDYSFH 
MAVTWWGEQV FDEMKTVIET RGINTFKHFM AYKGALMVND DELYASFQRL AELGGIAMVH 
AENGDVVAEL SAKLLAEGNT GPEAHAYSRP PQVEGEATNR AVMIADMAGV PLYVVHTSCE 
ESHEAIRRAR MLGKRVWGEP LIQHLTLDES EYFNPDWDHA ARRVMSPPFR NKQHQDSLWA 
GLQSGSLSVV ATDHCAFSTE QKRYGVGDFT KIPNGTGGLE DRMPMLWTHG VETGRLTPNE 
FVAVTSTNIA KILNCYPKKG AVLVGADADL VVWDPKKTKT ISAESQQSAI DYNVFEGKEV 
KGLPRYTLTR GQVAVMDGEI KTQEGHGKFV ERAPNTVVNK ALSTWKELTA PRPVERSGIP 
ATGV