Gene Amir_2099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_2099
Symbol
ID	8326288
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	2320465
End bp	2321856
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	71%
IMG OID	644942649
Product	phenylhydantoinase
Protein accession	YP_003099890
Protein GI	256376230
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR02033] D-hydantoinase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0317322
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGGACGT TGATCAGCGG CGGTCTGGTG GTCAACGCGG CCGGGTCGGC GCGCGCGGAC 
GTGCTGGTGG AGGGCGAGAA GGTCGCGGCG CTGCTGGCTC CGGGGCTGGA ACCGGCGCTG 
GACGTGGACG AGCGGGTCGA CGCGACCGGG AAGTACGTGA TCCCCGGCGG GATCGACGCG 
CACACCCACA TGGAGATGCC GTTCGGCGGG ACGCAGTCCA GCGACGACTT CACCAGCGGC 
ACGATCGCGG CGGCGTGGGG CGGGACGACC ACGATCATCG ACTTCGCCGT GCAGGCCAAG 
GGGACCTCGC TGCTGGCCAC CCTGGACAGG TGGCACGCCA AGGCGGACGG CAAGTGCGCG 
GTGGACTACG GGTTCCACAT GATCGTGTCC GATGTGGACG ACTCCTCGCT CAAGGAGATG 
GGCGCCTGCC TCGACGCGGG CGTGAACTCG TTCAAGATGT TCATGGCCTA CCCCGGCGTC 
TTCTACGCCA CCGACGGGGA GATCCTGCGC GCGATGCAGC GGGCGCGCGA GATCGGCGGC 
ACGGTCATGA TGCACGCCGA GAACGGCATC GCGATCGACG AGCTGGTCGC GCAGGCGCTC 
GCGGAGGGCC GCACCGACCC GGTGCAGCAC GGGCTCACCC GGCCGCCGGA GCTGGAGGGC 
GAGGCGACCT CGCGGGCCAT CGCGCTGGCC AGGGTCACCG GGGCGCCGCT GTACGTCGTG 
CACCTGTCGG CGGCGCAGGC GCTCGACGCG GTCACCGAGG CGCGGGACAC CGGGCAGAAC 
GTGTTCGCCG AGACCTGCCC GCAGTACCTC TACCTGTCGC TGGAGGACAT GGCGCGCCCC 
GGTTTCGAGG GCGCGAAGTA CGTGGCCTCC CCACCGCTGC GGCCGGTCGA GCACCAGGCG 
CGGTTGTGGC GGGGGCTGCG CACCAACGAC CTGTCGGTGG TGTCGACCGA CCACTGCCCG 
TTCTGCTTCG CCGACCAGAA GGTGCTGGGG CAGGGCGACT TCTCCAAGAT CCCCAACGGG 
ATGCCGGGCG TGGAGCACCG GATCGACCTG CTGCACCAGG GGGTCGTGCG CGGCGAGATC 
GGGCTGGAGC GGTGGGTGGA GATCTGCTCG ACCACCCCGG CCCGGATGTT CGGGCTGCAC 
CCGCGCAAGG GCGTCGTCGC GCCGGGGGCC GACGCGGACC TCGTCGTGTA CGACCCCGCC 
GCGCGGCAGA CCATCTCGGC GGCCACGCAC CACATGAACG TGGACTACTC GGCGTTCGAG 
GGGTTCGAGC TGACCGGGCG GGTCGAGGTG GTGCTCTCGC GCGGGCGGGT CGTGGTGGAC 
CGGAGCGGGT TCCGGGGGTC GGCCGGGCAC GGGCGGTTCC TGGCCCGCGA GCTGAACCAG 
TACCTGGTGT GA

Protein sequence

MRTLISGGLV VNAAGSARAD VLVEGEKVAA LLAPGLEPAL DVDERVDATG KYVIPGGIDA 
HTHMEMPFGG TQSSDDFTSG TIAAAWGGTT TIIDFAVQAK GTSLLATLDR WHAKADGKCA 
VDYGFHMIVS DVDDSSLKEM GACLDAGVNS FKMFMAYPGV FYATDGEILR AMQRAREIGG 
TVMMHAENGI AIDELVAQAL AEGRTDPVQH GLTRPPELEG EATSRAIALA RVTGAPLYVV 
HLSAAQALDA VTEARDTGQN VFAETCPQYL YLSLEDMARP GFEGAKYVAS PPLRPVEHQA 
RLWRGLRTND LSVVSTDHCP FCFADQKVLG QGDFSKIPNG MPGVEHRIDL LHQGVVRGEI 
GLERWVEICS TTPARMFGLH PRKGVVAPGA DADLVVYDPA ARQTISAATH HMNVDYSAFE 
GFELTGRVEV VLSRGRVVVD RSGFRGSAGH GRFLARELNQ YLV