Gene Amir_5937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_5937
Symbol
ID	8330144
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	6982131
End bp	6983840
Gene Length	1710 bp
Protein Length	569 aa
Translation table	11
GC content	77%
IMG OID	644946368
Product	allantoinase
Protein accession	YP_003103591
Protein GI	256379931
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type [TIGR03178] allantoinase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGCCACT TCGGCCGCGC CGCCCTCGGC CCGCGCGCGA ACCACACCAC CGGCTCGCCC 
GACACCCCCG GAAGGTCGTA CCGGCCGCGT TCGCCCGACG CCGTTCCGGA AGCCCGAACC 
CCGCCTGCCG CCAACCGGGA GACCGCCGCC CCGCAGCCCT CGCCCGCGCT TCGCGCGGCC 
GGCACCCTGA CCCGCATGGA CCTGGTCTTC CGCGCGAAGC GCGTGATCAC GCCGGACGGC 
GAGATCGGCG CCGACGTCGG CGTGGCGGAC GGCCGCATCA CCGTCGTCGT CCCGCACCCG 
GACCCGACCG GCCCCGGCCG CGCAGGCACC GACCCGCTGC CCACCGGACC GTTCCGCACC 
AGCCAGTTCG GCGCCGGACC GTTCGGCGCC GGACCGTTCG ACGCCGGCGC AGCCCCCACC 
GGACCGCTTC CGGGGCTCGC CGCCACCGGC CCGTTCCCCG CCGACCCGGC CGCCACCCCG 
GCCGCCGACC TCATCCGCGA AGCCCTCCGC GCAGGCGCCG AGCTGGTCGA GCTGCCCGAC 
GACGAGGTCC TCATCCCCGG CCTGGTCGAC ACCCACGTCC ACGTCAACGA CCCCGGTCGC 
GCCGACTGGG AGGGCTTCCC CACCGCCACG CTCGCCGCCG CCGCGGGCGG GGTCACCTCG 
ATCGTCGACA TGCCCCTCAA CAGCCTCCCC CCGACCACCA CCCCCGCCGC GCTCGACGCC 
AAGCTCGACG CCGCGCGCGG GCGCGTGCAC GTCGACGTCG GCTTCTGGGG CGGTCTCCTG 
CCCGGCAACG GCGACCAGCT CGCCGCGCTC GTCGACCGGG GCGTCTTCGG GTTCAAGTGC 
TTCCTCGCGC ACTCCGGCGT CGACGAGTTC CCGCACGTCG ACGTCCCCCG GCTGCGCGCC 
GCCCTCACCC GCCTCCCACC CGACCTGCCG GTGATCGTCC ACGCCGAGGA CCCCGCCCAC 
CTCGCCGAGC CCGCGAGCGG CGACTACCCG GGTTTCCTCG CCTCCCGCCC GCACGCCGCC 
GAGCAGCGCG CCGTCGCCGA CGTCATCGCC GCCGCCCGCG ACACCGGCCA CCGCCTGCAC 
GTCCTGCACG TCTCCAGCGC CCGCGCCGCC GCCGACCTCG CGGCGGCCAA GCGCGACGGC 
GTCCCCGTCA CCGCCGAGAC CTGCCCGCAC TACCTCACCT TCACCGCCGA GGAGATCCCC 
GAGGGCGCCA CCGCGTTCAA GTGCTGCCCC CCGATCCGCG AGGCCGCCAA CCGCGAGCTG 
CTCTGGGCGG CCCTGCGCGA CGGCGCGCTC GACCTCGTCG TCAGCGACCA CTCGCCGTGC 
ACCCCCGACC TCAAGCGCGG CGACTTCGCC ACCGCCTGGG GCGGCGTCGC GAGCCTCCAG 
CTGGGCCTCC CGGCCGTGTG GACGCAGGCC CGCCGCCGGG GCTTCGCGCT CACCGACGTG 
GTCCGCTGGA TGTCCACGGC CCCCGCCGAC CTCACCGGTC TGCGGCACAA GGGCCGCATC 
GCGCCCGGCG CGGACGCCGA CCTGTGCGCG TTCGCCCCCG ACGCCGCCTT CGTCGTGGAC 
CGCGCCCACC TGCGCCACCG CAACCCGGTC ACCGCCTACC ACGGCCTGCC GCTGGCGGGC 
GAGGTGCGGC GGACCTGGTT GCGCGGACGC CGGATCACCG GGGACGCGCC GTCCGGGCGG 
TTCCTGACCC GAGGCGGAGG AGCGGCATGA

Protein sequence

MRHFGRAALG PRANHTTGSP DTPGRSYRPR SPDAVPEART PPAANRETAA PQPSPALRAA 
GTLTRMDLVF RAKRVITPDG EIGADVGVAD GRITVVVPHP DPTGPGRAGT DPLPTGPFRT 
SQFGAGPFGA GPFDAGAAPT GPLPGLAATG PFPADPAATP AADLIREALR AGAELVELPD 
DEVLIPGLVD THVHVNDPGR ADWEGFPTAT LAAAAGGVTS IVDMPLNSLP PTTTPAALDA 
KLDAARGRVH VDVGFWGGLL PGNGDQLAAL VDRGVFGFKC FLAHSGVDEF PHVDVPRLRA 
ALTRLPPDLP VIVHAEDPAH LAEPASGDYP GFLASRPHAA EQRAVADVIA AARDTGHRLH 
VLHVSSARAA ADLAAAKRDG VPVTAETCPH YLTFTAEEIP EGATAFKCCP PIREAANREL 
LWAALRDGAL DLVVSDHSPC TPDLKRGDFA TAWGGVASLQ LGLPAVWTQA RRRGFALTDV 
VRWMSTAPAD LTGLRHKGRI APGADADLCA FAPDAAFVVD RAHLRHRNPV TAYHGLPLAG 
EVRRTWLRGR RITGDAPSGR FLTRGGGAA