Gene Smed_3663 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3663
Symbol
ID	5318677
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	100349
End bp	102109
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	65%
IMG OID	640775476
Product	5-oxoprolinase (ATP-hydrolyzing)
Protein accession	YP_001312409
Protein GI	150375813
COG category	[E] Amino acid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0146] N-methylhydantoinase B/acetone carboxylase, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0156041
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCA TCGACCCCAT CACCCTGACC GTTATCCAAT CCGGCCTCCA GCAGGTCTGC 
GACGAGATGG ACATGACCTT CTCGCGAGCT GCATTCTCGC CGATCATCGC CGAGGCGGAC 
GACCGCTCCG ACGGCATCTA TTCCGCCGAG GATGGTTCGC TGATCGCCCA AGGCATCAAG 
GGGCTGCCGG TCTTCGTCGG AACGATGCAG GCATCGACCC GCACTCTTAT CGAGTTCATT 
CGCGACGGCC GCTGCCTGCC GCCGGAGGAG GATGACATCT ATGCGGTGAA CGACCCCTAT 
CTTGGCGGCA CGCACCTGAT GGACGTCCGC TTTGCCACGC CGTTCTATCG TAACGGGGAG 
ATTTTCTGCT GGCTCTCGAA CATCGGACAC TGGCCCGATA TCGGCGGCGC CGTGCCCGGC 
GGGTTTTCGG CATCCGCCAC CTCCGTGGAG CAGGAAGGAC TTCGTTTCCC GCCGATCAAG 
CTGTTCAAGC GCGGCGTTCT CGATCGCGAG CTTTTCTCGA TCATCAGCTC CAACATCCGC 
GTCGCAGAGC AGCGCATAGG CGATATCCGG GCTCAGGCGG CCGCCTTGCG GGTCGGCAAG 
GAGCAGTTCA CGGCCCTGCT CGACCGCTAT GGTGACGACA CGGTAGCGGC GGCCATTGCA 
GAATTGAGGC GCCGCTCGGC AGCGCAGATG CGCGCCTCCA TCCGCACCAT CGCGCCCGGA 
ACCTATCACG GCAAAGCCTT CATCGATTCC GATGGAGTGG TCAACGAACC GCTCACCATT 
GCCCTGTCTG TGACCAAGAC CGGCGACGAC CGGCTGGTCT TCGATTTCGC GGGGTCCAGT 
CCGCCCTGCC GCGGCCCGAT GAATTGCGTG CTGGCGACGA CCCACTCCTC GGTCTATCTC 
GCCATGCGGC ACATCTTTCC GGAGATCCCG CTCAGCGCCG GCGCTTTCGA GCCGCTGGAG 
ATCGTCAGCC CTGCTGGCAC GTTTCTTGAT GCGCAATATC CACGGCCGGT CTCAGGCTGT 
GCGGCGGAAG TGTCGCAGCG CATCGCCGAG GCGGTCTTTT CCGCCCTCGT ACAGGCACTG 
CCGGAGCGCG TGACCGCGGC TCCCGCCGGT TCCAGCGGCA ATTTCGCACT CGGCGGCAGC 
GATCCGCTGC TTGGCCGCGA CTACGTGATG TACCACATTT CCGGTGGCGG TTACGGCGGC 
AACGCCCGGG AAGACGGCCT GACCAACGGC TGCTCCACCA TCGGCATATC CAAGTCCGCC 
CCGGTCGAGA TCACCGAGCA GGTTTTTCCG GTGTTCTTCC GCGAATACGC GATCCACGAG 
GGCTCCGGCG GTGCGGGACG CAACCGGGGC GGCTTCGGCC TCAGCTACGA AGTGGAATTG 
CTGCGCGGCG ACGCCCAGGC ATCCTTCGTG ATGGATCACG GCGCCTTCGG ACCCCAGGGG 
GCCCTCGGCG GCGCGGATGG CGCAGTGGGC ACGATCACGG TCACGCGAGG TGGAAAAACC 
TATCGGCCGG AACATCTGTC GAAGGAACAG GACATAGCAC TGACCGCCGG GGACCGGGTC 
CGGGTGGAGA CCCCCGGTGG CGGCGGATAC GGCCTGGCCC ACGAACGGGA CGTCGAGGCC 
GTGCTCAAGG ACGTGTTCCT CGGCTATTAC TCGCTGCAGC AGGCAGAAAG CCTCTTCGGC 
GTCGTGATCG ATACGACAAG CGGCAAGCTT GACAGGGAAG CGACCGAAAA GTTGCGCCGC 
CGCCGCTCGA AAGGCGCCTG A

Protein sequence

MSTIDPITLT VIQSGLQQVC DEMDMTFSRA AFSPIIAEAD DRSDGIYSAE DGSLIAQGIK 
GLPVFVGTMQ ASTRTLIEFI RDGRCLPPEE DDIYAVNDPY LGGTHLMDVR FATPFYRNGE 
IFCWLSNIGH WPDIGGAVPG GFSASATSVE QEGLRFPPIK LFKRGVLDRE LFSIISSNIR 
VAEQRIGDIR AQAAALRVGK EQFTALLDRY GDDTVAAAIA ELRRRSAAQM RASIRTIAPG 
TYHGKAFIDS DGVVNEPLTI ALSVTKTGDD RLVFDFAGSS PPCRGPMNCV LATTHSSVYL 
AMRHIFPEIP LSAGAFEPLE IVSPAGTFLD AQYPRPVSGC AAEVSQRIAE AVFSALVQAL 
PERVTAAPAG SSGNFALGGS DPLLGRDYVM YHISGGGYGG NAREDGLTNG CSTIGISKSA 
PVEITEQVFP VFFREYAIHE GSGGAGRNRG GFGLSYEVEL LRGDAQASFV MDHGAFGPQG 
ALGGADGAVG TITVTRGGKT YRPEHLSKEQ DIALTAGDRV RVETPGGGGY GLAHERDVEA 
VLKDVFLGYY SLQQAESLFG VVIDTTSGKL DREATEKLRR RRSKGA