Gene Smed_3872 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3872
Symbol
ID	5318871
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	329189
End bp	330229
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	61%
IMG OID	640775684
Product	peptidase C45 acyl-coenzyme A:6-aminopenicillanic acid acyl-transferase
Protein accession	YP_001312617
Protein GI	150376021
COG category	[R] General function prediction only
COG ID	[COG4927] Predicted choloylglycine hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCGGCGT TGCCACGCAA GCGGTTCCGT TCTTATACTC CTCGTGTCAT GTACAAGACA 
TTCGTCGCAG CGCGAGAGGA CCGGCCCGGA GAAGCTTGGC TCTCCAGGTT TGCGGCCGGG 
CGAGCCGAGG CGGAGAGGTG GTATTTCGGG CAGGCGCCAA TGGCGGCGAG CCCAAGTGCC 
AAGGAGTGTC GTGCCGCTTT GATGCAGCAC ATGCCTGAGC TCGTCCCTCA CTACGAAAGC 
GCCTGTGATC TCGTCGGAGA TGATGAGATC GCTCATCGGC TGCTCAGCCA CTACCGTCCC 
GCGCCGGAGC GCTATGGCTG CAGTCAGTCT GTCTGGCTCG GAAAGGAAGG CCCGGCGCTG 
ATCCGCAACT TCGACTACCC ACCGGATATC GTCTCTGACC GCTTCGAGAT GACCGATTGG 
TCTGGCGTGA AGGTGATCGC GAAGATGCAG CGGCCCTGGG GAGGTTGCGT GGACGGGCTG 
AATGAGGAGG GACTGGCCGC AAGCGTGACT CTCGGGGGTG GCCGCTCTCA GGGTCTCGGC 
TTCTCGATCA TTCTTGTGAT GCGCTATTTG CTTGAAAATT TTCGTGAGGT CGGCGAGGCG 
GTGAAGGCGC TTTGCCGAAT ACCCGTGGCG CTCGCACAGA ATGTCACGGT GCTGGATCGT 
GCTGGCAGCT ACGCAACGCT GTTTCTTGGT CCGGGGCAGC GGCCGGTCAT CACGCGCCTG 
AAGGCATGCA CGAACCATCA GCGGGGCGGA AGACCCTCAT CGTCTTCTTT GGCGCGACAG 
CAATTTGTTC TGCAAGCACT GGAAGACCCA TCGATGTCGC TCGAGAAGCT GACCGACCGC 
TTTCTCCAGC CGCCGCTCTA TTCCATGCGT CTTCCCCAAC CGACCCTGTA CACGGCTGTC 
TACCGACCTG CGGAAGGGCG GGTGGATTAC ATCTGGCCAG GGAACCACTG GTCGCAAGGT 
TTCGACGGCT TTGAGACAGG CGAGTACACC CATCGCTATG GATCATCGGG CGGCCCGCTG 
GCCGAAAGTC CGGCATCTTA G

Protein sequence

MSALPRKRFR SYTPRVMYKT FVAAREDRPG EAWLSRFAAG RAEAERWYFG QAPMAASPSA 
KECRAALMQH MPELVPHYES ACDLVGDDEI AHRLLSHYRP APERYGCSQS VWLGKEGPAL 
IRNFDYPPDI VSDRFEMTDW SGVKVIAKMQ RPWGGCVDGL NEEGLAASVT LGGGRSQGLG 
FSIILVMRYL LENFREVGEA VKALCRIPVA LAQNVTVLDR AGSYATLFLG PGQRPVITRL 
KACTNHQRGG RPSSSSLARQ QFVLQALEDP SMSLEKLTDR FLQPPLYSMR LPQPTLYTAV 
YRPAEGRVDY IWPGNHWSQG FDGFETGEYT HRYGSSGGPL AESPAS