Gene Smed_1934 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1934
Symbol
ID	5322793
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	1986921
End bp	1988027
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	60%
IMG OID	640790872
Product	endonuclease/exonuclease/phosphatase
Protein accession	YP_001327603
Protein GI	150397136
COG category	[R] General function prediction only
COG ID	[COG2374] Predicted extracellular nuclease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCTTC GCCTCGCCAC CTTCAACATC GAGAATCTCA TGAGTCGGTT CGATTTTTCC 
GGCTTCCGCA ATCATCTCAA ACAGGACCGG GTCTTGCGCC TCTTCGACGT TCGCAGCGAG 
GCGGAGTATC AGCGTCTGGA AGAGGCGCGT ACGATCGCGC ATACCGATGA TGTCCGGCAG 
ATGTCGGCAT TGGCGATCGC CGATTGCGAT GCGGACATTC TTTGCCTGCA GGAGGCAGAC 
AACATGGCGG CGCTGCAGGC CTTCGAATAC GGCTATCTGT TCCGCATGGT CGGCAATGGC 
TACCGCCAGA AATACCTGGT CGAGGGCAAT GATACCCGGG GAATCGATGT CGCCGTAATG 
ATGCGGGAGG AGACCCGGGA CGGCCAGAAG ATCGAGTGCC TGGAGGTCAA GAGCCATGCA 
GCGCTCACCT ATGAGGACCT CGATCTCTTC AACGATGAAC TGGCGCTGAC GAACCGGCCA 
CGCGACCGGA TATTCAAACG CGACTGCCTC GAAGTGGATG TGCGAATCGG CGGTCGACCG 
CTGACCCTTT ATGTGGTGCA TCTCAAGTCC ATGGGACCAG CGCGCGAAGG CCTGGACGGC 
CGGCAGGCGA CCATGGCCGT GCGCCGCGCG GAGGTGAAAG CAGTGCGTCA CATCATCGAA 
GGCCGTTTCG GCAGCGGAGA TACGGCCGAC AAAATTTTCG CCGTTTGTGG CGACATGAAT 
GATTATCAGG AAAAGGTGAA TGTGCTCGGC GATCGGCGCA ACGGCTACGA GTTCGTTCCG 
TATGAAGAGA CGTCGAGCGC CCTCGATGTC CTCAGTCACG ACGGCTTCGT CGTAAACCCG 
ATGCTGCGGC GCCCGGTCCT AGACCGATGG ACGCTTTTCC ATAGCAGGGG GCCGGAGGAA 
CGGCATCTCT GCCAGCTCGA TTATATCTGG CTGTCACAGG AACTGGCGCG CCGCAATGCG 
GCCCGGGTGC CAGAGGTCAT TCGCGCCGGC CAGCCTTACC GCACGATCTT TCCCGCAGGC 
CAGGAGGTCG AACGCTATCC GCGTACCGGC TGGGACCGGC CCAAAGCCTC CGACCATTGC 
CCGGTCGTGA TGACGCTGGA CATTTGA

Protein sequence

MSLRLATFNI ENLMSRFDFS GFRNHLKQDR VLRLFDVRSE AEYQRLEEAR TIAHTDDVRQ 
MSALAIADCD ADILCLQEAD NMAALQAFEY GYLFRMVGNG YRQKYLVEGN DTRGIDVAVM 
MREETRDGQK IECLEVKSHA ALTYEDLDLF NDELALTNRP RDRIFKRDCL EVDVRIGGRP 
LTLYVVHLKS MGPAREGLDG RQATMAVRRA EVKAVRHIIE GRFGSGDTAD KIFAVCGDMN 
DYQEKVNVLG DRRNGYEFVP YEETSSALDV LSHDGFVVNP MLRRPVLDRW TLFHSRGPEE 
RHLCQLDYIW LSQELARRNA ARVPEVIRAG QPYRTIFPAG QEVERYPRTG WDRPKASDHC 
PVVMTLDI