Gene Smed_0684 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0684
Symbol
ID	5321521
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	735437
End bp	736435
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	63%
IMG OID	640789621
Product	glycerophosphoryl diester phosphodiesterase
Protein accession	YP_001326375
Protein GI	150395908
COG category	[C] Energy production and conversion
COG ID	[COG0584] Glycerophosphoryl diester phosphodiesterase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.35489
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGA TCGCCGCGGT TGCGCTCGTC GTCGTCGCCA TCCTATGGCT TCTCAACACG 
TCGCTTCTGG CGACGCCGCC CTCCGGCGGC GCAAAGATCC TCGCTCATCG CGGCGTTCAT 
CAGGTCTTCA ATTCGGAAGG TCTCGACAAT GAAACCTGCA CCGCCGAGCG CATCGAGGCG 
CCGCGCCACA GCTATCTCGA AAACACCATT GCTTCCATGC GCGCCGCAAT GGAGAGCGGC 
GCCGACGTCG TCGAGCTGGA TGTCCACCTG ACACCGGATC GCCAGTTCGC CGTGTTTCAC 
GATTGGACAC TCGATTGCCG GACGAATGGG AGAGGCGTGA CCCAGGATAC GCCGATGTCC 
GAACTGAAGA CGCTGGACAT CGGCTACGGT TATACGGCCG ATGGCGGCAA GTCCTTCCCC 
TTCCGCGGCC AGGGAGCTGG CCAGATGCCG ACGCTGACAG AGGTCTTCAA GGCCCTGCCC 
GAGGGCCGCT TTCTGATCAA TTTCAAGAGC GAGCGGCGGG AGGAAGGCGC GACCCTCGCC 
GTTCTTTTGC GTTTCCACCC GGAGTGGCGC AAACAGGTGT TCGGCGTCTA TGGCGGCACT 
GCCCCCACAC AGGAAACCCT GAGGCTGGTC CCAGGCATCA GGGGATACGA CCGACAATCC 
ACACTCGCCT GCCTTGGCCG CTATGCCGCC TATGGCTGGA CGGGTATCGT ACCGGAAGCC 
TGCCGCGACA CGCTGATCAT AGTGCCCGGC AATTATGCGC CATTCCTGTG GGGGTGGCCG 
GACCGGTTCG CGGCCCGTAT GCAAGCCGCC GGCAGCGAAA TCATCCTGCT GGGGCCCTAT 
AAAGGCGGCG ACTTCACCAC GGGCATCGAC AGCGCGGATG ATCTCGCTTT CGTTCCCGAA 
GGTTTTTCCG GCTATGTCTG GACCAACAGG GCGGAAACGA TCGCACCTCT CTTCGGCAGG 
CGATCCGGAG CCGGGAGCGA CCAGGCCAAC CGCCAGTGA

Protein sequence

MKKIAAVALV VVAILWLLNT SLLATPPSGG AKILAHRGVH QVFNSEGLDN ETCTAERIEA 
PRHSYLENTI ASMRAAMESG ADVVELDVHL TPDRQFAVFH DWTLDCRTNG RGVTQDTPMS 
ELKTLDIGYG YTADGGKSFP FRGQGAGQMP TLTEVFKALP EGRFLINFKS ERREEGATLA 
VLLRFHPEWR KQVFGVYGGT APTQETLRLV PGIRGYDRQS TLACLGRYAA YGWTGIVPEA 
CRDTLIIVPG NYAPFLWGWP DRFAARMQAA GSEIILLGPY KGGDFTTGID SADDLAFVPE 
GFSGYVWTNR AETIAPLFGR RSGAGSDQAN RQ