Gene Smed_3966 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3966
Symbol
ID	5319064
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	416464
End bp	418182
Gene Length	1719 bp
Protein Length	572 aa
Translation table	11
GC content	63%
IMG OID	640775775
Product	metallophosphoesterase
Protein accession	YP_001312708
Protein GI	150376112
COG category	[R] General function prediction only
COG ID	[COG1409] Predicted phosphohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAAAC GTGCGCTGCC GGCAGTCGCC GTGATCGCCG ACGCGCATTT CCATGACCTC 
GAAGCAGATT TCGGCTTCGA CCGGGTGGAG GTGGAGGGCC GGAAAATCAC GATGCGCAGC 
TGGGCAGAGA CCCGGAAATC GACCCGCGTC TTCAACGAAA GCGCGGACGC GTTCCTGGCA 
GCGCTCGCGG AAGTGCGCCG GCGGGGCATT CGCCACGTCG TCCTGCTCGG GGATTACACG 
GATGATGGCC AGCGCGCCAC CACCGGCGCG CTCCGGAACA TTCTCGACGA GCATTCCGCC 
TTCGGCATGT CGTTCTATGC GCTCCCCGGC AATCACGACA TCTTCGGTCC GCAGGGCAGG 
CATCACACCA AGCAATTCCT CGACTGCGCA GGTCGGGGCA TTCTCGTCAC CAGCGACGTG 
AAGCGCGCCG GCAGCGGCGT TACGGTCAGT GATCGCATGT ATTGTGAAGG GTACCCGGCC 
GGCCTCGATC CGATGGCTGG CTTCGGCTAC TTCCGCAAGC CGGAATATCT CCATTGGGAG 
ACCCCGTTCG GTATGTCCGA TGCCGCGGAG GACCGCGAAT ACGAGGTTGC ATCGCCGGAC 
GGCAGGAACC GTTACAACAT GATGGACGCG TCCTACCTGG TCGAGCCCGA GCCCGGTCTA 
TGGCTGCTGA TGATCGACGC CAATGTCTTC GAGCCCGTGA ACGGGGTCTA TGAATGGGGC 
GACGAGGCGG CCTTCATCGA CAGCACCTCG GGCGGATGGA ACGCGATGCT CCGCTGTAAG 
CCTTTCGTCA TCCCGTGGAT TGCCGATGTC TGCGCACGGG CAGAAAGGCT CGGAAAAACA 
CTGCTCGCCT TTTCGCACTA TCCGGTGCTC GACTCTTTCG ACGGTGCGAC CGGCGCCGAG 
GGGGCGCTTT TCGGCGAGAC CAACATTGCC CGGCGCACAC CGCGAAGGGC AGTCGAACGC 
GCGCTGCTGG CGGCCGGACT GTCGCTCCAT TTCAGCGGGC ATCTTCATGT GGAAGGCGTC 
ACGCGCCGCG GCAGCGGCGA CCGATCACTG ACGAATGTCG CGGTCCCATC GCTCGTCGCC 
TTTCCGCCGG CCTTCAAAAT CGCCCATCCG GGAGAGGGGA ACGTTGCAGT CGAGACGGTG 
GAATTGTCGG GATTACCGGT CCATCCGCGG CTCCGGAACG CCTATGAGCG AGAGGCCGCC 
CTGCTTGGTG AAGAACCGGA CGACGCCTTC TCAGCCCCCA GCTACGGAGC ATTTCTCAGG 
GCGCACAAGC GGGCGCTGGT CAGCCACCGA TATTTCCCGG AGGAGTGGCC CCCGGCAATA 
GTCGAGCGGG TGGCGGACCT CACACTGGAA GAGATCGCGT GTCTCTTCAC TGGCGAGTCC 
GCCGGCAGCG CGCCAAAGCT CTCAGCTCTG GGGCAGGCTT CGGCAATCGA CATTGCCGAG 
CTCGGACGCC TGCCAATGAT AGAACTCGTC GCCGACTGGT ATTGTCTCCG GCAGGGGGCA 
TCGCTCGCTT TGGCGCATAT CGAAGAGTCG CGGCTGCCTC TCTATCGGTT TCTCGCCGAC 
CGGTTCGGAT GCGAGCCACA GACCTGCCAC GACAGTCCGG AGAAAGGCTT CGTCGCCATA 
TTCCTGGGAG CATTGGGTCT CTTTCTCGAA CGCGCGGGCA ATAGTCAGGC GCACATCGTC 
GTCCAGTCAA ATCCCGCCCG GCAAGACGCT TCGGCGTGA

Protein sequence

MLKRALPAVA VIADAHFHDL EADFGFDRVE VEGRKITMRS WAETRKSTRV FNESADAFLA 
ALAEVRRRGI RHVVLLGDYT DDGQRATTGA LRNILDEHSA FGMSFYALPG NHDIFGPQGR 
HHTKQFLDCA GRGILVTSDV KRAGSGVTVS DRMYCEGYPA GLDPMAGFGY FRKPEYLHWE 
TPFGMSDAAE DREYEVASPD GRNRYNMMDA SYLVEPEPGL WLLMIDANVF EPVNGVYEWG 
DEAAFIDSTS GGWNAMLRCK PFVIPWIADV CARAERLGKT LLAFSHYPVL DSFDGATGAE 
GALFGETNIA RRTPRRAVER ALLAAGLSLH FSGHLHVEGV TRRGSGDRSL TNVAVPSLVA 
FPPAFKIAHP GEGNVAVETV ELSGLPVHPR LRNAYEREAA LLGEEPDDAF SAPSYGAFLR 
AHKRALVSHR YFPEEWPPAI VERVADLTLE EIACLFTGES AGSAPKLSAL GQASAIDIAE 
LGRLPMIELV ADWYCLRQGA SLALAHIEES RLPLYRFLAD RFGCEPQTCH DSPEKGFVAI 
FLGALGLFLE RAGNSQAHIV VQSNPARQDA SA