Gene Smed_3647 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3647
Symbol
ID	5318394
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	84241
End bp	85770
Gene Length	1530 bp
Protein Length	509 aa
Translation table	11
GC content	59%
IMG OID	640775460
Product	4-phytase
Protein accession	YP_001312393
Protein GI	150375797
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.770065
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTCTGG CTGCTCTTGC ATTTGCAGGG ACTGCCGGAG CGCAGACTCC GCCCGACGTC 
CTCGTCGTCG GCCAGATTGC CGAGCCGCAG TCTCTGGACC CGCATACAGT GACCGCGACG 
AATGATTTCC GAATTCTGGT CAACGTCTAT GACGGCTTGG TCCGGTTCAA AGACGGCACA 
TTGGAAGTCG AGCCGGCGCT TGCCGAAAGC TGGGAAATCT CCGAGGACGG GAAGACTTAC 
ACGTTCAAGC TCAGGCAAGG CGTGAAATTC CACGACGGTT CCGATTTCAA TGCAGAGGCG 
GTGAAGTTCA ATTTCGATCG CATGTTGAAG AAGGACCATC CGTTCTACGG CACCGGTCCA 
TTTCCGCTTT CCTTCAACTT TTCCTCGGTG GATTCGGTCA ATGTCCTCGA CGAGCACACG 
GTCGAGTTCA AGCTGAGCGA AGCATTCGCG CCGTTCCTCT CAAACCTCGC CTATCCCACG 
GGCCTGATCG TCTCTCCGGC CGCGGTCTCC GAACATGGCA AGGAATATGG CCGCAGCCCA 
TCGGGCACCG GCGCGTTCAA GTTCGTGGAA TGGCTGTCGA ACCAGCGTGT GGTGGTCGAG 
CGCAATCCGG ACTATTGGGA CGGTGCCGCA AAGCTTCAGG CGGTCGTCTT CCGACCGATC 
ACCGACGCCA ACACGCGAGT CGCCGAGATG ATGGCCGGCG GTATCGACGT CATGGTGGAG 
GTGCCGCCGG ACAATCTCGC AACCTTTAGG CAGGACGCCA ATTTCGCCGT TGCAGAGCAG 
GCAGGGCCGC ATGTCTGGTT CGCTATCCTG AATACCAAGG AAGGACCTTT TGCCGATAAG 
CGCGTGCGCC AGGCTGCAAA TTATGCGGTG AACAAGGAAA CGCTAGCCAA CGACGTGCTG 
CAGGGGACGG CGACAGTGGC AGCCGGTCCG ATCCCTCCGG CCTTCAATTG GGTGGAAAGC 
TCGGTAAAGC CCTATGCTTA TGATCCCGAA CAGGCCAAGA GCCTGCTCGC CGAGGCAGGG 
GTCGAAAATC CGCAAGTGAC GTTCTATGTC ACGGAGGGAG GTTCCGGCAT GCTCGACCCG 
ATTACCATGG GCGCCGCGAT CCAGGCCGAT CTCCAGGCCG TCGGCTTCAA GGTCAAGATC 
GAGACGTATG AGTGGAATAC GTTCCTCGGG CGCGTCAACC CCGGCCTTCA AGGCAAAGCG 
GATATGGCCG AGATGGCGTG GATGACGAAT GATCCAGATA CCGTCCCCTA TCTGACGTTG 
CGCACTGACG CGATGCCGGA CAAGGGAGGG TTCAACTCCG GCTATTATTC CAATCCGAAG 
CTCGATGAGC TCCTGGAAAA GGCGCGCAAA TCCACGGATC AGGCCGAGCG CGGCAAGCTC 
TACGGCGAGG TTCAGTCGAT CGTTCATGAC GACGCGCCGT GGCTTTTCGT CGCTAACTGG 
AAGCAGAATG CGGTGACAAC CGCCGCGGTG AAGGGCTTCG AATTGCAGCC CTCCTTCCTG 
CTCGATCTCC ATGGCGTGAC AAAAGAGTAG

Protein sequence

MVLAALAFAG TAGAQTPPDV LVVGQIAEPQ SLDPHTVTAT NDFRILVNVY DGLVRFKDGT 
LEVEPALAES WEISEDGKTY TFKLRQGVKF HDGSDFNAEA VKFNFDRMLK KDHPFYGTGP 
FPLSFNFSSV DSVNVLDEHT VEFKLSEAFA PFLSNLAYPT GLIVSPAAVS EHGKEYGRSP 
SGTGAFKFVE WLSNQRVVVE RNPDYWDGAA KLQAVVFRPI TDANTRVAEM MAGGIDVMVE 
VPPDNLATFR QDANFAVAEQ AGPHVWFAIL NTKEGPFADK RVRQAANYAV NKETLANDVL 
QGTATVAAGP IPPAFNWVES SVKPYAYDPE QAKSLLAEAG VENPQVTFYV TEGGSGMLDP 
ITMGAAIQAD LQAVGFKVKI ETYEWNTFLG RVNPGLQGKA DMAEMAWMTN DPDTVPYLTL 
RTDAMPDKGG FNSGYYSNPK LDELLEKARK STDQAERGKL YGEVQSIVHD DAPWLFVANW 
KQNAVTTAAV KGFELQPSFL LDLHGVTKE