Gene Smed_5654 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5654
Symbol
ID	5319956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	619466
End bp	620506
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	63%
IMG OID	640777388
Product	hypothetical protein
Protein accession	YP_001314320
Protein GI	150377725
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.235146
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGCGTA AAGATGCCAT CTCACAAATC TGGTACACCC GCTGCCCTGT CCCGACACCA 
GTGGGCCTTG CCACCCAGCT TGGTCTTCTC GACACGGCAT TTGCCGCCGA GGGCATCACG 
CTCAACTCCA TCATCGACAG CAAGGATCGC TCCATCCGGT CCAGCCACTT CGATCACCAT 
CTCGACTATT CGTTTCGCCA TGGCGGCAAT GTCCCGCCGG TCCGCGCCCG CTCGGAAGGC 
AACCCGACGC GGCTTGTCGG CATCACATGG ACCGATGAGT TCCAGGCCAT CATCACGTTG 
CCGGGCACCG GCATCAAAAC GACACGCGAC CTTTTTGGCC GGCGCTTCGG CATTGCGCGC 
CGTCCGCCAG GCATCGTCGA CTTCATGGCC GCCACCGCGC TGAAAGGCCT TGTTTCCGCA 
CTGTCGCTCG AAGGGCTCGC ACCCTCCGAT GTCGAGATCG TCGATATCCC GCTTTCCGAA 
AGCGTGCTCG ATGGCAGAGA GGGTCCCCAG CTCTACGGCC TGCGCAACCG TCAAGCCTAT 
GGCCCCGAAA TCGCCGCGCT GCTGCGCGGC GAGGTCGACG CAATCTATGT CAAAGGTACG 
CCCGGCATTG CCGTGGCCAA TCTCTTTGCG GCCCACATGG TCGCGGAATT CGGCTTTCAC 
CCCGACCCGA AGATCCGCAT CAATTCCGGC TCCCCACGGG TGTTGACCGT CGATGAACGG 
CTGGCGCAAG ACCGCCCCGA TCTCGTCGCC AAGCTGATCG CGACTTTGAA GCAGGCTGGC 
GCCTGGGCCG AAGAACATCC GGACGAGGTG CGCCGCTTCG TTGCCCGCGA GGTCGGCGCA 
TCCGAAGAGG TCGTGGCTGC GGCCAACGGT CCGGATCTCC ACAAACATCT CGGCATCGGC 
CTTGAACCGA CACTCGTCGA GGCGATCGGG CACTACAAGG ACTTCCTGCA TGAATGGGGT 
TTCCTGGCGA GCAACTTCGA CATCGACACA TGGGTCGACC ACCGCCCCTG GGCGGAACTC 
GACATCCGCG CTGTCGCTTG A

Protein sequence

MTRKDAISQI WYTRCPVPTP VGLATQLGLL DTAFAAEGIT LNSIIDSKDR SIRSSHFDHH 
LDYSFRHGGN VPPVRARSEG NPTRLVGITW TDEFQAIITL PGTGIKTTRD LFGRRFGIAR 
RPPGIVDFMA ATALKGLVSA LSLEGLAPSD VEIVDIPLSE SVLDGREGPQ LYGLRNRQAY 
GPEIAALLRG EVDAIYVKGT PGIAVANLFA AHMVAEFGFH PDPKIRINSG SPRVLTVDER 
LAQDRPDLVA KLIATLKQAG AWAEEHPDEV RRFVAREVGA SEEVVAAANG PDLHKHLGIG 
LEPTLVEAIG HYKDFLHEWG FLASNFDIDT WVDHRPWAEL DIRAVA