Gene Smed_5623 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5623
Symbol
ID	5319925
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	590144
End bp	591151
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	60%
IMG OID	640777366
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_001314298
Protein GI	150377703
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4608] ABC-type oligopeptide transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0190299
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.692526
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACACG CACCTGTTCT CAAAGTCGAA AACCTGCAAA CACGCTTCAA GAGCGTCCAG 
CGGGGCAAGT ACGTCCATGC GGTCGACGAT GTTTCGATCG AGCTCTATCC AGGCGAGATC 
GTCGGTTTGG TCGGCGAATC CGGCTGCGGA AAATCCACGC TCGGAAGAAC CATCGTCGGT 
CTCGAGAAGG CAAGTGCTGG ACGGGTACTG CTCGACGGGG TCGACCTCAG CACGCTTTCG 
GGCGCCGCAC TGCGAAACAG TCGTCGGGCT CTGCAGTACG TGTTCCAGGA TCCCTATTCG 
TCCCTGAACG ATCGTCAGAC GGTTGGCGAG GCGATCGACG AAGCTCTATT GATCGATGGC 
CTCAGGTCGG CGGACGAGAG AACTCGTCGG GCCAAGGAAC TATTGGAGCA GGTCGGTCTG 
CCTCATACGG CAAGGGACCG TCACACACGC GAGCTATCGG GCGGCCAGCG TCAGCGCGTT 
GCCATTGCCA GATCTCTCGC GGTGAACCCG CGAGTTCTGA TCTGCGACGA GCCGGTTAGC 
GCCCTCGATC TCTCCATCCG GGCGCAAGTC ATGAACCTGT TCCTGCGCTT GCAGAAGGAT 
CTGGGTGTCG CCTGCCTGTT CATCGCCCAT GACCTTGCAC TTGTGAGGCA GGCCGCCTCG 
CGCGTTTACG TCATGTATCT AGGCAAGATC GTTGAGCATG GGCCGTCGCA GGAACTGTAC 
GATCATCCTG GCCACCCATA CTCTCAGATG TTGCTGGCCT CCGTTCCCGA GGTCGACCCA 
CGCGTTGAAA AGCTCCGCAG CGCTCCTTTG CTGAAGGGCG AAGTGCCAAG TCCGACCAAT 
CCACCGTCCG GCTGCCGATT CCGGACACGT TGTCCGCTTG CGGTTGAGGA CTGCGCCCTA 
AGAGCACCAG CATCACATGT CCTTTCGCCG GACCACAACG CCGCGTGCAT TTTTGCCCCC 
GACCTTCATG GAGGGAAGCG CTCGGCTCTA ATTCACCAGG CTGCATAA

Protein sequence

MTHAPVLKVE NLQTRFKSVQ RGKYVHAVDD VSIELYPGEI VGLVGESGCG KSTLGRTIVG 
LEKASAGRVL LDGVDLSTLS GAALRNSRRA LQYVFQDPYS SLNDRQTVGE AIDEALLIDG 
LRSADERTRR AKELLEQVGL PHTARDRHTR ELSGGQRQRV AIARSLAVNP RVLICDEPVS 
ALDLSIRAQV MNLFLRLQKD LGVACLFIAH DLALVRQAAS RVYVMYLGKI VEHGPSQELY 
DHPGHPYSQM LLASVPEVDP RVEKLRSAPL LKGEVPSPTN PPSGCRFRTR CPLAVEDCAL 
RAPASHVLSP DHNAACIFAP DLHGGKRSAL IHQAA