Gene Smed_2066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2066
Symbol
ID	5322925
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	2117962
End bp	2119011
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	59%
IMG OID	640791003
Product	ABC transporter related
Protein accession	YP_001327734
Protein GI	150397267
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.626309
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0289677
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTCGG TCGAAATTCA GAGTGTCAAA AAGTTCTACG GCGCATTGCA GGCGTTGCAC 
GGGGTTTCAA TCCAGATCGA AGACGGAGAG TTCGTCACGC TGGTCGGCCC TTCCGGTTGC 
GGAAAATCAA CCCTTCTGAG GATGCTCGCC GGGCTCGAGG AAATCAGCAG CGGGACGATC 
CGCATCGGCG CGGCGGTCGT CAACGACCTC CCGCCGAAGG ACCGCGACAT TGCAATGGTC 
TTTCAGAACT ATGCCCTCTA TCCTCACATG ACGGTCGCCG AGAACATGGG CTTTGCCTTG 
AAGCTCAAGA ATGCCGACAA AGGCGAGATC CGCTCCAAGG TCGAGCGTGC GGCGAATATC 
CTCAATCTCG ACAAGCTGCT CGATCGTTAT CCGCGCCAAC TCTCGGGAGG GCAGCGCCAG 
CGGGTCGCCA TGGGCCGGGC GATCGTGCGC GCGCCCAAGG TCTTTCTTTT CGATGAGCCG 
CTTTCCAATC TCGACGCGAC GTTGCGGGTC TCGATGCGCG CCGAGATCAA GAGCCTGCAT 
CAAAGGCTCG GCACGACCAT TGTCTATGTG ACCCATGATC AGGTCGAAGC TATGACGATG 
GCCGACAAGA TCGTGGTGAT GCGCGATGGG ATCGTAGAGC AAGTCGGGGC GCCGCTGGAG 
CTTTATGACA GGCCATCCAA CATGTTCGTT GCCGGCTTCA TCGGGTCGCC AGCGATGAAC 
TTTCTGACGG GCGATATCCG CGCGAATGGA TTTATGACCG GCACTTGTCT GTTTCCCATT 
GGTGAAAATC GGCCTGATCT GCATGGCCGG AGCGCCGTGT ACGGAATACG TCCCGAGCAT 
CTGCGCATCT CGGAGGACGG CATTCCCGCC GAGGTTCAAC TGGTCGAGCC AACCGGGTCC 
GAGTCACACC TGATCGTCAA AATCGCGGAT CAGGCAATCA CTTGCGTGGT GCGGGACCGC 
GTGGACGTCA GACCCGGCGA TTTAATCCGG CTGTCTCCCG ACGCGGATCG CGTTCACCTG 
TTCGATCCTG ATGGAGAGAA CCGGCTCTAG

Protein sequence

MASVEIQSVK KFYGALQALH GVSIQIEDGE FVTLVGPSGC GKSTLLRMLA GLEEISSGTI 
RIGAAVVNDL PPKDRDIAMV FQNYALYPHM TVAENMGFAL KLKNADKGEI RSKVERAANI 
LNLDKLLDRY PRQLSGGQRQ RVAMGRAIVR APKVFLFDEP LSNLDATLRV SMRAEIKSLH 
QRLGTTIVYV THDQVEAMTM ADKIVVMRDG IVEQVGAPLE LYDRPSNMFV AGFIGSPAMN 
FLTGDIRANG FMTGTCLFPI GENRPDLHGR SAVYGIRPEH LRISEDGIPA EVQLVEPTGS 
ESHLIVKIAD QAITCVVRDR VDVRPGDLIR LSPDADRVHL FDPDGENRL