Gene Smed_0643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0643
Symbol
ID	5321479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	695208
End bp	696146
Gene Length	939 bp
Protein Length	312 aa
Translation table	11
GC content	61%
IMG OID	640789579
Product	hypothetical protein
Protein accession	YP_001326334
Protein GI	150395867
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG0697] Permeases of the drug/metabolite transporter (DMT) superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.254759
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.394325
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGCGG ACGCTCCGAG CCCGATGAAG GGGATGGTGC TCAAGGTGCT CTCCGTTGTC 
GTCTTCGTGT GCATGTCAAC CTCTATCAAG GCTGCCGGCA ACGATATCGC CACGGGTCAG 
ATCACCTTCT ATCGCTCGGC ATTCGCGATG GTGCCGATCC TCGGCTTCCT GGCCTGCCGA 
GGCGCGCTGC GCGACGCTTT CCGGACCAGC AACGTCACGG GACATGTGGC GCGTGGCTTC 
GTCGGCATCC TCGCCATGAG TTGCGGCTTT TACGGTCTCG TCCATCTGCC CCTGCCGGAG 
GCGATCGCGA TCGGCTACGC TATGCCGCTT CTCGCGGTGG CTTTCGCGGC GATCTTTCTT 
GGAGAGATCG TGCGGCTCTA TCGCTGGTCG GCCGTGCTTA TCGGGCTCAT CGGGGTGTTT 
ATCATCATCT GGCCACGGCT TACGCTTTTC AACCAGGGCG GCTTCGGGTC GGCGGAGGCT 
ATGGGTGCCG TCGCGGTGCT TTTTTCGGCG GCGCTCGGAG CAACGGCGAT GGTGCTCGTG 
CGCAAGCTCG TACAGAAGGA ACGCACCCAT ACGATCGTCC TCTATTTCTC GCTTTCCGCT 
GCAATGTTCT CGCTTGCGAC GCTGCCCTTC GGCTGGTCTG AACTCTCATG GGAGGCATTC 
TTCCTCCTGA TGATCGCCGG GTTTTGCGGC GGCATCGGGC AGATCCTGCT GACGGAGAGT 
TATCGCCACG CCGATATGTC GACGATCGCC CCCTTCGAAT ACACATCCAT CGTGCTGGGC 
ATCGTCATCG GTTATTTTCT TTTCGGAGAT GTGCCGACGG CAACCATGCT CGCGGGAACG 
GCGATCGTCG TCGGCGCGGG CATCTTCATC ATCTACCGGG AGCACCAGCT GGGACTGGAG 
CGCAGGGGTG CCAGGAAGCA CGTTACCCCG CAGGGTTGA

Protein sequence

MDADAPSPMK GMVLKVLSVV VFVCMSTSIK AAGNDIATGQ ITFYRSAFAM VPILGFLACR 
GALRDAFRTS NVTGHVARGF VGILAMSCGF YGLVHLPLPE AIAIGYAMPL LAVAFAAIFL 
GEIVRLYRWS AVLIGLIGVF IIIWPRLTLF NQGGFGSAEA MGAVAVLFSA ALGATAMVLV 
RKLVQKERTH TIVLYFSLSA AMFSLATLPF GWSELSWEAF FLLMIAGFCG GIGQILLTES 
YRHADMSTIA PFEYTSIVLG IVIGYFLFGD VPTATMLAGT AIVVGAGIFI IYREHQLGLE 
RRGARKHVTP QG