Gene Smed_0336 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0336
Symbol
ID	5321169
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	365106
End bp	366236
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	62%
IMG OID	640789271
Product	hypothetical protein
Protein accession	YP_001326029
Protein GI	150395562
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.115948
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATATAG CCGAACGGAC AACGGCCAAG CGTCGGCGAA AGCGGGAAGC GGCGAAAGAA 
ATCGCTCTGG CCGAGGCATC GGCGATCGTT GCCCGGAAAC GCGACAGCAT AGAGCTTGCC 
GGCAGCTGGA GCGTGATCGG TCTGTTCGTG ATCGCCTGCG CAGCGGTGGT TTATGCGATG 
GAACCGATCC TCCTGCCGAT AACGCTTGCG GTCGTTGTCG GTATCGTCCT CGGCCGGGCT 
GCCGATGAGC TTGCCCGGTT CGGTCTTCCG CCTATCTTCG GCGGGCTGTT GCTGGCGCTT 
TTCTTCCTGC TGGGCCTGTC ATATCTGGTC AATGCCATTC TCTGGCCGAT TACCGAGGTC 
GCGCGCGAAG CGCCGCGGCT GGTCGAAGGC GTGATCGAGC GGATACTGCC CTATCTGCAG 
CGCTTCGAAT GGCTGAACCT GGTGCTTGCC CGCGGGACGG AAGAGGAGGC CTTTGCCGAC 
GTCATCGTCA AGAATGCGGG GCCGCTGATC GGTGGCGCGG CGGCCAGCCT CACCCCGGCT 
CTCGTGCAGA CCCTGATCTT TTTGGCGGCG CTCGTTCTAT TTCTGCTCGG GCGCGTTCAA 
CTGCGCAGCA CGATCATTCT TGCCTTCCCC AGCCGCGAAG GGCGTTTGAC GGCAATCCGG 
GTCATGAACG CCCTCGAGGA TGCGCTTGGG CATTATTTCT CGACCGCAAG CCTGATCTAC 
CTGGCGCTTG GCGCAGTTAC CATGGTGGTC GCGCTCGTCG GCGGATTGGC GATGCCGCCG 
CTTTGGGGCC TTTTCGCCTT CGTCTCGAGT TTCATTCCCT ATCTCGGTGT CACGTTCATG 
ACCCTGGCTT TGCTCGTTGG CGGGCTGATG ACCCATGATG CGCTCATCGT TGCGCTCGCC 
CCGGCCACCG CCTTCTTCTT CGTTCACCTC GCCATGGAGA ACCTGCTGGT GCCCGCCATC 
CTCGGCCAGC GCTTCGATAT CAATCCATTC CTGATCTTCG TAGCGATCAT CTTCTGGACG 
TGGATGTGGG GCGCCGTCGG CGCGATCCTC GCCTTTCCGC TATCGCTGAT CGCGATGATC 
ATCTTCGAAC AGGTGCTGCT GCCGCCGCAG GAACGGCAGC TGCCGGGCTG A

Protein sequence

MDIAERTTAK RRRKREAAKE IALAEASAIV ARKRDSIELA GSWSVIGLFV IACAAVVYAM 
EPILLPITLA VVVGIVLGRA ADELARFGLP PIFGGLLLAL FFLLGLSYLV NAILWPITEV 
AREAPRLVEG VIERILPYLQ RFEWLNLVLA RGTEEEAFAD VIVKNAGPLI GGAAASLTPA 
LVQTLIFLAA LVLFLLGRVQ LRSTIILAFP SREGRLTAIR VMNALEDALG HYFSTASLIY 
LALGAVTMVV ALVGGLAMPP LWGLFAFVSS FIPYLGVTFM TLALLVGGLM THDALIVALA 
PATAFFFVHL AMENLLVPAI LGQRFDINPF LIFVAIIFWT WMWGAVGAIL AFPLSLIAMI 
IFEQVLLPPQ ERQLPG