Gene Smed_1990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1990
Symbol
ID	5322849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	2040655
End bp	2041884
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	65%
IMG OID	640790928
Product	hypothetical protein
Protein accession	YP_001327659
Protein GI	150397192
COG category	[S] Function unknown
COG ID	[COG1944] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00702] uncharacterized domain

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.128668
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTCATCAG GCACTGAGCG AGACGGTGTG AGGCCGAAGA ACGGCGCGGG CGTCGACGGC 
ACCGCCGCGG ACCTCCATGC CTCTATCGTC TCCGCGCGGA AGGTACCCTT TTCCGCCGAT 
CCGGTTGAGG GGAACCTGGA ACGCTGCCTC GCCGCGCTTC CTCCGCTCTG CCGCCGCGCG 
CGCATCACGC GGCTCGGCGA TCTGACCGGC CTTGACCGGA TCGGGCTGCC GGTGATGCAG 
GCTGTCCGGC CTGCCGCGCT CTCCGAAGTT ACGTCTCTCG GAAGGGGCTT CTCCAAAGCG 
GAGGCGGCAG TCGGCGCGCT GATGGAATCG CTCGAACGCT ATTTTGCCGA GTCCATTCCG 
GCAGATCGGA CCTTTCTCGC GACCGCCGAC CAACTCGAAG TCACCAAGGG TCTCTTTGAG 
AACCTCGTGG TTCCGGAACG GCGTGGAAAA TGGCGTCAAC AGGTCATTGC CTGGATCGAA 
GGGATCGATG TCCTGAGCGG CTTAGTGCAG CCGGTGCCGC TGGAACTCGT GCATACCCGT 
TACAGCGATC CGCCGCCGGC CCATGACGGC GTCTTCCTGC GCACGACCAC CGGCCTTGCC 
TGCCATACCA GCCCCAATGG CGCTTTCCTG CACGGATTAT GGGAATGCCT CGAACGGGAT 
GCGATCGCCC GTGCCTTTGC CACGCATGGC TTCTTCGATC GGATGCGGCT TGCGCCCTTT 
GGCCTGGGGG ACAGGATTGA TCGTATTCGG TCGGTTGCGA GCGCTCGCGG CATCTCCTTC 
GCCCTGTGGC TCGCTCCCTC TCCGGCATCC GTTCCCGTCG TCTGGTGTCA GACGATCGAG 
ACTTCGCCGG GTGAGCCGAT ACTGGCGCTG CCGACGGAAG GTTACGCCGC GGGCCCGAGC 
GTTGCAGCGG CGGCTGCAAG CGCAATGCTG GAAGCACTCT CGGCACGGGC AGGGGCGATC 
TCTGGCGCCC GCGACGACCA GACGAGGGAG CACTATCGCA GGAGGACGGA CGGGGCGATA 
GCGAAGGCCC GGGAGCTTAT TCTTGGCGAT CACGCTACAA GGTTCATGGA GACACCGACG 
CTGACGCTCA CAAATTCCGG TGCGCTGGCA GGCCGCGTGA TCGATGCAGG GCTCGGACCG 
GTGCTGGCCA TTTCCGTGGG TGCCGAAGGC GGTGTACATT GCGTGCGAAC CGTTCTTCCT 
GGTGCCTCTC CCTTCTTCGT CTTGCGGTGA

Protein sequence

MSSGTERDGV RPKNGAGVDG TAADLHASIV SARKVPFSAD PVEGNLERCL AALPPLCRRA 
RITRLGDLTG LDRIGLPVMQ AVRPAALSEV TSLGRGFSKA EAAVGALMES LERYFAESIP 
ADRTFLATAD QLEVTKGLFE NLVVPERRGK WRQQVIAWIE GIDVLSGLVQ PVPLELVHTR 
YSDPPPAHDG VFLRTTTGLA CHTSPNGAFL HGLWECLERD AIARAFATHG FFDRMRLAPF 
GLGDRIDRIR SVASARGISF ALWLAPSPAS VPVVWCQTIE TSPGEPILAL PTEGYAAGPS 
VAAAAASAML EALSARAGAI SGARDDQTRE HYRRRTDGAI AKARELILGD HATRFMETPT 
LTLTNSGALA GRVIDAGLGP VLAISVGAEG GVHCVRTVLP GASPFFVLR