Gene Smed_0024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0024
Symbol
ID	5320851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	19875
End bp	21032
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	67%
IMG OID	640788955
Product	hypothetical protein
Protein accession	YP_001325719
Protein GI	150395252
COG category	[R] General function prediction only
COG ID	[COG1092] Predicted SAM-dependent methyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.000201715
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGAAGGAAA AAGATCGGCG ATCGAAGAAC GCCTCCGTGA CGGCGGCGAA GAGCCGGGGC 
GCCGAGGCGC GCGGCGGCCG TCATGAGCAA AGGCTGCCGC CAGCAAAAAG CGCAGGGCCC 
GCGGCGAGGA CCGGATCAAA GACGGGGGCA GGAGGGCCAT CGCTGAAACC GGCACCGCGC 
AAGGCCGAGC GGACCTCCGC CCAGAACAGC GCCCCGTTGC GCCGCCTTGA ACTCAGGACC 
GGGGAGAAGC CTGCCGAGAC GGTGCCGCTG ATCCTCGCGA CCGCCGCCAC CGGCGGCTAT 
CACCTGATCG ATAGCGGCGA TGGCGAGAAG CTCGAGCAAT ATGGCCCCTA TCGCATCGTC 
CGTCCGGAGG CCCAGGCGCT CTGGCCGAAG GCCCTGTCTG CATCCATCTG GGAAAAAGCC 
GATGCGGTCT TCACCGGCGA TACGGAAGAG GACGGGATGG GTCGCTGGCG GTTCCCGGGG 
GATGTTCTCG GCGAGACCTG GCCGATGCAG CTCCTGGACA CGGATTTCCT CGGCCGGTTC 
ACATCCTTCC GCCATGTCGG CGTCTTTCCG GAACAGCTCG CCCACTGGTC GTGGATGCGG 
GACCAGGTTG CCGGCGCCGG CCGGCCCCTG AAGGTTCTCA ATCTCTTCGG CTATACCGGC 
GTTGCTTCGC TCATCGCGGC GAAGGCGGGT GCGGAAGTAA CCCATGTCGA TGCCTCGAAA 
AAAGCGATCG GCTGGGCGCG CGAGAACCAG GCAATGGCGC GAGCCGAGAA GCTGCCGATC 
CGCTGGATCT GCGACGATGC CATGAAATTC ATCCAACGGG AGGAGCGGCG CGGCAGCCGC 
TACGACGTCA TCCTCACCGA CCCGCCGAAG TTCGGCCGCG GCCCGAACGG CGAGGTTTGG 
CAACTGTTCG ATCATCTCGC GGCGATGCTG GACGTCTGCC GCGAGATCCT GTCACCGGAC 
GCGCGGGGCC TCGTGCTCAC CGCCTATTCG ATCCGTGCCA GCTTCTATTC GATTCACGAG 
CTCATGCGGG AGACCATGCG CGGGCGCGGC GGGCGGGTGG AATCGGGCGA ACTCATCATT 
CGCGAGGGCG GTCTCGACGG CGCCAGGCCG GGCCGGGCGC TCTCGACCTC CCTCTTCAGC 
CGCTGGGTAC CGAAATGA

Protein sequence

MKEKDRRSKN ASVTAAKSRG AEARGGRHEQ RLPPAKSAGP AARTGSKTGA GGPSLKPAPR 
KAERTSAQNS APLRRLELRT GEKPAETVPL ILATAATGGY HLIDSGDGEK LEQYGPYRIV 
RPEAQALWPK ALSASIWEKA DAVFTGDTEE DGMGRWRFPG DVLGETWPMQ LLDTDFLGRF 
TSFRHVGVFP EQLAHWSWMR DQVAGAGRPL KVLNLFGYTG VASLIAAKAG AEVTHVDASK 
KAIGWARENQ AMARAEKLPI RWICDDAMKF IQREERRGSR YDVILTDPPK FGRGPNGEVW 
QLFDHLAAML DVCREILSPD ARGLVLTAYS IRASFYSIHE LMRETMRGRG GRVESGELII 
REGGLDGARP GRALSTSLFS RWVPK