Gene Smed_1984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1984
Symbol
ID	5322843
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	2035869
End bp	2036975
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	63%
IMG OID	640790922
Product	hypothetical protein
Protein accession	YP_001327653
Protein GI	150397186
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.590455
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCCTG CCGAAAGGCC ATGCGATGAG ACGATCCGGC GAGCGCTCGC CCGGGTTCTC 
GACAGCAAGG GCTTTCAGCG CTCCGAACGT CTGCGCACGT TTCTCTCCTA TGTGGTGGAA 
AAGGAAATCA TCGGTGAAGG CGCTCAGCTG AAGGGCTACT CGATCGCCAT TGATGTTTTC 
GGACGCGGCC AGACCTTCAA TGCCGACAGC GATCCTCTTG TGCGCGTCCA TGCCGGCAAG 
CTGCGCAAGC TGCTTAAGGC ATTCTACGAA ACGGATGGCG CCGGCGAAGA ATGGCAGATC 
GCCATTCCCA AGGGGACCTA TGTGCCGGAG TACCGCCGGT GTTCAAACGG CGTCGAGGCA 
TTGCCGGGCC CGGATGCCGC GGGCGCCCGC CGTCGCCAGC CCGGACGCGG GCCACCCTGG 
CAGCCCGCCC CCTTTTCGTC CCCCTGGGCC GTGCTTACCG TGCTGCCGCT TCTCCTTTTC 
GCCCCTCTGC CGGCCTCGGA AATGTCGCTC GACATCGATG CCGAGGCTAA ACTCGTCAAT 
GGTCCGATGG CCGCCGTCAG GGGGCTTCCC TCCGTCAGCA TCAGCGTGAC AGGATCGCAG 
CACAGGAGCA CCCGGCGTTT CTCCTCGCAA CTGCGTGATG CGGCGCTTCG GCATGGCACA 
CTTGCCCAGG CGCACGTGTC TGATGGGAAC CGCACACCGG CATCCGGCAA TCAGGCGCTT 
GCGTTTTCCA TCGCGCTCGC CTGGCACGAT GCGCCTGCGG CGGGCATCCG GGTCACCCTG 
TCCCACGATG GGGAAGGCAT CCCTTTGCGC CAGGACTTCA TCTCCGCCGA CCGCCTCGAT 
AGCGAGGCCG ATGTTCTCTA CGAAAGCACT TCGCTTGCAG CGAAACTCTT CTCGCTGGAC 
GGCGAGATCT ATGCGCATGC CGCACTGGAA GGCTTGCAAA GTACCATGAT GCAATGCATG 
TCGGCGACTG CCAAGTACCG GAAGCTGCTG ACGCGCGACA GTTTCCAGCA GGCCTGGAAC 
TGCCAGCAGA AGCTCAAGCC CCTCAAAGGC GACGAGCCCT TCTTCATCCT TTCCGTAAGC 
AGTCCGCACA AGATCAATGG CCATTGA

Protein sequence

MTPAERPCDE TIRRALARVL DSKGFQRSER LRTFLSYVVE KEIIGEGAQL KGYSIAIDVF 
GRGQTFNADS DPLVRVHAGK LRKLLKAFYE TDGAGEEWQI AIPKGTYVPE YRRCSNGVEA 
LPGPDAAGAR RRQPGRGPPW QPAPFSSPWA VLTVLPLLLF APLPASEMSL DIDAEAKLVN 
GPMAAVRGLP SVSISVTGSQ HRSTRRFSSQ LRDAALRHGT LAQAHVSDGN RTPASGNQAL 
AFSIALAWHD APAAGIRVTL SHDGEGIPLR QDFISADRLD SEADVLYEST SLAAKLFSLD 
GEIYAHAALE GLQSTMMQCM SATAKYRKLL TRDSFQQAWN CQQKLKPLKG DEPFFILSVS 
SPHKINGH