Gene Smed_5172 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5172
Symbol
ID	5319474
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	125869
End bp	127419
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	60%
IMG OID	640776950
Product	hemolysin-type calcium-binding region
Protein accession	YP_001313882
Protein GI	150377287
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.484438
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.743168
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAAGT TTATTGGAAC GCGTGCGGGC GATATTCTGA GTGGTACAAG CGAAGGCGAC 
CGGATCTGGA GTCTCGACGG CAATGATGTC GTGGATGGCG GCAAAGGCGA TGACTTCGTC 
GATGGTAGGG CCGGCGACGA TGCGCTGACA AGTTCAAGCG GCTTTGACGA GTTTACCGGC 
GGCGAAGGCA ATGATCGGCT GTCGTTCATC GGCGTCGGCG GCGCGGCACG GGGTGGCACG 
GGGGTCGACA CGCTTGTGGG CGATTACGCC GCAATAACCG ATGCCTTCCT GTTCGATGGC 
ATGAATGGCC ACGCAGCCTT CGGCGATCTT TCGGTTAAAG CAAACCACCT TTATTTCCTC 
GATATCGAGC GACTCAATCT GACGACCGGG ATCGGCGATG ACAGAATCAT TGCCACGGGC 
TTCAGCTTCG TCAACATCCA TACCGGTGCG GGTGACGACC GTATCGAAAC CGGCATCGGC 
GATGACCAGA TCTATGCCGG CGACGGTCGG GATCTACTGT TTGGCGGCGC AGGCGACGAT 
TTTATTAGCG GCGGTCAGGG CGACGACTAC GTTAACGGCG GCAACGACGA CGACAGGCTC 
GAGGGGGAGG ACGGCAATGA CAGTCTTGTG GGCGGTCGTG GCAACGACCG GCTCGATGGC 
GGCAGCGGCG ATGACGACGT CAATGGCGGG GACGGCAACG ACTCTCTGAC CGGAGGCCTT 
GGATCGGATA CGGTTACGGG CGGTGCCGGG GATGATTACC TGAGCAACGG TTTTGCCGCC 
GGAGACATAC TGCTCGGCGG CGACGGCAAT GACACTCTCT CGGCGGGTGG GGAAGACACC 
GCCTATGGCG GATGGAGTGA GCTCTATGGC GGCGCCGGCG ATGACAGACT TCACGTCTAT 
ACGGATGGTA TAATCGGCGC ATTGGACGGC GGCGATGGTT TCGACAGAGC GAGCATCGCA 
CTCGATGATG TGCCCGCCGG CTTCGTTCTC GATGCATCGC GTTTTGGCTC GATCGAGGAG 
TTCAACATCA CCGTTAAATC GGCCTATCTT GGCGTCCACC TCTCCGGCGG GAATGGCAAC 
GATAGGCTCT TCTGTTTCGA CACCTACAGG GAAGGCCCCA GCGGAAACGA TGTTTTGAAC 
GGGCGCAGCG GCGATGACAT ACTCGTCGGC GGCAGTGGAG CGGATAGTCT GCTTGGCGGG 
GATGGCAACG ATTCGCTGAG TGGCGAATAT CACTCGGACA GGCTGCTCGG CGGTGCTGGC 
GCCGATCTTT TGACAGGTGG ATCCGACGCC GACACTTTCA TTTGGGACGA AGCCTCTGTC 
CGCAATGACA GCAGCATCGA TCGGATCATC GACTTTCGCA GCGGGGACGG TGATGTGCTT 
CTATTCCGCG GCTTTGGCGG TACCGAGTTT CGCGACTTCG AAAGCTTCCT CGCCGCCTCC 
CGTGATACGC CCGAAGGGGT TTACGTCAGT TTCGATGGCG ACGCCCACGG GATATTGATC 
CAGAATACCC TGCTCGCTGG TTTTTCGGCC GCAGACGTCC TCTTCGCCTG A

Protein sequence

MAKFIGTRAG DILSGTSEGD RIWSLDGNDV VDGGKGDDFV DGRAGDDALT SSSGFDEFTG 
GEGNDRLSFI GVGGAARGGT GVDTLVGDYA AITDAFLFDG MNGHAAFGDL SVKANHLYFL 
DIERLNLTTG IGDDRIIATG FSFVNIHTGA GDDRIETGIG DDQIYAGDGR DLLFGGAGDD 
FISGGQGDDY VNGGNDDDRL EGEDGNDSLV GGRGNDRLDG GSGDDDVNGG DGNDSLTGGL 
GSDTVTGGAG DDYLSNGFAA GDILLGGDGN DTLSAGGEDT AYGGWSELYG GAGDDRLHVY 
TDGIIGALDG GDGFDRASIA LDDVPAGFVL DASRFGSIEE FNITVKSAYL GVHLSGGNGN 
DRLFCFDTYR EGPSGNDVLN GRSGDDILVG GSGADSLLGG DGNDSLSGEY HSDRLLGGAG 
ADLLTGGSDA DTFIWDEASV RNDSSIDRII DFRSGDGDVL LFRGFGGTEF RDFESFLAAS 
RDTPEGVYVS FDGDAHGILI QNTLLAGFSA ADVLFA