Gene Smed_5679 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5679
Symbol
ID	5319981
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	645196
End bp	646284
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	58%
IMG OID	640777409
Product	HipA domain-containing protein
Protein accession	YP_001314341
Protein GI	150377746
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.75549
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCGCTCAG GAACGGTCGG TGCAGACAGG CTGCTGCCGT GGCTCGCAAA CCTGCTTCCG 
GAAACCCATC TCGCAGAAAT CGGTCAACGG CTGAAAGTAT CTCCTCAGGA CATCGTGGGC 
CTGCTCGGCC ACATCGGCCG AGACACGGCG GGAGCGCTGT CGATCGGCGA ACCAAGAAAG 
GCAGGCGTCA GCCTGGAGCC TATTCTGGAC AAGGTGACGC TGGAGCGCAT CCTCAACGAG 
CTTCCAGCGA AACCCTTTCT GGTGGGAGAA CGAGGGGTCT CGATGTCGCT TGCAGGTGTG 
CAGGAGAAGC TGCCCGTATT TGTCGATGGA GATCGCATCA TCTCGATACC GGTAGACGGC 
ACGCCATCGA CCCAAATCAT CAAGCCGGAT AACGCCCGTC TGGCCCTTGC ACGGGCATGT 
GGACTGGAAG CGGCCGAAGC TTCGATCGGC GTAGCCGGTA AAAGGCGCTA TTTGCTGGTG 
AAGCGAGATG ACCGTTTCGC GGCCCCGCAG GGCGAGATCC GCAGGCTGCA CCAGGAAGAC 
CTTTGCCAGC TGAAAGGACA TTTTCCATTA CAGAAATACG AGCGATCCTC GACAGGTGGC 
GGCGTGACGT TGAAGATGAT GTTCGATGCC GTCAGTGATC TGGTTTCCCC CGGCGAGCGC 
GTGAAGCTTC TGGATGCGAT GATTTCCAAC GTGCTGATCT GCAACTCCGA CTCGCACGCA 
AAGAACTATT CCATCCTGAT CGGTGCGGCG GGATCTGCGA AGATCGCGCC ACTTTACGAT 
TTAATGTGTG CTGCTGTTTA CCGTCAGGTC GATCAGAGCC TACCTCAAGG CATTGCCGGG 
CGCTTCATCG CGGCTGACTT GGGGCGACGC GATTGGCAAG CAGTAGCTGA GGAGATTGGG 
TTGAGTTGCG CATCAACTGT CAGAAGGGTC GGAGAACTTT CCGCTGTGGT CGCAGACGCC 
TGCGAAGATG TTACGAAGCG GACTTCTGAA ATCGTTGGCG ATCCCACAAG GATTCTGGAG 
CGCGTCACCC ACCAAATTCA AAAGCGATGC AGGCGAATTC AACGGCACCT TTACGTGGCG 
CGCAGTTGA

Protein sequence

MRSGTVGADR LLPWLANLLP ETHLAEIGQR LKVSPQDIVG LLGHIGRDTA GALSIGEPRK 
AGVSLEPILD KVTLERILNE LPAKPFLVGE RGVSMSLAGV QEKLPVFVDG DRIISIPVDG 
TPSTQIIKPD NARLALARAC GLEAAEASIG VAGKRRYLLV KRDDRFAAPQ GEIRRLHQED 
LCQLKGHFPL QKYERSSTGG GVTLKMMFDA VSDLVSPGER VKLLDAMISN VLICNSDSHA 
KNYSILIGAA GSAKIAPLYD LMCAAVYRQV DQSLPQGIAG RFIAADLGRR DWQAVAEEIG 
LSCASTVRRV GELSAVVADA CEDVTKRTSE IVGDPTRILE RVTHQIQKRC RRIQRHLYVA 
RS