Gene Smed_5952 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5952
Symbol
ID	5320254
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	914865
End bp	915932
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	64%
IMG OID	640777639
Product	signal transduction histidine kinase
Protein accession	YP_001314571
Protein GI	150377976
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG0745] Response regulators consisting of a CheY-like receiver domain and a winged-helix DNA-binding domain [COG3920] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.113414
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTTGG GCAGGGTGCT CTACATTGAC GACGATCCAG CCCTTCGGCG TCTGGTCGGT 
AAGGAGTTCG AGCGGCACGG CTACATTGTC CAGCTTGCTG CCACAGGCGA CGAGGGGCTT 
CGCCACTTGC GCGCGGGCGG CATCGATGTT GTGGCACTCG ACCACTACAT GCCCGGCCAG 
GATGGGCTCC AGACACTCGC TTCCATCCGC GCCGATCCTG ATCCGCCGCC GGTGGTCTAT 
GTGACCGGCT CGGAGGAGGG TCGGGTTGCG ATCGCAGCAC TGAAGGCAGG CGCGACAGAC 
TATGTCCTCA AGGATGTTGG TGGCGAGTTT CTCGCGCTGT TGCGGGTGGC GATTGAAGGC 
GCCCTTGCTC AGGCGGACCT GCGGCGCGAA AAGGAGGAGG CGGAAGCCGA AGTGCGAGCC 
GCGCGTGACC GGTTCGAGGC GCTCGCGGCT GAAAGAGCCG TGCTGCTTCG CGAAGTGAAC 
CACCGGGTCG GTAACAGCCT GCAGCTCGTC TCTACCTTCC TCCTGATGCA AAGCGACATG 
AGCGATGAGC CCCATGTAAA GGCGGCGCTC GCCTCTGCCT ATGGCCGTGT GCTTGCCATC 
GCCCAGGTGC ACAAGCGCCT CTATACGTCA GACGATGTGC GCACAGTCGC GCTCGACAAC 
TATCTCCATG CGCTCGTCGT AGACATTGGC GCCTCCGCGG CCGGCGCGAA CGGGTGGCTC 
TCTCTCGCGG CCGATCCGGT CGCGATAGAC CCAGACCGTG CCGTGGCAGT CGGCGTTATT 
GTCACCGAAT TGATCATCAA TGCGATGAAA CACGCATACC CCCGCGGGGA GGGGCCCGTT 
CGTGTTGCGC TACATGCGCC GGCAGGAAAT AGCGTTTGCC TGTGCGTGGA GGATGATGGA 
CTGGGGAGCC GATTGCCGCC CGCAGAAGGC TCGACGGGGC TTGGGCAGCT CATCATCGAG 
GCCATGGCGG TGAAGCTCGG AGCGGTTGTG ACCGTCCACG CACGCGACCC CGGGACGCGG 
GTCGTTGTCG ATTTCATGAA AGCCGAGGCC AAACGACTGG TGGATTAG

Protein sequence

MALGRVLYID DDPALRRLVG KEFERHGYIV QLAATGDEGL RHLRAGGIDV VALDHYMPGQ 
DGLQTLASIR ADPDPPPVVY VTGSEEGRVA IAALKAGATD YVLKDVGGEF LALLRVAIEG 
ALAQADLRRE KEEAEAEVRA ARDRFEALAA ERAVLLREVN HRVGNSLQLV STFLLMQSDM 
SDEPHVKAAL ASAYGRVLAI AQVHKRLYTS DDVRTVALDN YLHALVVDIG ASAAGANGWL 
SLAADPVAID PDRAVAVGVI VTELIINAMK HAYPRGEGPV RVALHAPAGN SVCLCVEDDG 
LGSRLPPAEG STGLGQLIIE AMAVKLGAVV TVHARDPGTR VVVDFMKAEA KRLVD