Gene Smed_5895 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5895
Symbol
ID	5320197
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	860073
End bp	861143
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	58%
IMG OID	640777590
Product	signal transduction histidine kinase
Protein accession	YP_001314522
Protein GI	150377927
COG category	[T] Signal transduction mechanisms
COG ID	[COG3920] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.677371
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.686603
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTCCG ATAATGTGCC TGAACAAGTC GATCGGCTTC TCGGCAATTC CGACCTCGTG 
GAAGCTCTCG AAAACAAACA GTTCAAACGA TTTCTCGATC AAGTGCCGAT CGCTCTCGTG 
ATCTCCAGAA TCGGTAGCGG GGGCGAACGG ATAATCTACG CGAATCCCGA ATTCGAGAGG 
CTCTCGGGAT TGGCGGTGGC GGAGGTCGAG AACCAGGAAT GGGCCGTGCT TGAAGCAGTG 
CCCGCGGCCG CACAGGAGGG AGCATCGCTC GGTCAAGCCG TTACTGCCGG GACCGACCGC 
ATCGGAACTT ACAAAAGGAA TGCGGGAGAC TCGACCGCCC TGCTCGACGT CTATTCAAAT 
GTGGTCGAAG ACGACGAAGG AACGCCGTGC TTCCGCCTCG TCGCACTTGT GGATGTTACC 
GAGCACAAGC AGACCGAACG CGAGGAGCTC GAAAGTCGCA TTAAGGAGCA GGATCTCCTG 
CTTCGGGAGC TGCAGCATCG TGTGAAGAAT AATCTTCAGA TGATAACGGC GCTCATCCGT 
CTCGAAGCTC GCGGCAACCC GCCTCCCGAC ACGCGCTCTT TCGAAAGGTT GGCGGGCCGT 
GTCGAAGCAC TCACCACCCT TTATGACGCC ATGGCTAATG GCGACAGCAG CCAGGAAGTC 
GATCTCGGCA CCTATATCGG TCAGATCGCA GCTGCCGTCA TGGCCTCGAA CGCCTGCGAT 
GGGGTCAGCC TCGACATGAA AATCGATCCC TATCCGGTTT CCGTCAACGT CGCCATGCCA 
ACTGGACTGG TCGTCAACGA GCTGCTCACC AACGCGCTCA AGCATGCTTT CAACGGCCGC 
GAAGGAGGAG TAATCACGCT GCGAAGCACT TTTGAGGATG ATGGCTACCG TGTCATCGTT 
GCGGACGACG GAATAGGTTT CCCGGACGGA GAGACCTGGC CCAAACACGG CAAGCTTGGC 
GAGTTGATCG CGCAGTCGCT TCGCGAAAAT TCCAGGGCTG ATCTCCAGGT GATCTCCACG 
CCGGGTCAAG GCACACGCGC AACGATTCGT TTCCGGAACG ACTCCGTATA G

Protein sequence

MTSDNVPEQV DRLLGNSDLV EALENKQFKR FLDQVPIALV ISRIGSGGER IIYANPEFER 
LSGLAVAEVE NQEWAVLEAV PAAAQEGASL GQAVTAGTDR IGTYKRNAGD STALLDVYSN 
VVEDDEGTPC FRLVALVDVT EHKQTEREEL ESRIKEQDLL LRELQHRVKN NLQMITALIR 
LEARGNPPPD TRSFERLAGR VEALTTLYDA MANGDSSQEV DLGTYIGQIA AAVMASNACD 
GVSLDMKIDP YPVSVNVAMP TGLVVNELLT NALKHAFNGR EGGVITLRST FEDDGYRVIV 
ADDGIGFPDG ETWPKHGKLG ELIAQSLREN SRADLQVIST PGQGTRATIR FRNDSV