Gene Smed_4060 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4060
Symbol
ID	5318883
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	522359
End bp	524017
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	60%
IMG OID	640775867
Product	integral membrane sensor signal transduction histidine kinase
Protein accession	YP_001312800
Protein GI	150376204
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.666301
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGATCA CCCGGAATGA CGCGACTTTG CGTGCGTATC GTCCCGCCAA GGAATTTGCC 
GGGGCGGCGC GTGAATGGTT GTTGCGTACC GACCCGGAAC GCCTGATTTG CCTGGGTCGC 
GTGATCACCG CAGTCTTTGC GATACTGGCG ATCTATCTCG ATCCCACCCG TCCGAACTCG 
ATGCTTTACG AGTCTCGTCT TGTTCTCGGC CTCTACCTTC TCCTCGCGGT TGCCCTGGTG 
TTTTTTCCAC TGCGGTTTTC GTTCGTCAGC CCCGTGCACC TGCTGATCCA CGGCGTCGAC 
GCCGCCGTCG TCGGTTGGCT GACCTTTCTG ACGAACGAAC TGGCGAGCCC GTTCTTCTCT 
ATTCTGCCTT TCGTGATCCT TGCCATGACG ATGCGCTGGG GGCTCAAGGG TGCCTCGCTG 
GGGGCGCTGA TCGCGCTGAT CGTTCAGCTC GTGGTGGGGC TTCCCGATCT CCTGGATGGG 
GACGCCGAGC TCAACATATT CATCATGCGT TCGATCTATT TTGTGCTTAT CGCGGCGACG 
CTCGGCTATT TCGGGGCGTA TCGGGAACGA AGCCGGCAGC GCCTTGCGCA GCTCGCGCAA 
TGGCCGTCTG GCGCGATCGG CGAGGACCGC CTGTCCTGGT TGAGCATCGT CCTGCAGCAT 
GCTTCCGGCG TTCTGGGAGA TGCGCATCTG CTCGTCATCT GGCGCGAACA GGAGTTCGAG 
TCCGGATGCG CCGCATTCTG GACGAGTGGT CGGCTCCAAT TGGCTGACCT GAGGGATCCT 
GAATTCTGGC GGCGCCATGA TCCCGATGGC TGCGACGAAC GCCATTCGAG GAGCGGTGAG 
GCCCTGAACG GCCTTTTCGC CGATCTGCCC CAGATCCACG CGAATGCCGG CCGGCCAAAT 
TGCAAGGTGG TTTCCGCGGC CTTTTCGAGC CTCCGTTACC GGGGCCGCGT TTTCGTTATA 
AGCTACGCAA ATTCAACCGA CGACATGAAA GACCTGACTC AGATCATCGC AACGCGCGTC 
GGGACGGAGC TCGAGCGTGT CGCTCTCATC CAGGCTGCCC GTGCCGAAGG GCGAATGCGA 
CTCGCTCGCG ACCTGCATGA CAGCGTGCTT CAGAATCTCA CGGCCGCGCG CCTCAAACTG 
AAGCTCATCG GTGAAGCTTT CCCCGATGGC GCAAGGCAGA AGCTGATGGA GGTGGGTTCG 
CTCATTCTCG AGCAACAGCA ATGCGTGCGC AAATTCGTCG ATGAGAACCG GCCCGGAGAG 
GAGGGCAATC TCGCGAGGCT CGATCAGGAC CTGCCGGAAT TTCTCGACCT TCTGCGAATG 
CAGTGGAGTT GCAGCATCGA CGTTTCGATC GGATCGCCTG GAATGATGGT CCCGCGATGG 
ATGCTTTTCG AGATAATGCA GCTGATTTCC GAGGCTGTCG CCAATGCAGT GCGCCATGGA 
CGAGCCACAG TGGTGCGGAT CGGCTTTATC GGGAGCGCAG GCCTTCTGGA ACTGGATATT 
TCCGATAACG GCACAGGAAT AGCGGATGGA CTCACGTCCA AGAAGCCCTT CTCGCTGTCG 
CAACGTATTG CGGAACTCGG CGGCAGTCTG GCAATTTGCC GGAGTTCGCC GGGGATCGGT 
CTGACGATCA CGCTGCCGCT AAAGCCGGGG CTCAGATGA

Protein sequence

MAITRNDATL RAYRPAKEFA GAAREWLLRT DPERLICLGR VITAVFAILA IYLDPTRPNS 
MLYESRLVLG LYLLLAVALV FFPLRFSFVS PVHLLIHGVD AAVVGWLTFL TNELASPFFS 
ILPFVILAMT MRWGLKGASL GALIALIVQL VVGLPDLLDG DAELNIFIMR SIYFVLIAAT 
LGYFGAYRER SRQRLAQLAQ WPSGAIGEDR LSWLSIVLQH ASGVLGDAHL LVIWREQEFE 
SGCAAFWTSG RLQLADLRDP EFWRRHDPDG CDERHSRSGE ALNGLFADLP QIHANAGRPN 
CKVVSAAFSS LRYRGRVFVI SYANSTDDMK DLTQIIATRV GTELERVALI QAARAEGRMR 
LARDLHDSVL QNLTAARLKL KLIGEAFPDG ARQKLMEVGS LILEQQQCVR KFVDENRPGE 
EGNLARLDQD LPEFLDLLRM QWSCSIDVSI GSPGMMVPRW MLFEIMQLIS EAVANAVRHG 
RATVVRIGFI GSAGLLELDI SDNGTGIADG LTSKKPFSLS QRIAELGGSL AICRSSPGIG 
LTITLPLKPG LR