Gene Smed_0641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0641
Symbol
ID	5321477
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	689473
End bp	691791
Gene Length	2319 bp
Protein Length	772 aa
Translation table	11
GC content	63%
IMG OID	640789577
Product	multi-sensor signal transduction histidine kinase
Protein accession	YP_001326332
Protein GI	150395865
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.544021
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGACG CGCGACGGGG AAGCGCAGCC GAAGGGCGGT TGCGACTTAA ATTCCCGGGC 
CTTTCGGGCC TCGAACGAGA GTTCATCGAG CAGGCAAAGA TCTTTGCCGA ACCGGCATCG 
CAGAAGCTCG CTATGGCCGA GCCCATGCTC AAGCGATCCA TTCCGGTCCT CATCATCGCT 
TTTCTTCTCA TCGTGGCGAT TTCACGAATG TCGGGAATGA TGGACGAGCA TGCTCGCATG 
GAGGCCTCCT CCCGCCGCAC CGTCAGTCTT ACGGCCGCAG CAGCAGCCGG CGCTTTGCAA 
CCGGACGGGC CGGAGATCTT CACGGACGTC CGCCGCTGGG AGATCGAACA GCGGCTCACG 
GAATTTCTGC CCGCCGACAT GCTGGATGCC GGGATCATCC TGCTGACGGT CCGCAGGGAC 
GGTCGCGTCT TTGCGAGCAC GCAGGATGGC GCCCACCTCG TTGGGCGCAC GCTCTCCGCA 
GTGGCCCCCG AGGTTGCCAC GCTGCAATAT TACGGCGAGG GGGCCGGGAT CGTGAGAGCG 
TCGGTTGATG GTGTCGATCA CTTCATTGCG CTGCGGCAGC TGCCCCACTC CGGCGGCGCG 
GTTCTGGCGG CAACGTCGAT TGCCTCGTTC GAGGCAGCTT GGCGTGATGA AATTTCTCTC 
AATGTCACGC TGTTTGCCGG CGTTTCTGCG ATCCTGATGG TCGTCCTTTA CGCCTACTAC 
ATCCAGGCGA AACGCGCCCG CGACGCCGAT GCGATCTTTG CCGAATCGAA CCTGCGCGTC 
GAAACGGCGC TCTCCCGCGG GCGATGCGGT CTCTGGGACT TCGACCTCGA CAACAGGCGC 
CTCTTCTGGT CACGTTCAAT GTACGAAATG CTCGGCATGC CGGGCGATGC GAGCGTGCTG 
TCGTTCGGCG ACGCCGCCCG GCTCATGCAT GTAGACGACC GGGGCATATA CCGCGTCGCG 
CGGGCGATCG CGAGGGGCAG CGAGCGCCAG ATCGATCAGG TATTCCGCAT GCGCCATGCG 
GACGGCCATT ATGTATGGCT TCGGGCCCGC GCGCAGGTGA TCCGTACCGT CTCAGGCCGG 
ACGCACCTCA TCGGCATCGC GATGGACGTG ACCGAACAGC ATAGGCTCGC CCAGCGCTAC 
GCCGAAGCCG ATCAGCGCCT TGCGGACGCC ATCGAGTGCA CGTCGGAGGC CTTCGTACTC 
TGGGACAAGC ACGATCGCCT GGTCATGTGC AACACTCACT TCCAGCAGGC CTGGCAGTTG 
CCCGACCACG TGCTCGTGCC CGGCACCGAA CGCACGATCG TCCAAGCGGC GGCGGCGCGG 
CCGGTCGTCG AACGGCGCAT CGCCGATCCG GACCGGAGCA ACCACTCCCA GACGAGCGAG 
GTGCAGCTTG CCGACGAACG CTGGCTGCAG ATCAATGAGC GGCGCACGCG CGACGGCGGC 
CTCGTCTCGG TGGGCACGGA CATCACGCTC CTCAAGCGGC ACCAAGTGCG GCTACGCGAA 
TCGGAGCGGC GGCTGATGGC CACCATCGGC GATCTCTCCG CCTCGCGCAT AACGCTCGAG 
CAGCAAAAGG CCGAACTCTC CGTCGCCAAC GCGAATTACC AGGCGGAGAA AGAGCGCGCC 
GAGGCCGCGA ACCGGGCGAA GTCCGAGTTC CTGGCCAACA TGTCGCACGA GCTGAGAACG 
CCTCTGAACG CTATCCTCGG CTTCTCCGAA ATCCTGCAGG ACCAGATGTT CGGACCGCTC 
GGCTCGGAGA AGTACCACGA ATATTCCCGC GACATTTTCG AAAGCGGCAA GCACCTGCTC 
AACGTCATCA ACGACATTCT CGACATGTCG AAGATCGAGG CAGGCCACAT GCGCATCACG 
CGCGAGAGGA TAGATCTCGC GCCGCTTATC GAGGAGACGC TCCGTTTCAC CACAATTCCG 
GCGGAACAGA AGAACATCCG CGTCGTCCAG CAGGTATCTT CCGGTCTGAC GATGTTCGCA 
GACCGCCGGG CGATGAAGCA GGTCCTGCTC AACCTGCTGT CCAATGCCGT CAAGTTCACC 
AATGAGGGGG GGCGCATTTC GCTCCGGGCC CGAAAGGTCA GAGGCGCGGT CACCCTCACC 
ATCGCCGATT CCGGGATCGG TATTCCCAGG GATGCCTTGC AAAAGATCGG CCAGCCATTC 
GAACAGGTGC AGAGCCAATA TGCCAAGAGC AAGGGCGGTT CGGGGCTCGG GCTTGCCATC 
TCCCGCTCGC TTACCCGCCT TCACGGCGGC AGCATAAAGA TCCACTCGAC AGAGAATGTC 
GGCACCATCA TTTCGGTCAG AATCCCCGAC CGCGCCTGA

Protein sequence

MADARRGSAA EGRLRLKFPG LSGLEREFIE QAKIFAEPAS QKLAMAEPML KRSIPVLIIA 
FLLIVAISRM SGMMDEHARM EASSRRTVSL TAAAAAGALQ PDGPEIFTDV RRWEIEQRLT 
EFLPADMLDA GIILLTVRRD GRVFASTQDG AHLVGRTLSA VAPEVATLQY YGEGAGIVRA 
SVDGVDHFIA LRQLPHSGGA VLAATSIASF EAAWRDEISL NVTLFAGVSA ILMVVLYAYY 
IQAKRARDAD AIFAESNLRV ETALSRGRCG LWDFDLDNRR LFWSRSMYEM LGMPGDASVL 
SFGDAARLMH VDDRGIYRVA RAIARGSERQ IDQVFRMRHA DGHYVWLRAR AQVIRTVSGR 
THLIGIAMDV TEQHRLAQRY AEADQRLADA IECTSEAFVL WDKHDRLVMC NTHFQQAWQL 
PDHVLVPGTE RTIVQAAAAR PVVERRIADP DRSNHSQTSE VQLADERWLQ INERRTRDGG 
LVSVGTDITL LKRHQVRLRE SERRLMATIG DLSASRITLE QQKAELSVAN ANYQAEKERA 
EAANRAKSEF LANMSHELRT PLNAILGFSE ILQDQMFGPL GSEKYHEYSR DIFESGKHLL 
NVINDILDMS KIEAGHMRIT RERIDLAPLI EETLRFTTIP AEQKNIRVVQ QVSSGLTMFA 
DRRAMKQVLL NLLSNAVKFT NEGGRISLRA RKVRGAVTLT IADSGIGIPR DALQKIGQPF 
EQVQSQYAKS KGGSGLGLAI SRSLTRLHGG SIKIHSTENV GTIISVRIPD RA