Gene Smed_2344 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2344
Symbol
ID	5323205
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	2420305
End bp	2421807
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	63%
IMG OID	640791282
Product	signal transduction histidine kinase
Protein accession	YP_001328011
Protein GI	150397544
COG category	[T] Signal transduction mechanisms
COG ID	[COG2203] FOG: GAF domain [COG3920] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00211814
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATGAAA AGACAGAGGC GATGCTCCCA GCCGTAGCGC AGGTGCTCGA TGCGCCGGAA 
CGGCTCGGCG TTCTTCAGGC CGCGGTGCCG GACATGTCGA TCCCAGACGG GGATTTCGAC 
GGGCTTGCGG GGCTTGCGGC CAGCCTTTTC GATGCGCCGG TCGCCCTCAT CACCCTCGTG 
GACCACGAAT GGCAGTGGTT CAAGGCTTCC GTCGGCACGG CGGAAACGCG GCTGCACGTT 
CGTGAGTCGT TCTGCGTCCA TACGATCGCA GAAGGCGACG GCGCCTTTGT CGTGCTCGAT 
GCCTCTCGCC ACCCGGCGTT CAGACAGCGT CGGGCGGTCG CCGGCCCGCC CTCCGTGCGC 
TTCTATGCGG GCGCCCCGAT CATTCTGGAC GGGCAGGCGA TAGGAACAGT CGCGGTCGTC 
GACGTCGCTC CCCGTTTCGA GATATCCGTC AAGCAGCAAG GCGAGCTGCA GCGCATCGCA 
GGCGTCGCCG CCTCGCTGTT CAAACTGAAG GACGAAACAC GCCGGCGTGC GCTCAAGGAG 
GCCGCGCTTT CCCGCGAAGA GCAGCGGCTT GCCATGGCGC TCGATGCGGC CAATGTCGGC 
AGCTGGCTCT GGGACATTCG GGCCGGCACG GTTTCGGGCA ACGGCGCAAT GATGCGCATG 
TTCGGCCTTC CGCCAGAACG CACCGTTGGC GCCAAGGCCA TATTTTCCGC CATCCATCCC 
GACGATCGCA TGCCGACCTT CTCGAAACTT CGCCAGGCGA TGGCTGCCAA TGAGGAATAT 
GACGGCATGT TTCGCATCGG CACCAATGGA AGGTGGCTGC TTGGCCGCGG CCGTGTGCAC 
GACCGCGACA GCAAGGGTGC ACCCTTGAGC TTTCTCGGCA TGACGATCGA TGTTTCGGAG 
CAGCAGGCGT CGGTGAACCG CACGCGGCTG CTGCTGAAGG AACTGAACCA CCGGGTCAAG 
AACACGCTGG CAATGCTCCA GTCACTCGCC CGCCAGACGC TTCGCCAGAC GAGCGACCCG 
GCCGAATTCA TGACCGCCTT CGCCGGCAGG CTTCAGGCGA TCTCCGAGGC GCATGGGCTC 
CTTTCCGATT ACGAATGGGG CACGATCCAC CTGTCCGAAC TGATTTCGAA ACAGTTGCTG 
CCCTATGTCA GCGATTACTC CCAACAGATC GAATTGCACA AGGATGAGAT CCTGCTTGGT 
CCGGACCAGG CCGTGGGGCT CGGGCTGGTT CTGCACGAAC TGGCGACCAA TGCCGTAAAA 
TACGGCGCTC TCTCGCTGCC GACGGGAAAA ATCGTGCTGA CGGCCCGCCG CTTAATCGAG 
GACGGAGAAT CCGTGTTGCA TCTGACCTGG ACTGAAGTGG GCGGCCCCCC GATTCGCGAG 
CCGCGCCGCC GCGGTTTCGG ATCTATCCTG ATCGAACGCA GCCTCGACAA GATCATCGGC 
AGCTCGGTCA AGGTAGAATA TCTGCCGGCG GGAGTCACCG CGTTGATCCG GCTGCCGCTT 
TGA

Protein sequence

MHEKTEAMLP AVAQVLDAPE RLGVLQAAVP DMSIPDGDFD GLAGLAASLF DAPVALITLV 
DHEWQWFKAS VGTAETRLHV RESFCVHTIA EGDGAFVVLD ASRHPAFRQR RAVAGPPSVR 
FYAGAPIILD GQAIGTVAVV DVAPRFEISV KQQGELQRIA GVAASLFKLK DETRRRALKE 
AALSREEQRL AMALDAANVG SWLWDIRAGT VSGNGAMMRM FGLPPERTVG AKAIFSAIHP 
DDRMPTFSKL RQAMAANEEY DGMFRIGTNG RWLLGRGRVH DRDSKGAPLS FLGMTIDVSE 
QQASVNRTRL LLKELNHRVK NTLAMLQSLA RQTLRQTSDP AEFMTAFAGR LQAISEAHGL 
LSDYEWGTIH LSELISKQLL PYVSDYSQQI ELHKDEILLG PDQAVGLGLV LHELATNAVK 
YGALSLPTGK IVLTARRLIE DGESVLHLTW TEVGGPPIRE PRRRGFGSIL IERSLDKIIG 
SSVKVEYLPA GVTALIRLPL