Gene Smed_5321 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5321
Symbol
ID	5319623
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	279301
End bp	280554
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	63%
IMG OID	640777095
Product	putative signal transduction histidine kinase
Protein accession	YP_001314027
Protein GI	150377432
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0967984
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCACA TGGCGCCGGC AGCACTGGTC GATCACTATC TCGGTATTTC GCGGCTGTTA 
GCCGGTCAGC TCGATTTTCG TTCAGCGATC CGGGCCGTCG CGGCCGAGAT TGCGCACATC 
ATTCCGCACG ACCATCTGGA CGTGTGCATT TTGATCGTGG ACGGCAACTA TCACACGGCG 
TACGAAACCG GCATGGACAC CGCTTGGGGA AACGCCGCCT CGGCGCCGGT CGTCAACAGT 
CCGATACGCA GCCTTCTCTG GGGGGAAGTA GATTATCTGC TGACGGACGA TGCGATCAAC 
GATGCGCGGT TTCACTTTGA GGGCGCCTTC AAACGGCCGA TCATCGAACA GTCCCTGCGC 
AGCCGGCTGC ACGTGCCGCT GAAGGTTCAG GGCGCGATCA TCGCAGCGCT CAGTTGTTCG 
TCGCAGAGTC CGGGCGTCTA TGGCATGGAG CACGTCGACC GGGCACGCAT CATTGCCGAT 
CTCCTGGCAC CCTATTTCTT CGCGCTGCGT GCCGCCGAAC AGGCGCAGCA GTCGGCCATA 
GTCGAGGCGG AAGCGCGGGC ACGCGAGGAA GGCCTGCGGC AAGGGGCGCT GAAGTTGACG 
GAGGCGCTGG AGCAGGAGCG TCAGCGAATC GGAATGGACC TCCATGACCA GACGCTAGCG 
GATCTTACCC GGCTTGCGCG CCGCGTCGAT CGGCTTGCGC GTTCCGGGGA ACTGACCAGT 
GAAGCGCTGG AGCCGGTGTC GCGCGGGCTG CAACACTGCA TGCAGGATCT CAGGCAGATC 
ATCGAGCAGG CGAAACCATC TGTTCTCCAG CTTTTCGGCC TCGCGCAGGC TATCGAGAAC 
CATCTCGACC GGTCGGTTCG CGATAGCAAC ACGCCGGTTG AATGGGCGAT CGTCGACGAG 
ACCGCAGGCG CCCTCGACAC ACTCGAACCG ACCGTCAGCG TTGCGCTCTT CCGGATCGCC 
CAGGAAGCGA TCAACAATGC GGTCCGTCAC GCCCAGCCGC TCGCAATCAC CGTTCGGCTT 
CGGGCCGAAG CGAAGCAGCT TGCGTTGGAG ATAACGGACG ACGGGCGCGG CCTTGCGCGA 
TCTCGCGGTC GCGTCGGCGG CGGCATTGAC AACATGAAGA CGCGCGCGCG GCTAATCTCG 
GCGAAGTTCG TGATCGGCCC CGGACGCAAT AACCGCGGAA CGACGGTCAC CGTCTCGTTG 
CCGCTCGAGC GGGATGCGGA AATTGCAGCA ATGGGCCAGG AGGATCGGCA ATGA

Protein sequence

MPHMAPAALV DHYLGISRLL AGQLDFRSAI RAVAAEIAHI IPHDHLDVCI LIVDGNYHTA 
YETGMDTAWG NAASAPVVNS PIRSLLWGEV DYLLTDDAIN DARFHFEGAF KRPIIEQSLR 
SRLHVPLKVQ GAIIAALSCS SQSPGVYGME HVDRARIIAD LLAPYFFALR AAEQAQQSAI 
VEAEARAREE GLRQGALKLT EALEQERQRI GMDLHDQTLA DLTRLARRVD RLARSGELTS 
EALEPVSRGL QHCMQDLRQI IEQAKPSVLQ LFGLAQAIEN HLDRSVRDSN TPVEWAIVDE 
TAGALDTLEP TVSVALFRIA QEAINNAVRH AQPLAITVRL RAEAKQLALE ITDDGRGLAR 
SRGRVGGGID NMKTRARLIS AKFVIGPGRN NRGTTVTVSL PLERDAEIAA MGQEDRQ