Gene Smed_0041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0041
Symbol
ID	5320868
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	42491
End bp	43546
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	62%
IMG OID	640788972
Product	PhoH family protein
Protein accession	YP_001325736
Protein GI	150395269
COG category	[T] Signal transduction mechanisms
COG ID	[COG1702] Phosphate starvation-inducible protein PhoH, predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0000000833124
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGAACGGAC ACGAACTGAT TTCTTCCTCA CCGCGCCAGT CGAAGACATC CGCGACGGAC 
GCCAATCACT TCGTGCTCAC CTTCGAGAAC AACCGCTTTG CGAGCGAACT CTTCGGCCAG 
TTCGACCAGA ATTTGAAGCT GCTTGAAGAG CGGTTGCGCA TCGATGCCCG ACCGCGGGGA 
AACTCCGTCG CAATCTCCGG TGACGTGGTT GCCACCAATC AGGCGCGCCG CGCTCTCGAC 
TATCTCTACG GAAGGCTGCA GAGTGGCGCT TCGATCGATA CATCAGATGT CGAAGGGGCG 
ATCCGCATGG CGGTCGCCGC CGACGATCAG CTACAGTTGC CGACGATGGA GCGCAAAGCC 
AAATTGACAA TGGCCCAGAT TTCGACGCGC AAGAAGACCA TCGTTGCGCG CACTCCGATG 
CAGGATGCCT ATATCCGCGC GATGGAGCGG TCGGAACTCG TCTTCGGCGT CGGCCCGGCC 
GGCACCGGCA AGACCTACCT TGCCGTCGCT CATGCCGCCC AGCTGCTGGA GCGTGGCGCA 
GTCGACCGTA TCATTCTCTC AAGGCCGGCG GTCGAAGCGG GCGAGCGTCT CGGCTTCTTG 
CCGGGCGACA TGAAGGAGAA GGTCGATCCC TATCTCAGAC CTCTCTATGA CGCGCTCTAT 
GACATGATGC CGGGCGACAA GGTGGAGCGG GCAATCACCG CAGGTGTAAT CGAGATCGCG 
CCGCTTGCCT TCATGCGCGG GCGCACGCTC GCCAATGCCG CCGTTATCCT GGATGAGGCA 
CAGAACACGA CATCGATGCA GATGAAGATG TTCCTGACGC GTCTGGGCGA AAACGGCCGG 
ATGATCATCA CGGGTGATCC GAGTCAGGTC GACCTGCCGC GCGGCGTGAA GTCGGGCCTG 
GTGGAGGCGC TGCAGATACT CAAGGGAGTA GAGGGCGTCT CGGTGATCCG CTTCAAGGAC 
GCCGACGTCG TCCGCCATCC GCTGGTGGCG CGGATCGTCA GAGCCTATGA CAGCCAGACG 
GCGGTTCACG ACGAGAGCGA GCAGGGCGAT CGTTGA

Protein sequence

MNGHELISSS PRQSKTSATD ANHFVLTFEN NRFASELFGQ FDQNLKLLEE RLRIDARPRG 
NSVAISGDVV ATNQARRALD YLYGRLQSGA SIDTSDVEGA IRMAVAADDQ LQLPTMERKA 
KLTMAQISTR KKTIVARTPM QDAYIRAMER SELVFGVGPA GTGKTYLAVA HAAQLLERGA 
VDRIILSRPA VEAGERLGFL PGDMKEKVDP YLRPLYDALY DMMPGDKVER AITAGVIEIA 
PLAFMRGRTL ANAAVILDEA QNTTSMQMKM FLTRLGENGR MIITGDPSQV DLPRGVKSGL 
VEALQILKGV EGVSVIRFKD ADVVRHPLVA RIVRAYDSQT AVHDESEQGD R