Gene Smed_0215 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0215
Symbol
ID	5321047
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	239780
End bp	240880
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	63%
IMG OID	640789150
Product	HPr kinase
Protein accession	YP_001325909
Protein GI	150395442
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.623305
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTTCC GCGTCTCCGA TGGGGCACGA TTTTTTCTGC TTGGACAACG CAAGACTATT 
TTCGTTGAAG CGTCGCAGCA GATTTTTGAG GTCGATGATC TCACGGCCTA TCTCACCTGC 
GTGCTCGCCG TGCCTGCGTC TCAGCGCCAG CTCGAAGTCG ATCTCGTCGC GCGTGGCGCC 
GAACGGGCCG AGGCCCGGAG ATCGGTGCGG GAATATCTTC ACTACTGGTG CCGCCATGGT 
CTGCTGGAGA TTGCCTTCGA CGCCGAGGAG GGGGAGCCGC TGCACACGCA TGTGCTTGAT 
TTACAGGGAG CTGCCGCCTC GATAGCCTAT CACGACAAAG GGCTCCTCGA TCTTCTCCTG 
CCCATATTCG GTCATCTGGC ATCACCGGGC CTCAAGCCTT CCGTCTCCTA TGGCGTGGCA 
AGGTTCGGCA GCCAAGCGTG CATCAGCCGC AACCGTTCCC CAGGCCGAAT CGTCCGGGTT 
GAAGAGGTGG CGCCGGTGCT GAAAGCGCTG CTGACGGAGG ATGTGCTGGC AAGCCTCGGC 
CCTGACGTCG CGCTTCACGC CGCTCTTCTG GTCAGGAACG CAAAGGGCCT TCTGATTTGC 
GGCGCGCCCG GGGCGGGCAA ATCGACGCTA ACGCTTGCGC TCCTCGAAGC AGGCTTTGCC 
TGCGGCGGTG ACGATATCAC GCTGATGAGG CCAGACGGCC TGCTTCAGGG CGTGCCCTTT 
GCACCCGCCC TGAAGCGCGG CTCCTGGCGC CTTCTCGAAA ACATGCGCGC TTCGGTCGAG 
GCGGCGCCGG TCCACCGTCG CCTCGACAAC AGACATGTCC GCTATCTCGC GTCGATCCCC 
TTCGCATCCG ACGATCCCGT CAAGCTCGGC ACTATCGTGC TTCTGCGCCG CCGCAAGGGA 
CGGGCGGCAA TTGCCGCCGT CGAGCCGGCG CGGGTTCTGT CGGAACTCTT TCGCGGCGCT 
TTCACTCCGG CACGCGGGCT CGGTCTGCCG CAATTCGACG CTTTGCTGAG TGCTGTCCGC 
GGCGCCAGCG CCATCGAGCT ATCCTATACG CGGCTGGATG AGGCCGTAGA GATGCTGAGC 
AGCCATCATG AAGGCGCGTA G

Protein sequence

MKFRVSDGAR FFLLGQRKTI FVEASQQIFE VDDLTAYLTC VLAVPASQRQ LEVDLVARGA 
ERAEARRSVR EYLHYWCRHG LLEIAFDAEE GEPLHTHVLD LQGAAASIAY HDKGLLDLLL 
PIFGHLASPG LKPSVSYGVA RFGSQACISR NRSPGRIVRV EEVAPVLKAL LTEDVLASLG 
PDVALHAALL VRNAKGLLIC GAPGAGKSTL TLALLEAGFA CGGDDITLMR PDGLLQGVPF 
APALKRGSWR LLENMRASVE AAPVHRRLDN RHVRYLASIP FASDDPVKLG TIVLLRRRKG 
RAAIAAVEPA RVLSELFRGA FTPARGLGLP QFDALLSAVR GASAIELSYT RLDEAVEMLS 
SHHEGA