Gene RSc2233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSc2233
Symbol	thrB
ID	1221078
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ralstonia solanacearum GMI1000
Kingdom	Bacteria
Replicon accession	NC_003295
Strand	+
Start bp	2422915
End bp	2423919
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	68%
IMG OID	637238632
Product	homoserine kinase
Protein accession	NP_520354
Protein GI	17546952
COG category	[R] General function prediction only
COG ID	[COG2334] Putative homoserine kinase type II (protein kinase fold)
TIGRFAM ID	[TIGR00938] homoserine kinase, Neisseria type

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGTTT TCACCCCGGT CACCAACGCC GAGATCGCCC TCTGGCTGGA GCAATACGAC 
GTGGGCACGG TCCGCGCGCT GCGCGGCATT CCCTCGGGGA TCGAAAACAC CAACTTCTTC 
CTGACCACGG AGAAGGACGG CGCCACGCAC GAGTACGTCG TCACGCTGTT CGAGCGGCTG 
ACCAGCGAGC AACTGCCGTT CTACCTGTAC CTGATGCAGC ATCTGGCGCA GCACGGCATC 
TGCGTGCCGG CGCCGATTCC CGGCCGCGAC GGCGCGATCC TGCGCCCGCT CAAGGGCAAG 
CCGGCGACCA TCGTGACGCG CCTGCCCGGA CGCTCGAACC TGGCGCCCAC GACGAGCGAA 
TGCGCCATCG TCGGCGACAT GCTGGCGCGC ATGCACCTGG CCGGCCGCGA CTACCCGCGG 
CACCAGCCCA ACCTGCGCAG CCTGCCGTGG TGGAACGAAG TGGTGCCCGA CATCCAGCCC 
TTCGTGCAGG GCGCCACGCG CGAGCTGCTG GTCGCCGAGC TGGCCCACCA GCAGCGCTTC 
TTCGGCAGCG CCGACTATGC CGCCCTGCCC GAGGGCCCGT GCCACTGCGA CCTGTTCCGC 
GACAACGTGC TGTTCGAGCC GGCCACTGAC AGCCAGCCCG AGCGCCTGGG CGGGTTCTTC 
GATTTCTATT TCGCCGGCGT CGACAAATGG CTGTTCGACG TGGCCGTGAC CGTCAACGAC 
TGGTGCGTCG ACCTCGCCAC GGGTGCGCTC GATGCCGAAC GGATGCGCGC CATGCTGCGC 
GCCTATCACG CGGTGCGGCC TTTCACCGAC GCGGAGGCCC GTCACTGGCG GGACATGCTG 
CGCGCCGCGG CCTATCGCTT CTGGGTATCG CGCCTGTGGG ACTTCCACCT GCCGCGCGAC 
GCCGAACTGC TGCAGCCGCA TGATCCGACC CACTTCGAGC GCGTGCTGCG CGAACGGGTG 
CGCGCCGAGG GGCTGACATT GGATATTCCC GAACCATGCA ACTGA

Protein sequence

MAVFTPVTNA EIALWLEQYD VGTVRALRGI PSGIENTNFF LTTEKDGATH EYVVTLFERL 
TSEQLPFYLY LMQHLAQHGI CVPAPIPGRD GAILRPLKGK PATIVTRLPG RSNLAPTTSE 
CAIVGDMLAR MHLAGRDYPR HQPNLRSLPW WNEVVPDIQP FVQGATRELL VAELAHQQRF 
FGSADYAALP EGPCHCDLFR DNVLFEPATD SQPERLGGFF DFYFAGVDKW LFDVAVTVND 
WCVDLATGAL DAERMRAMLR AYHAVRPFTD AEARHWRDML RAAAYRFWVS RLWDFHLPRD 
AELLQPHDPT HFERVLRERV RAEGLTLDIP EPCN