Gene Smed_0404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0404
Symbol	hisZ
ID	5321238
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	434278
End bp	435411
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	66%
IMG OID	640789339
Product	ATP phosphoribosyltransferase regulatory subunit
Protein accession	YP_001326096
Protein GI	150395629
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3705] ATP phosphoribosyltransferase involved in histidine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.133547
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0561317
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTCTCA TTGATCTTCC CGGTTTCGCC GGCGACCTCC TTGCGGATTT CGAACGCCGG 
AACACGCTGC GCGTCGACAC GCCGGTCATC CAGCCTGCCG AGCCTTTCCT CGACATGGCC 
GGGGAAGACC TGCGCCGGCG GATCTTCATG ACCGAGAGCG AAACCGGCGA GAGCCTGTGC 
CTGCGGCCGG AGTTCACCAT CCCCGTCTGC CTGCGACATA TCGAGACCGC AACCGGAACG 
CCGCAACGCT ACGCCTATCT GGGCGAGGTG TTCCGGCAGC GCCGCGACGG ATCGAGCGAG 
TTCTACCAGG CGGGCATCGA AGATCTGGGC GATCCGGATA CGGCCGCCGC TGATGCGCGG 
GTGGTCGGTG ATGCCTTGTT CGTCCTTTCC AATCGACTGC CGGGCGAGCG GCTGAAGGTC 
ACGCTTGGCG ACCAGTCGGT CTTCGAAGCG GTGATTGCCG CCTGTGGCCT GCCCGGCGGT 
TGGCAGAAAC GGCTCATTCA TGCCTTCGGG GATCAGAAGC AGTTGGACAG GCTCTTGGCC 
GAGCTGGCCG ACCCGAAATC GCCCGGCGTC TTCGGCCACG ACGTCGAGCG CGTCGCAGCC 
TTGGGCATGC TCGACGACGA AGAGCGGCTC GTCGCTCATA TCGGCGAGAC GATGGAGGCG 
ACCGGTTATT CGACCAATGC CAGCCGCTCG CCCCGCGATA TCGCCCGGCG CCTGAAGGAA 
AAGGTCGAAC TTGCAGCCAC CCGGCTGGAC AAGGAAGCGC TTGCCGTCAT GCGCGCGTTC 
CTCGCTCTTG ATCTGCCGCT CGCCGACGCT CCGGCCGCGC TCCACAGCTT CGCCGGCAAG 
GCGCGTCTGA GGATCGACGA CGCGCTGGAA CTCTTCGATG CGCGCGTGGC TGCGCTCGCA 
TTGGCGGGCG CCGATCCCGG CCCGATGCGT TACCGCGCCG CCTTCGGACG ACCGCTCGAC 
TATTACACGG GCCTCGTCTT CGAAATCCAC GTCGAAGGCA CCCCCGCAGT GCTCGCCGGC 
GGCGGCCGGT TCGACCGCCT CCTCACCTTG CTCGGCGCTC GTGAGCATAT TCCGGCCGTC 
GGCTTTTCTC TTTGGCTCGA CCGGATAGAA CAGGCTGCGG GGAGAGAGAA ATGA

Protein sequence

MPLIDLPGFA GDLLADFERR NTLRVDTPVI QPAEPFLDMA GEDLRRRIFM TESETGESLC 
LRPEFTIPVC LRHIETATGT PQRYAYLGEV FRQRRDGSSE FYQAGIEDLG DPDTAAADAR 
VVGDALFVLS NRLPGERLKV TLGDQSVFEA VIAACGLPGG WQKRLIHAFG DQKQLDRLLA 
ELADPKSPGV FGHDVERVAA LGMLDDEERL VAHIGETMEA TGYSTNASRS PRDIARRLKE 
KVELAATRLD KEALAVMRAF LALDLPLADA PAALHSFAGK ARLRIDDALE LFDARVAALA 
LAGADPGPMR YRAAFGRPLD YYTGLVFEIH VEGTPAVLAG GGRFDRLLTL LGAREHIPAV 
GFSLWLDRIE QAAGREK