Gene RPD_4117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4117
Symbol	hisZ
ID	4024639
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	4581817
End bp	4582974
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	68%
IMG OID	637964325
Product	ATP phosphoribosyltransferase regulatory subunit
Protein accession	YP_571237
Protein GI	91978578
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3705] ATP phosphoribosyltransferase involved in histidine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAGA CCGCCGCCGC TCGAGCGACC GGATCCGCCG AGTGGGCGGA GGCGCTGCTG 
CAATCGTTCA CCAAGGCCGG CTATGTCCGG GCCGAACCGG CGATCCTGCA GCCTGCGGAG 
CCGTTCCTCG ACCTCTCCGG CGAGGATATC CGCAAGAACC TCTACCTCAC CACCGACGGC 
AGCGGCGAAG AGTTGTGCCT GCGGCCCGAC CTGACGATTC CCGTGGCGCG GGACTATCTC 
GCCTCGCCGG GCGCGGGTCA GCCGACCGGC TTCTGTTATC TCGGCCCGGT GTTCCGGCAG 
CGCAGCGGCA AGCCGAGCGA GTTCCTCCAG GCCGGGATCG AATCATTCGG CCGCCAGGAC 
CGCGCCGCGG CCGACGCCGA GATGCTGGCG CTGGGACTGG AAGCCACGAC GGCGTTCGGC 
GTCGGCGAGG TCGACATCCG CACCGGCGAC GTCGCGCTGT TCTCCGCGCT GATCGATGCG 
CTCGGCCTGT ATCCGGTGTG GCGGCGGCGG CTGATGAAGG ATTTCAACCG CAAGGTGAGC 
CTCGCGCAGG ACCTCGAGCG GCTGACGCTC GCGACCTCCG GCGGCAACGA ATATGAGGGC 
GTGCTCGCGG CGCTGGCCGG CTCCGACCGC AAGGCGGCGC TGGCGCTGGT CACCGACCTG 
ATGTCGATCG CCGGCGCGAC CACGCTCGGC GGCCGCTCGG TCGCTGAGAT CGCCGACCGC 
TTTCTCGAAC AATCGACGCT GAAGAGCGGC GCCTTGCCGC GCGACGCGCT GCAGAAAATT 
CAACGCTTTC TCGCGATCAG CGGCGATCCG AACGAGGCGC TGACGCAGCT GCGCGCGCTT 
GCCGCCGACG CCAAGCTCGC GATCGAGCCG GCGATCGATC AGTTCGAGAG CCGGATCGGT 
TTCATGGCCG CGCGCGGCAT CGATCTGAAG AAAACGCGGT TCTCGACTTC GTTCGGCCGC 
GGCGTCGATT ATTATACCGG GTTCGAATTC GAACTGCACC GCGCTGGCAA CGGCGACGAT 
CCGCTGGTCG CCGGCGGGCG CTATGACGGG TTGATGACTC AGCTCGGCGC CGCCGCGCCG 
ATCCCCGCGG TCGGCTTCTC GATCTGGATC GAGGCGATGA CGCAGTCCGG CCCCGCCAAA 
ACTGGGAGCG CGTCATGA

Protein sequence

MTKTAAARAT GSAEWAEALL QSFTKAGYVR AEPAILQPAE PFLDLSGEDI RKNLYLTTDG 
SGEELCLRPD LTIPVARDYL ASPGAGQPTG FCYLGPVFRQ RSGKPSEFLQ AGIESFGRQD 
RAAADAEMLA LGLEATTAFG VGEVDIRTGD VALFSALIDA LGLYPVWRRR LMKDFNRKVS 
LAQDLERLTL ATSGGNEYEG VLAALAGSDR KAALALVTDL MSIAGATTLG GRSVAEIADR 
FLEQSTLKSG ALPRDALQKI QRFLAISGDP NEALTQLRAL AADAKLAIEP AIDQFESRIG 
FMAARGIDLK KTRFSTSFGR GVDYYTGFEF ELHRAGNGDD PLVAGGRYDG LMTQLGAAAP 
IPAVGFSIWI EAMTQSGPAK TGSAS