Gene RPB_1846 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1846
Symbol	hisZ
ID	3909005
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	2112282
End bp	2113439
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	70%
IMG OID	637883740
Product	ATP phosphoribosyltransferase regulatory subunit
Protein accession	YP_485465
Protein GI	86748969
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3705] ATP phosphoribosyltransferase involved in histidine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.000726333
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGACCAAGA CCGCCGCCGC TCGCGCGACC GGATCCGCCG AGTGGGCGGA GGCGCTGCTG 
CAATCCTTCG GCCAGGCCGG CTATGTCCGG GCCGAGCCGG CGATCCTGCA GCCGGCCGAC 
CCGTTCCTCG ACCTCTCCGG CGAGGACATC CGCAAGAGCC TCTATCTCAC CACCGATTCC 
AGCGGCGAAG AGCTGTGCCT GCGCCCCGAC CTGACGATTC CCGTCGCGCG CGACTATCTC 
GCCTCGGCTA TCGCCGGCGA GCCGGCCGGG TTCTGCTATC TCGGCCCGGT GTTCCGCCAG 
CGCGGCGGCA AGCCGAGCGA ATTCCTGCAG GCCGGCATCG AATCCTTCGG CCGCCAGGAC 
CGCGCCGCCG CGGATGCCGA AATGTTGGCG CTCGGGCTGG AAGCCACCAG CGCGTTCGGC 
CTCGGTGAGG TCGACATCCG CACCGGCGAC GTCGCGCTGT TCTCGGCGCT GATCGATGCG 
CTCGGGCTGT ATCCGGTGTG GCGGCGGCGG CTGATGAAGG ATTTCAACCG CCAGGCCAGC 
CTGGCGCAGG ACATCGAACG GCTGACGCTC GCGACCTCCA GCGCCAACGA ATACGAAGGC 
GTGCTGGCGG CGCTGGCCGG CTCCGACCGC AAGGCGGCGC TGGCGCTGGT CACCGACCTG 
ATGTCGATCG CCGGCGCCAC GACGCTCGGC GGTCGCGCGG TCTCCGAGAT CGCCGACCGC 
TTCCTCGAAC AGTCGACGCT GAAGAGCGGC GCCCTGCCGC GCGACGCGCT GCAGAAGATC 
AAGCGCTTTC TCGCCATCAG TGGCGCTCCG CAGGACGCGC TGACGCAGCT TCGCGCGCTC 
GCCGCCGACG CTCAGCTCGC GATCGATGCG GCGATCGATC AGTTCGAGAG CCGGATCGGC 
TTCATGGCGG CGCGCGGCAT CGACCTGACG AAGACCCGGT TCTCGACCTC GTTCGGCCGC 
GGCGTCGATT ACTACACCGG CTTCGAATTC GAGCTGCACC GCGCCGGCAA TGGCGACGAT 
CCGCTGGTCG CCGGCGGCCG CTATGACGGG CTGATGAGCC AGCTCGGCGC GAGCGCCCCG 
ATCCCCGCGG TCGGGTTCTC GATCTGGATC GAGGCGATGA CGCAGTCCGG CCCCGCCAAC 
ATTGGGAGCG CGTCATGA

Protein sequence

MTKTAAARAT GSAEWAEALL QSFGQAGYVR AEPAILQPAD PFLDLSGEDI RKSLYLTTDS 
SGEELCLRPD LTIPVARDYL ASAIAGEPAG FCYLGPVFRQ RGGKPSEFLQ AGIESFGRQD 
RAAADAEMLA LGLEATSAFG LGEVDIRTGD VALFSALIDA LGLYPVWRRR LMKDFNRQAS 
LAQDIERLTL ATSSANEYEG VLAALAGSDR KAALALVTDL MSIAGATTLG GRAVSEIADR 
FLEQSTLKSG ALPRDALQKI KRFLAISGAP QDALTQLRAL AADAQLAIDA AIDQFESRIG 
FMAARGIDLT KTRFSTSFGR GVDYYTGFEF ELHRAGNGDD PLVAGGRYDG LMSQLGASAP 
IPAVGFSIWI EAMTQSGPAN IGSAS