Gene Rpal_0150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_0150
Symbol
ID	6407794
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	166287
End bp	167450
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	64%
IMG OID	642710060
Product	conserved hypothetical protein; putative glucokinase
Protein accession	YP_001989188
Protein GI	192288583
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.957709
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGAGG ACAGTCTGAC CACCACGAAC GCCGGCATCG CCGCACACGG CGCCACCCGA 
CTGCCTTCAG TCGAGATCGA CAGCTACAAT ATCGAGATCA AGGACGAGGA CGGCTTCCTC 
GGCGACCGCG CCTCCAAGGG GGCGTTTCAG CGCCTGCTCG ACGATTGGCG CAAAGCGCTG 
CGCGAGACCG GCGACGATCC GTTCGGGCGG CGAGACACCA AGAATATCGC CAAGAGCGCG 
CTCGACGAGG TGCTGACCAG CGACGACGTC GCCGCCGCTG CGGTGGTGCA CAGCGCGATC 
GAGGATTTTG CGCAGGAGCT GGCCTACGTC ACCAAGCGCT TCCTGCGCAC CAAGGCGTGG 
GCCGAGACCG AGTGCATCGT GGTCGGCGGC GGCTTCCGCC AGAGCCGGGT GGGCGAGCTG 
GCGATTGCCC GCACCGACAT TCTGCTCAAG GCGGACGGCC ACGCGGTCGA TCTGGTGCCG 
ATCCGATTTC ACCCCGACGA GGCCGGGCTG ATCGGTTGCC TGCATCTGGC GCCGTCGTGG 
ATCTTCGAGG CTCACGACAG CATCCTGGCG GTCGATATCG GCGGCTCCAA CATCCGCTGC 
GGCGTGGTCG AGACCGCCTG GAAGAAGGCG CCCGACCTGT CGAAAGCCTC GGTGTGGAAG 
TCCGACCTGT GGCGGCACGC CGATGACGAG CCGACCCGCG AAGGTGCGGT GAAGCGGCTG 
ACCCGGATGC TCAAGGACCT GATCTCGGAG GCCGAGGACG AAGGCTTCAA GCTGGCGCCG 
TTCATCGGCA TCTCCTGCCC CGGCGTCATC AATGCCGATG GCAGCATCGA AAAAGGCGCC 
CAGAACCTGC CGGGCAATTG GGAGAGCAGC AAGTTCCACC TGCCGCGCAG CCTGCTCGAA 
GGCATCCCGA CGATCGGCAG CCACGACACC GCGATCCTGA TGCACAATGA CGGCGTGGCC 
CAGGGCCTCA GCGAAGTGCC GTTCATGCAG GAATTCGAGC GCTGGGGCGT GCTGACGATC 
GGCACCGGCC TTGGCAATGC TCGTTTCACC AACCGCCGCG ACAAGGACAA GGCCAAGAAG 
GAGCGGGAGA AGGATAAGGA AAAAGACAAA GAGAAAGACA AGGAGAAGGG TAAAAAAGAC 
AAGGACAGCA AGGAGAAGGC CTGA

Protein sequence

MAEDSLTTTN AGIAAHGATR LPSVEIDSYN IEIKDEDGFL GDRASKGAFQ RLLDDWRKAL 
RETGDDPFGR RDTKNIAKSA LDEVLTSDDV AAAAVVHSAI EDFAQELAYV TKRFLRTKAW 
AETECIVVGG GFRQSRVGEL AIARTDILLK ADGHAVDLVP IRFHPDEAGL IGCLHLAPSW 
IFEAHDSILA VDIGGSNIRC GVVETAWKKA PDLSKASVWK SDLWRHADDE PTREGAVKRL 
TRMLKDLISE AEDEGFKLAP FIGISCPGVI NADGSIEKGA QNLPGNWESS KFHLPRSLLE 
GIPTIGSHDT AILMHNDGVA QGLSEVPFMQ EFERWGVLTI GTGLGNARFT NRRDKDKAKK 
EREKDKEKDK EKDKEKGKKD KDSKEKA