Gene Rpal_3313 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_3313
Symbol
ID	6410986
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	3569969
End bp	3571468
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	70%
IMG OID	642713192
Product	carbohydrate kinase, YjeF related protein
Protein accession	YP_001992290
Protein GI	192291685
COG category	[G] Carbohydrate transport and metabolism [S] Function unknown
COG ID	[COG0062] Uncharacterized conserved protein [COG0063] Predicted sugar kinase
TIGRFAM ID	[TIGR00196] yjeF C-terminal region, hydroxyethylthiazole kinase-related [TIGR00197] yjeF N-terminal region

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACTTT TGACGCCCGC TGAAATGGAC CGCGCCGACC TTCTGACGAT CGCCGGAGGA 
TCGTCGGGAT TCGCGCTGAT GCTGCACGCC GGCCGCCATG TCGCGCAGGC GGCGATCGAG 
ATGGCGGACG AGGGGCCGAT CCTGGTGATC GCGGGCCCCG GCAATAATGG CGGCGACGGG 
CTGATCGCCG CGACCGAATT AGTTGCACTC GGCCGCACCG TGCACGTGAT GCTGCTCGGC 
GAGCGCGAGG CGCTGAAGGG CGATGCGGCG CTTGCGGCGC GGGAGTGGAG GGGGCCGCTG 
CTGCCGTTCC TGACCCAGTC GATCGGGGCG CCGGCGCTGA TCATTGACGC GCTGTTCGGC 
TCCGGCCTCA ACCGGCCGGT CAAGGATCAG GCGCTCGAGG TGATCGAGGC GGTGAACCAC 
AGCGGCGTGC CGGTGCTGGC GGTCGATCTG CCAAGCGGCA TCAACGGCGC CACCGGCGCC 
GTGATGGGCG CGGCAATCCG GGCGCGCGAA ACCGTCACCT TCTTCCGGCG CAAGATCGGT 
CACCTCCTGC TGCCCGGCCG GCTGCATTGC GGTCAGGTCC GCCTCGTCGA CATCGGCATC 
GAGCCCGGGG TGCTGGGCGA AATCCGGCCG CAGGCATTCG AAAATGACCC CGATCTGTGG 
CTGCCGGACT TTCCGGTGCC GCGTGCCGAT GGCCACAAAT ACGGCCGCGG CCACGCGGTG 
GTGGTGTCGG GCGAGCTGTC GCAAACCGGG GCGGCGCGGC TGGCCGCCCG CGGCGCGCTC 
CGCGCCGGCG CGGGTCTGGT GACGGTGGCA TCGCCCCGCG ACGCGCTGGC CGTGAATGCG 
GCGGCCCTCA CGGCGGTGAT GGTTCGGCCG GTCGATACGC CGGACGAACT CGGCACGATG 
CTGGCCGACC GCCGCTTCAA CGCCATCGGC ATCGGGCCGG GCGCCGGGAT CGGTGAGGAG 
ACCCGGGGCA AGGTGCTGGC GGCGCTGGCC GCTGGCGCCG CGGTGGTGCT CGATGCCGAC 
GCGCTGACCA GCTTTGCCGG ACATCCGGAC GAGCTGTTCG AGGCGATCAA ATCGGCCAGT 
AGTCCGCAGG TCGTTCTGAC CCCGCACGAA GGCGAATTTC CGCGCCTGTT CAGCGATATG 
AGCAACAAAA ATCCACTTCG CTCGAAGCTT GAACGGGTGC GCGTAGCGGC GCAGCGTTCC 
GGCGCCGTGG TGCTGCTCAA GGGCGCCGAT ACGGTGGTGG CGTCGCCGGA CGGCCGTGCG 
GCGATCGCCG CCAATGCGCC GCCGTGGCTG GCGACCGCCG GCTCCGGCGA TGTGCTCACC 
GGGATCATCA CCGGCCTGCT GGCGCAGCGC GTGCCGGCGT TCGAAGCCGC CTGCATCGGC 
GTGTGGATGC ACGGCGAGGC GGCCTGCGAG GCCGGCCCCG GTCTGATCGC CGAGGATCTG 
ACCGAGACGA TGCCGGCGGT GCATCGGCGG CTCTATGACG CGCTCGGGAT CGAGTACTGA

Protein sequence

MELLTPAEMD RADLLTIAGG SSGFALMLHA GRHVAQAAIE MADEGPILVI AGPGNNGGDG 
LIAATELVAL GRTVHVMLLG EREALKGDAA LAAREWRGPL LPFLTQSIGA PALIIDALFG 
SGLNRPVKDQ ALEVIEAVNH SGVPVLAVDL PSGINGATGA VMGAAIRARE TVTFFRRKIG 
HLLLPGRLHC GQVRLVDIGI EPGVLGEIRP QAFENDPDLW LPDFPVPRAD GHKYGRGHAV 
VVSGELSQTG AARLAARGAL RAGAGLVTVA SPRDALAVNA AALTAVMVRP VDTPDELGTM 
LADRRFNAIG IGPGAGIGEE TRGKVLAALA AGAAVVLDAD ALTSFAGHPD ELFEAIKSAS 
SPQVVLTPHE GEFPRLFSDM SNKNPLRSKL ERVRVAAQRS GAVVLLKGAD TVVASPDGRA 
AIAANAPPWL ATAGSGDVLT GIITGLLAQR VPAFEAACIG VWMHGEAACE AGPGLIAEDL 
TETMPAVHRR LYDALGIEY