Gene Rpal_5041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_5041
Symbol
ID	6412735
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	5422710
End bp	5423753
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	65%
IMG OID	642714926
Product	guanosine 5'-monophosphate oxidoreductase
Protein accession	YP_001994005
Protein GI	192293400
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0516] IMP dehydrogenase/GMP reductase
TIGRFAM ID	[TIGR01305] guanosine monophosphate reductase, eukaryotic

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCACATCG ATTTGAACCC GAAGCTCGAC TTTCGCGACG TGCTGATCCG GCCCAAGCGT 
TCGGTGCTGT CGTCGCGTTT CGAGGCGAAT ATCAAGCGCA GCCTCCGCTT CCGCCATTCC 
AGCCGGGCCT GGACCGGCTT TCCGCTGATC GCTTCGAACA TGGACACCAT CGGCACGCTG 
GAGATGGCGA AGGCCTTCAA ACCGTTCGGC GCGCTGGTCG CCTTGCACAA GTTCCATCAT 
CCGGATCGGC TGGCCGAGTA TCTTGCCGGC GACGAGGACG CCAACGTGTT CGTCACCGTC 
GGTACCGGTT CGGCCGATTG GGAGCGGCTC GCTGCGGTGA AGGCCAAGGT GAAGGTGCCG 
ATGCTGAACA TCGACGTGGC CAACGGCTAC ACCGAAGCCT TCGTGCGTGC GGTGGCCAGG 
CTGCGCGACG AGAACCCGGA CGCGATCATC ATGGCCGGCA CCGTGGTCAC CGCCGAGATG 
ACCGAGGCGC TGGTGCTCGC CGGCGCGGAC ATCGTCCGCG TCGGTATCGG CTCAGGTTCG 
GTGTGTACCA CGCGTGATCT CACCGGCGTC GGCTATCCGC AGCTCTCGGC TGTGATCGAA 
TGTGCCGATG CGGCACACGG GCTGAAGGGC CACGTCTGTT CGGACGGCGG TTGCGTGGTC 
CCCGGCGATC TCGCCAAGGC CTATGGCGGC GGCGCGGATT TCGTGATGCT CGGCGGCATG 
CTGGCGGGCC ATGACGAATG CGGCGGCGAG CTGCGCTACG CTGAGCAGAA CGGGCAGAAG 
ACCCCGACCA GCATGGTGTT CTACGGCATG TCGTCGGAGA CCGCGATGAA CAAGTATCAC 
GGCGGCGTCG CCGATTATCG CGCCGCCGAA GGCAAGACCG TCGAGGTGCC GTATCGCGGC 
GAGGTGCATG CCACGGTCGA AAAGATCGCC GGCGGCCTGC GCTCGGCGAT GACCTATATC 
GGCGCTGAGA ACCTGAAGGA AATTCCGAAG CGGACCACGT TCATCCTGGT CAACGCCCAG 
CGCAACACGG TGTTCGACCG CTGA

Protein sequence

MHIDLNPKLD FRDVLIRPKR SVLSSRFEAN IKRSLRFRHS SRAWTGFPLI ASNMDTIGTL 
EMAKAFKPFG ALVALHKFHH PDRLAEYLAG DEDANVFVTV GTGSADWERL AAVKAKVKVP 
MLNIDVANGY TEAFVRAVAR LRDENPDAII MAGTVVTAEM TEALVLAGAD IVRVGIGSGS 
VCTTRDLTGV GYPQLSAVIE CADAAHGLKG HVCSDGGCVV PGDLAKAYGG GADFVMLGGM 
LAGHDECGGE LRYAEQNGQK TPTSMVFYGM SSETAMNKYH GGVADYRAAE GKTVEVPYRG 
EVHATVEKIA GGLRSAMTYI GAENLKEIPK RTTFILVNAQ RNTVFDR