Gene Rmar_1803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmar_1803
Symbol
ID	8568455
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodothermus marinus DSM 4252
Kingdom	Bacteria
Replicon accession	NC_013501
Strand	+
Start bp	2111746
End bp	2112867
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	68%
IMG OID
Product	Prephenate dehydrogenase
Protein accession	YP_003291075
Protein GI	268317356
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.411636
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCGAAC GCATTACGAT CTGCGGGCTG GGCCTGATCG GCGGCTCGCT GGCGATGGCC 
TGGAAGCGGG CGCGGCCGGA GCTGCATCTG ACGGCTTTCG ACCGGCGCGA GGTGCTTCGC 
CAGGCCCGTG AGCTTGGCGT CGTGGACGCC ACTGCCGAAG ATGTGGCCGA GGCCGTCGCC 
GAAGCCGATC TGGTGGTGCT GGCCGCGCCG CTGCGCGGCA TTCTGTACCT GCTGGAGGAG 
ATCGGCCCGC ATCTGAAGCC GGGCGCCCGG GTGACCGACG TCTGTGGCGT CAAGCGCCCC 
ATCATGGCGC ACGCCCGGGA GATGCTGCCC GAGACGGTCA CCTTCATCGG CGGGCACCCC 
ATGGCCGGCT CCGAACGCCG CGGCCTGGCC AATGCCGATC CGTTTCTGTT CGAGAACGCC 
ACCTACGTGC TCTGTCCGCC CCCCGGGAGC GACGCTGTCC GACTTCAGCA GGAGCACGAA 
GACCTGCTGG AGCTGATCCG ACTGCTGGGT GCCCGCGTGC TGGTGCTCGA CGCCGAACGG 
CACGACGCCA TCGCCGCCGC CGTCAGCCAC CTGCCCCAGC TTCTGGCCGT GCTGCTCGTC 
AACACGGCCG CCGAACTCAG CAAAGGCGAC GAGACGTTCC TGCAGCTGGC CGCCGGGGGC 
TTCCGCGACA TGACCCGGAT CGCATCGTCG CCGTTCGACC TCTGGCGCGA CGTGCTCTTT 
GCCAACGAGG GGCCGCTGCT CGACACGCTC GGTCACTTTG CGGCCAACCT GCAACGCCTG 
CGCAACCGCA TCATCGAAGA AGACGAGCAG GCACTCGCGG AAGCCTTTGA GCAGGCCCGC 
CGGACGCGTG CCCGCATCCC GCGCGACACG AAAGGCTTCC TGCACCCGCT GGCCGACGTG 
TACGTCCGCA TCGAGGATCG CCCCGGTGCT CTTTACCGGA TCACCCGCAC CCTCTACGAG 
GCCGGCCTCA ACATTCAGGA CATCGAACTG CTGAAGGTGC GCGAGGGCAC AGGCGGTACC 
TTCCGACTGG GCTTCGCCAC CGAGGCCGAC GCCGACCGCG CCTGCGAGGC GCTTCGCCAG 
GCCGGCATCG AAGCCTTCCG TCCCGACGAT CACGGAAACT GA

Protein sequence

MIERITICGL GLIGGSLAMA WKRARPELHL TAFDRREVLR QARELGVVDA TAEDVAEAVA 
EADLVVLAAP LRGILYLLEE IGPHLKPGAR VTDVCGVKRP IMAHAREMLP ETVTFIGGHP 
MAGSERRGLA NADPFLFENA TYVLCPPPGS DAVRLQQEHE DLLELIRLLG ARVLVLDAER 
HDAIAAAVSH LPQLLAVLLV NTAAELSKGD ETFLQLAAGG FRDMTRIASS PFDLWRDVLF 
ANEGPLLDTL GHFAANLQRL RNRIIEEDEQ ALAEAFEQAR RTRARIPRDT KGFLHPLADV 
YVRIEDRPGA LYRITRTLYE AGLNIQDIEL LKVREGTGGT FRLGFATEAD ADRACEALRQ 
AGIEAFRPDD HGN