Gene Rmar_1594 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmar_1594
Symbol
ID	8568246
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodothermus marinus DSM 4252
Kingdom	Bacteria
Replicon accession	NC_013501
Strand	+
Start bp	1847286
End bp	1848812
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	67%
IMG OID
Product	histidine ammonia-lyase
Protein accession	YP_003290868
Protein GI	268317149
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATATC CCCTGCCCAC GCTGGAGTTT TCGGTTCGGA TCGCCTCGCT TTACGAAGAC 
CTGGAGCGGC GCGTCGAGGA GCTGCGGCGG GACCATTCGG CCGTGGCCGC CTCACGGGCC 
CGCGTCGAGG CGGCATTGCA GAGCGGCGGC GTCTACTACG GCATCAACAC CGGCTTCGGC 
GCACTGGCCC GCACGCGCAT TCCGGACGAC CGGCTCGCCC AGCTCCAGGA AAACTTGCTC 
ATCAGCCACG CGGTGGGCGT GGGTCCCTGG CTGCCCCGCC AGCTATGCCG GCTGATGCTG 
CTGCTCAAGA TCCATGCGCT GGGCCTCGGC TACTCGGGCA TCTCGGTGCC AACGTTCGAG 
CGGCTGCTGG ACTTCGCCGA GCGCGACCTG ATCCCGGCCG TGCCCAGCCG CGGAAGCGTG 
GGCGCCTCGG GCGACCTGGC CCCGCTGGCC CATCTGGCAT TGCCGCTCAT CGGCCACGGC 
TACTTCTGGA ACGAAGACGG CACCGCGGTG CGTCCGGCTG CCGAGGTGCT GGCCGAAGCG 
GGTCTTTCGC CGATTCGCCT GCAACCGAAA GACGGCCTCT CACTCATCAA CGGCACCCAG 
CTTATGAGCG CCTGCGGGGC CTACGTGCTC GAAAAGGCAT TGCATCTGGT GAAGGTGGCC 
GACATCCTGG CCGCCATGAG CCTCGAAGCG CTGCAGGGGA GCATCAAGCC GTTCGATCCA 
CGCATCCAGG CCGTGCGTCC ACATCCCGGC CAGGCGCTCG TGGCCGAAAA CATCCGGACG 
TTGCTCGTCG ATAGCGAGAT CCTCGAATCC CACCGGCACT GCGGCAAGGT GCAGGACCCC 
TACTGCCTGC GCTGCGTGCC ACAGGTGCAC GGTGCCAGCC GCGACGCGCT CGACTATGCC 
CGCCGCGTCG TGGAAATCGA GATCAATTCG GCCACCGACA ACCCGCTCGT CTTCGAAAAC 
GGCGACATCC TCAGCGGCGG CAACTTCCAC GGTCAGCCGC TGGCGCTGGC GCTCGATCTG 
GCCGCCATGG CCCTGGCCGA GCTGGCCAGC ATCTCGGAGC GCCGCACCTA CCTGCTGCTG 
GAAGGACACG ACGGCCTGCC ACGCCTGCTG ATGAAAGACA CCGGCATCAA CTCGGGCTTC 
ATGATCCCCC AGTACACGGC CGCCGCGCTC GTCTCCGAAA ACAAAGTGCT CTGCCACCCT 
GCCTCGGTCG ATTCGATCCC GACCAGCCTG GGCCAGGAAG ACCACGTCAG CATGGGAAGT 
ATCAGCGCGC TGAAGCTGCT GACCGTGCTG GAGAACGTCG AACATGTGCT GGCCATCGAG 
CTGTTCACGG CCGCCCAGGC CCTCGACTAT CGGCTGCCGC TGCGGCCCGG TCGAGGCGTG 
GAGATCGTCC ACCACTACGT GCGCCGGCAC GTGCCCCATC GCGAAGCCGA CTACTTCTAC 
CAGCAGGACA TCGCCCGCTG CCTGGAGATG ATCCGGAGTC GGGAGCTGCC CGATCTGGTG 
GCCCGCGAGC TGCGCCCGTT GCACTGA

Protein sequence

MEYPLPTLEF SVRIASLYED LERRVEELRR DHSAVAASRA RVEAALQSGG VYYGINTGFG 
ALARTRIPDD RLAQLQENLL ISHAVGVGPW LPRQLCRLML LLKIHALGLG YSGISVPTFE 
RLLDFAERDL IPAVPSRGSV GASGDLAPLA HLALPLIGHG YFWNEDGTAV RPAAEVLAEA 
GLSPIRLQPK DGLSLINGTQ LMSACGAYVL EKALHLVKVA DILAAMSLEA LQGSIKPFDP 
RIQAVRPHPG QALVAENIRT LLVDSEILES HRHCGKVQDP YCLRCVPQVH GASRDALDYA 
RRVVEIEINS ATDNPLVFEN GDILSGGNFH GQPLALALDL AAMALAELAS ISERRTYLLL 
EGHDGLPRLL MKDTGINSGF MIPQYTAAAL VSENKVLCHP ASVDSIPTSL GQEDHVSMGS 
ISALKLLTVL ENVEHVLAIE LFTAAQALDY RLPLRPGRGV EIVHHYVRRH VPHREADYFY 
QQDIARCLEM IRSRELPDLV ARELRPLH