Gene Rmar_1601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmar_1601
Symbol
ID	8568253
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodothermus marinus DSM 4252
Kingdom	Bacteria
Replicon accession	NC_013501
Strand	-
Start bp	1855096
End bp	1856823
Gene Length	1728 bp
Protein Length	575 aa
Translation table	11
GC content	64%
IMG OID
Product	Squalene/phytoene synthase
Protein accession	YP_003290875
Protein GI	268317156
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0484297
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCGCT TCGATCGGCT GCTGCTTTAC GGGTTATATG GTTTCACGAT CATTGCCGTC 
GCCGGCTTTG GGATTTTCGG ACGCCACCCG GAATTGCTTG TCCGCTGGCC GGAGCTTGCT 
GCGTTCTACG CCCGGTCTTT TGCGCTTTTT GCGCGGGTGC ATGTGCTGCT GACGGCTTTT 
GTCCTGTTCG CGTACATGGG GCGTCGTGTC GGTGGGCGCT GGGTGCCGGC CGGACTGCTC 
GTCTACGGCG TGAGCCTACT CAGCGAGACG CTGGGGACCA CGTATGGCGT GCCTTTCGGG 
ACCTATGGTT ACACCACCCT GCTCGGAGGA AAGTGGTTCG GCCGCGTGCC CTATCTGATT 
CCGCTCAGCT GGTTTGTGAT GGCGGTGCCC TGTTATGTGC TGGCCCGCGC CGCCTTTTCG 
GAGCGTCGGC AGTGGCCGGC TCGGCTGCTG CTGGCAACCT ATCTGCTGGT GGCCTGGGAT 
CTGAGTCTGG ATCCGGCCAT GAGCTACCTG ACGTCGTACT GGACCTGGGG GGAGACCGGC 
CCTTACTACG GGATGCCGCT GATCAATCTG GCCGGATGGG CGCTGACCGG TCTGGTGATT 
ATGGGCGTAC TGGAGGCGAT GCGCGCGTTT CGCTGGACCG AAGCGTTCAG CGTGCAGTGG 
ATGGCGGTGT TCTATGGAGC GGTGTTGCTG ATGCCGCTCG GTATGGTGGC TGTGGCCGGT 
CTCTGGGGGG CTGTCGCTGC TACGGTCGCC GCACTGGGCC TGGCGGGAAG TGTCGTCTGG 
CTGATCCGGC GCAGGCGGCC GCGCATGGAT ACAAAGGGCG CGCTTCCCGC GCGGGATGCC 
TTCGAGGAAG ATGGCACGCG CTTTTTCGCA GCACATGCCC GTTCGTTTTC TTTTGCCGCG 
CGGCTGTTTC CGAAGGACTT TCGCCGGGAA GTTGTCCTGC TCTATGGTTT CTGTCGGCTT 
ACGGACGATC TGGTAGACGG CGCATCGACG CAGGTTGCGC CCGAGTTGCT GCAGAAGCGT 
CTGGATCGGT GGCAACGCCA GGTACGGATG GCCTACGAGG GGCGTCCTTC CGGACTCCCC 
TGGCTCGATC GGCTTATGCA ACGCTCGCGC CAGGCCGGAT TGCCCTGGGA AGTCGTGCAG 
GCGCTGCTGG ACGGCGTGCG CCAGGACATC GGGCCGGTCC GGGTGGCTTC CTATGAAGAA 
CTGGATCGCT ACGCCTACCG CGTGGGTTCG ACGGTGGGCG TCTGGATGTG CTATCTGATG 
GGGGTGCGCA TGCCCCGATT GCTTGCGCGC GCCGAAGCGC TCGGCCGCGC CATGCAGTAC 
ACGAACATCG TGCGCGACGT GGGGGAAGAT CTGCAGCGCG ATCGCCTCTA TCTGCCAGCG 
GATCGGATGG CCGCCTATGG ACTGGACCTC GCGGATCTGC TACGTATGCA GCAGACCGGC 
GTGCTCGATC CTTCCTATGT GGCGCTGCTG GAAGAACTCA TGCAGCAGGC CGAGCGCGAC 
TATGAGGCCG CCTGGGAGGC CATTCCGGCC CTGCCACCGC GCGTTCGCGG TGCCATTGCC 
GTGGCCGCCG AGGTCTATCG GGGGATTCAT GCAGTGCTTC GCCAGAACCA CTACGACAAT 
CTGACGCGTC GCGCCTACAC GACGCTCCCC GAAAAAATCG GTCTTTCGGT GGCTGCACTG 
CGTCGCCTGC GTCGGGCGGT TTTGATAACA GGTATGCAGG CCCTATGA

Protein sequence

MSRFDRLLLY GLYGFTIIAV AGFGIFGRHP ELLVRWPELA AFYARSFALF ARVHVLLTAF 
VLFAYMGRRV GGRWVPAGLL VYGVSLLSET LGTTYGVPFG TYGYTTLLGG KWFGRVPYLI 
PLSWFVMAVP CYVLARAAFS ERRQWPARLL LATYLLVAWD LSLDPAMSYL TSYWTWGETG 
PYYGMPLINL AGWALTGLVI MGVLEAMRAF RWTEAFSVQW MAVFYGAVLL MPLGMVAVAG 
LWGAVAATVA ALGLAGSVVW LIRRRRPRMD TKGALPARDA FEEDGTRFFA AHARSFSFAA 
RLFPKDFRRE VVLLYGFCRL TDDLVDGAST QVAPELLQKR LDRWQRQVRM AYEGRPSGLP 
WLDRLMQRSR QAGLPWEVVQ ALLDGVRQDI GPVRVASYEE LDRYAYRVGS TVGVWMCYLM 
GVRMPRLLAR AEALGRAMQY TNIVRDVGED LQRDRLYLPA DRMAAYGLDL ADLLRMQQTG 
VLDPSYVALL EELMQQAERD YEAAWEAIPA LPPRVRGAIA VAAEVYRGIH AVLRQNHYDN 
LTRRAYTTLP EKIGLSVAAL RRLRRAVLIT GMQAL