Gene Rpal_1700 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_1700
Symbol
ID	6409357
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	1824252
End bp	1825319
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	66%
IMG OID	642711588
Product	Squalene/phytoene synthase
Protein accession	YP_001990703
Protein GI	192290098
COG category	[I] Lipid transport and metabolism
COG ID	[COG1562] Phytoene/squalene synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.898001
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCTGC AATCCGATAT GTTGGCCCAA TCCGACATGC TGGCCTGCCG TGAGATGATC 
AAGGAAGGCT CGCACACCTT TCACGCGGCC TCCAAGGTGC TGCCGCGGCG GATCAGTGAT 
CCGGCGATCG CGCTGTACGC GTTCTGCCGC GTCGCCGACG ACGCCGTGGA TCTCGGTCTC 
GACCGCGCCG CCGCGGTCGA AGTGCTGAAG GACCGGCTCG ATCGCGCCTG CCGCGGCGTG 
CCGCGTGCCT ATCCGTCCGA CCGCGCCTTC GCTGATGTGG TGGCGCGGTT TTCGATTCCG 
CCGGCAATTC CCGAGGCGCT GATCGAGGGC CTGGAATGGG ATGCGCAGGG CCGTCGCTTC 
GAGACGCTGT CGGATCTGTA TTCGTATTGC GCCCGCGTCG CCGGCACCGT TGGCGTGATG 
ATGACGCTGG TGATGGGCCA GCGCAAACCC GACATCGTGG CGCGTGCCTG CGATCTCGGC 
TGCGCGATGC AACTCACCAA TATCGCCCGC GACATCGGCG AGGATGCCCG TAACGGGCGC 
ATCTATATGC CGCTGTCGTG GATGCGCGAA GCTGGCCTCG ATCCGGAGAC CTGGCTCGCC 
AATCCGAAGT TCACGCCGGA GATCGCCAGC ATCGTCAAGC GGCTGATCGA CACTGCGGAT 
GCGCTGTACG ATCGCGCGAC GCTCGGCATC GCCAACCTGC CGCGCTCCTG CCGTCCCGGC 
ATTTTCGCAG CGCGCGCGCT GTACGCCGAG ATCGGCCGCG AGGTCGAGCG CTCCGGCCTC 
GACTCGGTGT CGAGCCGTGC AGTGGTCTCA ACCGGCCGCA AGCTCGCCGT GCTGGCGCGG 
CTGCTGGCGT TCCAGGAAAC CGAATGGGCG CCGGCGAAGT ATCTGCCGGC CAAGTTCGGC 
GACATGGAAG AGACCAAGTT TCTGGTCGAC GCGGTGATCG CGCATCCGGT GCGCGAACTG 
CCGGCGCGCC AGAAGGTCAA GCCGATTGAG CAGAAGGTCG CCTGGCTGGT CGACCTGTTC 
ACCCGCCTCG AACGCCGCGA CCAGATGCTG CAACGCAGCC GGGTGTAG

Protein sequence

MSLQSDMLAQ SDMLACREMI KEGSHTFHAA SKVLPRRISD PAIALYAFCR VADDAVDLGL 
DRAAAVEVLK DRLDRACRGV PRAYPSDRAF ADVVARFSIP PAIPEALIEG LEWDAQGRRF 
ETLSDLYSYC ARVAGTVGVM MTLVMGQRKP DIVARACDLG CAMQLTNIAR DIGEDARNGR 
IYMPLSWMRE AGLDPETWLA NPKFTPEIAS IVKRLIDTAD ALYDRATLGI ANLPRSCRPG 
IFAARALYAE IGREVERSGL DSVSSRAVVS TGRKLAVLAR LLAFQETEWA PAKYLPAKFG 
DMEETKFLVD AVIAHPVREL PARQKVKPIE QKVAWLVDLF TRLERRDQML QRSRV