Gene Rcas_3751 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3751
Symbol
ID	5541253
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4919750
End bp	4920970
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	62%
IMG OID	640895862
Product	geranylgeranyl reductase
Protein accession	YP_001433809
Protein GI	156743680
COG category	[C] Energy production and conversion
COG ID	[COG0644] Dehydrogenases (flavoproteins)
TIGRFAM ID	[TIGR02023] geranylgeranyl reductase [TIGR02032] geranylgeranyl reductase family

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0101048
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.000524672
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGAACCAG TCCTCGTGGT AGGCGCATCG GTGGGAGGCG CGACGGCTGC CGATACGTTG 
GCGCGCGCAG GTGTGCCGGT GGTGATGCTC GAACGCGATA CGTCGTATGT GAAGCCGTGT 
GGCGGCGCCG TGCCGCCGGT GGCGTTCACC GAGTTCGACT TGCCGGAAAC ATTGATCTCG 
CGCAAGGTGC ATCACGCGCT GGTGCATTCA CCGAGTGAAC GGGTCGTTGA AATTGAGGTT 
GCCGGCGTCC ATCGCTCCGA TCAGGATTAT ATCGCCATGT GCTGCCGCGA GGAGTTTGAC 
TGCTACATTC GTCAGCGTGC CGTGCAACAT GGCGCAACCC TGATCGAAGG TCAACTGATC 
GATCTAGCGT TCGATAAGGA GGGTGTGACG GTAACCTACC GCGAGCGGTT CGGCGGTGCG 
CGTCAGGAAC TGCGCGCTGT GGCGGTGATC GGTGCTGACG GGGCATACTC GACGACGGCA 
AAGCTGCTGG GTTTGCCCAA TCTGCCGCGC TGCATCGCCA TCCAGCAACG TATTCGCCTG 
CCTGCCAGCA AAATGGCGCG CTGGGAAGAT ACCGCCGATC TCTACCTGGG TCCTGAGGTC 
AGTCCCGATC TGTATGCCTG GGCGTTTCCC AAGAGCGACC ACGTGGCCGT TGGGATCGGA 
ACCGGACCGT CGCACAGCAA ACGCGCCCGT GAATTGCTCG CCAATCTGAA GCGTCGGATT 
TCCCGCGATC TTGAGGGTGG CGAGGTCATC CTCGAAGAAG CGCATGCGCT GCCGATGGAG 
CCGCGTGAGC ATATGGCGTT CGAGCGCGCT ATGCTGATCG GCGATGCGGC GGGTCTGGTG 
GTGCATACAT CGGGCGAAGG CATCTATTGG GCGATGAAGA GCGGCAAAAT GGCGGCAGAG 
ACGCTGATCG CCAGTCTGCC CGATGCGTCG CTCGCTGCGC TGCGGCGCTA TGAGCGCCGG 
TGGTGGAAGA CCTACGGCAC AATGTACCGC TTCCTCGTCT GGCTCCAGAA ATGGGGGTAC 
GGGAACGCGC GGCAGATGGA AGTCTTCACC GATATGTGCC GCAATCTGGA TGTGCAACGC 
CTGACGTTCG AGTCGTACAT GCACAAGAGT ATGACGCCGG TGCCGTGGCT GGCACAACTG 
CGTATGACGG CGGACATTAT CGCTGCGCAG GTGCGTCACT ACCTGCCACG CCGGCGGACG 
GGTCAACCGG CAGTCGCTTG A

Protein sequence

MEPVLVVGAS VGGATAADTL ARAGVPVVML ERDTSYVKPC GGAVPPVAFT EFDLPETLIS 
RKVHHALVHS PSERVVEIEV AGVHRSDQDY IAMCCREEFD CYIRQRAVQH GATLIEGQLI 
DLAFDKEGVT VTYRERFGGA RQELRAVAVI GADGAYSTTA KLLGLPNLPR CIAIQQRIRL 
PASKMARWED TADLYLGPEV SPDLYAWAFP KSDHVAVGIG TGPSHSKRAR ELLANLKRRI 
SRDLEGGEVI LEEAHALPME PREHMAFERA MLIGDAAGLV VHTSGEGIYW AMKSGKMAAE 
TLIASLPDAS LAALRRYERR WWKTYGTMYR FLVWLQKWGY GNARQMEVFT DMCRNLDVQR 
LTFESYMHKS MTPVPWLAQL RMTADIIAAQ VRHYLPRRRT GQPAVA