Gene Rcas_3629 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3629
Symbol
ID	5541131
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	4738852
End bp	4740069
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	62%
IMG OID	640895749
Product	hypothetical protein
Protein accession	YP_001433696
Protein GI	156743567
COG category	[R] General function prediction only
COG ID	[COG1355] Predicted dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTCGT CCACTGATCA GTATCCCAAA CTGCGCGCTA TCGATATTCG CCGGGTGATG 
CACGATGGGC AACCGTCGTT GCTGCTGCGC GATCCGCTCC AGATTTCAGA CCGCTTCCTG 
GTGATTTCGC AGGGACTCGG TCCAGCGTTG CTCTTCTGCG ACGGCAAGCA TCACCGCGCG 
ACGATTGCCG GGAAACTTCG CTCGATGCTC GGCGTGCCGG TTGATAGTGC GCTGGTCAAT 
CGTCTGGTCG ATGCGCTCGA TGAAGCGTTC CTGCTGGACA ATCTGCGTTT CAGGGAAGAA 
CACGCGCGGG CGCTTGCCCG GTATCGCGCG GCGCCGTTTC GCCCGCCAGC CCTGGCAGGA 
CAGTCGTACC CCGCCGATCC GGCGGAACTG CGCCGGTTGC TCGATGATTT CATTGCCGCA 
GTCGGTCCGG TCGCTCCGGC GCCGCCAACC GGTCGCGGTG TGCTCAGCCC GCATATCGAT 
TACGCGCGCG GCGGTCGGGT GTATGCCCAG GTCTGGCAGC GCGCCGCCGA GATGGTGCGC 
GCTGCTGAAA TCGTTCTTCT GATCGGCACC GATCACTATA GCCCCGAACC GGTCACGCTG 
ACACGCCAGC GGTATGCGAC GCCCCTCGGC GTCCTGCCGA CCGATACGTC GGTCGTCGAT 
GCATTGGCGG CAGCCATCGG CGAAGATGCT GCATTTGCGG GCGAATTGTA TCACCGTGTC 
GAACACTCGC TCGAACTGGT AGCGGTGTGG TTGCAATACA TACGCGGAGA TGCGCCTTGC 
CCGGTTATTC CCATTTTGGC AGGTTCATTT GCACGCTATA TGGACGGCGA CGACCCGGCG 
ACCGATCCGC GCTTCGAGGC GCTGATTACA GCCCTGCGTC GGATTATTGC CTCCCGACAC 
GCTGTGGTAA TCATCTCCGG CGATATGTCG CACGTCGGAC CGGCATTTGG CGGAGCGCCG 
TTGAGCAACG CCGATAAAGA GGCGTTGCGC CGCGCCGATG AACTGGTGAT CGACCGAATG 
CGCGCCGGCG ACGCTGCCGG TTTCTTTCGC GTCATTGCCG AAACCGGTGA TCGCCAGAAT 
ATTTGTGGAC TGCCGCCGAC ATATCTGGCG CTGCGTCTGA TGGACGCCGT CGAAGGTGAG 
TTGACGGCGT ATGCGCAATG CCCGGCAGAC GACGAGGAAA CGTCGGTGGT GTCGATCTGT 
GGGATGGTGT TTGGGTGA

Protein sequence

MLSSTDQYPK LRAIDIRRVM HDGQPSLLLR DPLQISDRFL VISQGLGPAL LFCDGKHHRA 
TIAGKLRSML GVPVDSALVN RLVDALDEAF LLDNLRFREE HARALARYRA APFRPPALAG 
QSYPADPAEL RRLLDDFIAA VGPVAPAPPT GRGVLSPHID YARGGRVYAQ VWQRAAEMVR 
AAEIVLLIGT DHYSPEPVTL TRQRYATPLG VLPTDTSVVD ALAAAIGEDA AFAGELYHRV 
EHSLELVAVW LQYIRGDAPC PVIPILAGSF ARYMDGDDPA TDPRFEALIT ALRRIIASRH 
AVVIISGDMS HVGPAFGGAP LSNADKEALR RADELVIDRM RAGDAAGFFR VIAETGDRQN 
ICGLPPTYLA LRLMDAVEGE LTAYAQCPAD DEETSVVSIC GMVFG