Gene Rcas_3547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3547
Symbol
ID	5541048
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	4625989
End bp	4627365
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	48%
IMG OID	640895666
Product	hypothetical protein
Protein accession	YP_001433614
Protein GI	156743485
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0722197
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATAG TAACGGATGA GTTGTTGGTG GAGGCGTTGC TTGCGATTGA AGAGACCAAT 
ACACCAATGA CGTTTAGCGA GATCGCCAAA AGCATCAGCA AACGACGTGG TGGCGTTCAA 
CTGACAGATG ATGAAATAGG GGACTTAAGA GAATGTCTCT ACCAGAACGG GAACATGTAC 
ATCCTCTGGT CTGCCAAAGA CCGAACCTGG ACAATCACAC CTGAAGGGCG CGCTTACGCA 
CGTCAGATCA GCATTGAGCC TGAAGAGCTC GTGGACATTT CAGAAACTGA TGAAGCGCTT 
GAGCCTAAAG GCGCGCCTTT CAATCCAGCA CTGATCAAGG TCGATGTCGA TCAGATGCAT 
ATCTATCACG CCCTTAAGCT TATTCGTGAG CAAAGACTCG TTCTTCAGCC AGAATTTCAG 
CGCAATTTTA TTTGGGACGA AGTTCGTCAA AGCCGTCTTA TTGAGTCTAT TCTTCTTCGT 
ATCGCGCTGC CAGCATTTTA TCTTGATGCT CCGAGGGAAG ACACCTACGT CGTCATTGAT 
GGTCTCCAAC GTCTGAAAAC TCTCGACCGC TTTTGCAATG AAAAATCGCT CAAACTAACT 
GGTTTGGAAT ACCTGCGCGA GTTTGAGAAT CACGGGTTTA GCGATCTCCC TTCCCATATG 
CGATCCCGCC TTGAAGAAAC ACGCCTCACG ATGCACATCA TTCGACCAGA AACCCCTTTG 
CAGGTCAAAT TCATTATCTT TCGCCGTATC AATACTGGCG GTTTAGTCTT GACCAATCAG 
GAGATCAGAC ATGCGCTCTA TCAAGGAAAT GATGGACGCG CTTCTCGTTT GCTCAAGAAC 
CTCGCTGAAA GCCCGGAATT TCTCGATGCG ACTGATCGTT CGATCAGTCC GCGACGGATG 
GATGATCGTG AATGTGTTCT GCGTTTTCTT ACGTTTGTGC GTTATCCATA CGAGCAGTTC 
GGTCGAAACA TGAGCGTTGG CGAACCGCCA AACCTTGATG GATTGCTGAA TCGTACCATG 
GCAGACCTGA ATGCACTGCC CTTTGAGGAA CATGATAGGC TCAAAGAGGT GTTCCGCGAT 
AGCATGTGTA AGGCGCATCT CGTATTCGGT CGCCATGCTT TTCGCAAGAT ATACGGACGC 
AATCAGAAAC GTCAACCGAT TAGCAAACCG CTTTTCGAGG TCTGGAGCAC ACTGCTCCGC 
GATTGGCCAA TCGAAATTCT GGAACAGCGC CGTGAACAAT TAATCGATGG TTTTATCGAA 
ATTATGCAAC ATGATTTTGA CTTCATCAAG TCTATCTCAT ATGGTACAGG AAGCGTAAGG 
GCAGTTAAGT ATCGCTTTGA CCGAATCAAT AGAATGCTTC GAGAAACTCT GCGATGA

Protein sequence

MSIVTDELLV EALLAIEETN TPMTFSEIAK SISKRRGGVQ LTDDEIGDLR ECLYQNGNMY 
ILWSAKDRTW TITPEGRAYA RQISIEPEEL VDISETDEAL EPKGAPFNPA LIKVDVDQMH 
IYHALKLIRE QRLVLQPEFQ RNFIWDEVRQ SRLIESILLR IALPAFYLDA PREDTYVVID 
GLQRLKTLDR FCNEKSLKLT GLEYLREFEN HGFSDLPSHM RSRLEETRLT MHIIRPETPL 
QVKFIIFRRI NTGGLVLTNQ EIRHALYQGN DGRASRLLKN LAESPEFLDA TDRSISPRRM 
DDRECVLRFL TFVRYPYEQF GRNMSVGEPP NLDGLLNRTM ADLNALPFEE HDRLKEVFRD 
SMCKAHLVFG RHAFRKIYGR NQKRQPISKP LFEVWSTLLR DWPIEILEQR REQLIDGFIE 
IMQHDFDFIK SISYGTGSVR AVKYRFDRIN RMLRETLR