Gene RoseRS_2066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_2066
Symbol
ID	5209028
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	2557245
End bp	2558681
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	57%
IMG OID	640595670
Product	hypothetical protein
Protein accession	YP_001276399
Protein GI	148656194
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.380444
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00122076
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAGCAATG TTCAGTTCAT CCGACAGGCG CTCGTGGAGG CTCTCCCCAT AGCCACGTCG 
AGTTATGGCG AAGAACCCCA TCCCGGCCAC ATGTACGTTC CGTCGGCGCA TGTCAAGGCG 
CTTCGATTGG AGTGCAACCT GGTCATCGGC GCCCGGGGCG TCAGAAAATC GTTCTGGACG 
GCGGCGCTGC ATGCGCGAAC GTTACGCGCC TTACTCGGTC AATCGGTGCG CGAACTTGAA 
AGCACCGATG TGCGCATTGG ATTCTCGGTT GCACCATTGC TTGACGCATA TCCCGATAGC 
GATATTTTCA GGGCGCTTAT CAAACAGCAT GCCGCCTATG ATATCTGGCG TGCAGTGATC 
GCACGCTGGC TGGCGGAGAT AACTCCAGCA ACTCTGCCTC GCACTACCTG GGAGGAAACA 
GTCCGGTGGG CTTCCAGTCA TCCCGAGGCG ATTGCGAAAA TGGTGCAGGA TGCGAATATG 
CGTCTGGAGG CGGAGCAACG CTACGGATTG ATTGTTTTCG ATGCGCTTGA CCGTACCAGT 
AACGACTGGC GGACAATGGA TGCCATCGTG CGTGATCTGC TGCGTGTGGT TCTGTGGCTC 
AAATCCTATG CGCGTCTTCA TGCGAAGGTC TTCCTGCGCG AAGATCAGTT TGATCGCACG 
GTGACAGACT TTCCCGATGC ATCAAAATTG CGTGCGACAA TGTCCGAATT GACATGGGCG 
CCGCACGATC TGCACGGTCT TCTCTGGCAA ATGCTTTGCA ATGCACCAGA TGAGTACGGA 
AAGACGTTGC GAGCGGTGTA TAGCAGCGTT GTTGGAACTC CGCCTCTCTG GCACGATAAC 
GTCTGGCGCC TCGCCGAAGA CGTAAAGCGC GAGGGAGAAA AACAACGTCT CTTGTTCGAG 
AAACTGGCAG GGAAGTGGAT GGGCAGTGAT CACCGGCGTG GCGTTCCCTA CGTCTGGTCA 
GTGAGCCACC TGGCCGATGG ACGTCGACGC ACATCGCCGC GTTCGTTTCT TGCAGCAATC 
CGTGCTGCTG CGGAAGACTC TCGTGAACGC TACCCGGATC ATGCATATGC TCTTCACTAT 
GAAAGCATCA AGCGCGGCGT GCAGCGTGCA TCCCAGATAC GCGTCGATGA ACTGGCTGAG 
GACTACCCAT GGGTCACGAA ACTTATGGCG CCTTTGCGCG GCTTGACCGT ACCATGTTCG 
TTTAGCGTCA TCGAAGGACG TTGGAACGAA TACTTTCCGC ATGGACCGGA CGAGATCAGG 
AGTACACGCC TTCCGCCTCA GCACGCGGAG CAGGGATGGA GGGGGGTGTG CAACGATCTG 
GAGCGACTGG GTATCTTTGA GCGGATGCAC GATATGCGTA TTAATATGCC CGACCTGTAC 
CGCGTTGGCT TTGGATTGGG CCGTCGTGGC GGCGTGAAAC CTATTCGACA ACCCTGA

Protein sequence

MSNVQFIRQA LVEALPIATS SYGEEPHPGH MYVPSAHVKA LRLECNLVIG ARGVRKSFWT 
AALHARTLRA LLGQSVRELE STDVRIGFSV APLLDAYPDS DIFRALIKQH AAYDIWRAVI 
ARWLAEITPA TLPRTTWEET VRWASSHPEA IAKMVQDANM RLEAEQRYGL IVFDALDRTS 
NDWRTMDAIV RDLLRVVLWL KSYARLHAKV FLREDQFDRT VTDFPDASKL RATMSELTWA 
PHDLHGLLWQ MLCNAPDEYG KTLRAVYSSV VGTPPLWHDN VWRLAEDVKR EGEKQRLLFE 
KLAGKWMGSD HRRGVPYVWS VSHLADGRRR TSPRSFLAAI RAAAEDSRER YPDHAYALHY 
ESIKRGVQRA SQIRVDELAE DYPWVTKLMA PLRGLTVPCS FSVIEGRWNE YFPHGPDEIR 
STRLPPQHAE QGWRGVCNDL ERLGIFERMH DMRINMPDLY RVGFGLGRRG GVKPIRQP