Gene RoseRS_1626 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_1626
Symbol
ID	5208581
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	1995016
End bp	1996101
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	61%
IMG OID	640595232
Product	hypothetical protein
Protein accession	YP_001275968
Protein GI	148655763
COG category	[S] Function unknown
COG ID	[COG5282] Uncharacterized conserved protein
TIGRFAM ID	[TIGR03624] putative hydrolase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCGCG CTGCCGGCAG CATGCCGCGT CCACGAATGA TCGACTGGTT GCAGGCGCGC 
AATGTCGGCG TCGCGGTTTC ACAGTCATAC CTTGCGCCGA TGATCGATCG CGCTGCGCGT 
CAGGATCAGT ATCGTCAGTT AGTGCAGCGC AGCGAGCCGT TGATCGCCGC GTATATGGGG 
GTGCGCCTGC CGCGCCCGGT CGAACGCATC TACGTTTTTG ACCGGGCGGA ATGGATCGAA 
GCCAACCTCT CCGCCTTTCA GTCGCTTTTT GCGCCGCTCG AAGAGTTGTA CGATGAAATC 
AGCGCGCGTC AGGGGGTGGT CGGGTTGCTC ATGGGGCAAC TCAACAGTCA ACTGCTGGGG 
ATGCAGATGG GCGCGCTGAT CGGGTTCCTG GCGCGGCGCG TGCTCGGTCA GTACGATCTC 
GGTCTGCTCT CGCCCGATCC GGATCTGCGC GGCGCGCTCT ACTTCGTCGA GCCGAACATC 
ACGCGCATCT GCGCCCAACT CGGTCTTGAT GGCGACGACT TCCGCATGTG GATCGCACTC 
CACGAAACGA CGCACGTCTT TGAGTTCGAA GCATTCCCCT GGGTGCGCGA CTATTTTCAG 
GATCTGCTCC GTCAATTTAT CGGTCGGGTG AACGACCAGG CCGCGATGCT CAGCGTCGGT 
ATCGTGCGAT TGATCGAACG GTTGTTGCAG GGTCAACCGA TCGACCGACA CTGGATCGAG 
TTGATGCTGA CGCCTGAGCA ACAGGCGATC TTTACCCGCA TGCAGGCGTT GATGTCGGTG 
GTGGAAGGGT ATTCCAACCA CATTATGAAC GTCATCGGCG GGCAGTTGCT CCCCAGTTAT 
CAGCAGATCG AAGCACGGGT ACGCCAGCGC CAGTTGCGTC GCCCGCTGAT CGAGGAAGCG 
TTCAATCGTT TGACCGGTAT GGACCTGAAA CTGGCGCAGT ATCAGCAGGG CGAGGCGTTC 
ATCCAGGCAG TCGTGGCGGC GCGCGGCGCC CGCTTCGCCA ACCGTATCTG GGAAGGTCCG 
GAATATCTGC CGACAATGGA GGAGATCCGC GCACCGCAGC GCTGGATCGC GCGCATGGGC 
GGATGA

Protein sequence

MIRAAGSMPR PRMIDWLQAR NVGVAVSQSY LAPMIDRAAR QDQYRQLVQR SEPLIAAYMG 
VRLPRPVERI YVFDRAEWIE ANLSAFQSLF APLEELYDEI SARQGVVGLL MGQLNSQLLG 
MQMGALIGFL ARRVLGQYDL GLLSPDPDLR GALYFVEPNI TRICAQLGLD GDDFRMWIAL 
HETTHVFEFE AFPWVRDYFQ DLLRQFIGRV NDQAAMLSVG IVRLIERLLQ GQPIDRHWIE 
LMLTPEQQAI FTRMQALMSV VEGYSNHIMN VIGGQLLPSY QQIEARVRQR QLRRPLIEEA 
FNRLTGMDLK LAQYQQGEAF IQAVVAARGA RFANRIWEGP EYLPTMEEIR APQRWIARMG 
G