Gene RoseRS_3033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_3033
Symbol
ID	5210001
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	3813561
End bp	3814778
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	59%
IMG OID	640596625
Product	hypothetical protein
Protein accession	YP_001277347
Protein GI	148657142
COG category	[S] Function unknown
COG ID	[COG3214] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCTCA CACTGACGTC CGCTGCACTC CGTGCAGTGC TGCTGGCATC ACAGGGGCTT 
GATCAACCGC CGCAGCGCGC GGCAACCCGG GATGACCTTC TGGAAACCAT CCGGCGGATG 
GGTGCATTGC AAATCGACAC CATCCACGTG GTCGCGCGCA GCCCGTACCT GGTGCTGTGG 
AGCCGCCTAG GGGCGTATGA TCCGCGCTGG TTGACCGATC TGCTGGTGGA GCGAGCAATC 
TTTGAGTACT GGTCGCACGA AGCCTGTTTT CTGCCGATTG ACGATTACCC GATCTACCGG 
TCACTCATGT TGGCAGGGCG CACGCGCAGC AATGCCTATG CGCGCAAGTG GTTGCACGAG 
CATCAATCGA TTGCTGCTGC GCTGATCAAC GATATTCGCA ACAACGGACC GGTTCGCTCA 
GCAGACTTCG TTCGCGCTGA CGACGCGAAG GGAGGATGGT GGAACTGGAA GATCGAAAAG 
ATGGCGCTGG AAATGCTCTT CATTGTCGGT GATCTGATGA TTGACCGGCG AGAGAACTTT 
CAGCGCGTTT ACGACCTGCG TGAGCGAGTT CTGCCTGAAT GGGACGATGC CCGTATACCT 
GATGTCGAGA CAGCGCAGCG CACACTGATC CTTGCGGCAG CACAGGCGCT CGGTGCGGCG 
CCAGCACGCT GGCTCGCAGA CTACTTTCGC CTGAACAAGG CAGAAACGGC GCGCATTGCC 
GCTACACTGG CAGCCAATGG CGCACTCGCA ACTGCTCGTG TCGAAGGATG GCGCGATCCG 
GTCTACATTC ATCCGGGCAA TCTGCCGCTG GCTCAGGCTG CCGCCGATGG CGCGCTCCGA 
TCAACGATGA CGACGCTTCT CTCACCGTTC GATCCTGTCG TGTGGGATCG GCAGCGCATC 
CGGGAACTGT TTGGCTTCGA CTATCGCATC GAGTGTTATA CACCTGCACC CAAACGACGC 
TATGGCTATT TCACATTGCC CATCCTGCAT CGGGGCGCGC TGATCGGGCG GCTTGATCCA 
AAAGCGCACC GGAAAGATGG TATATTTGAG GTCAAGGCGC TCTATATCGA GCCAGGCGTC 
GATCCAGACG AAGACCTTGC GCTGGAGCTG GCGGCAGCGT TGCGCTCCTG TGCAGCATGG 
CACGGCACAC CCGACGTTGT TATTCGCCAG TGTGATCCGC CAGCGTTCGG TATACTGCTG 
AAACGCGCCC TCTCATAA

Protein sequence

MSLTLTSAAL RAVLLASQGL DQPPQRAATR DDLLETIRRM GALQIDTIHV VARSPYLVLW 
SRLGAYDPRW LTDLLVERAI FEYWSHEACF LPIDDYPIYR SLMLAGRTRS NAYARKWLHE 
HQSIAAALIN DIRNNGPVRS ADFVRADDAK GGWWNWKIEK MALEMLFIVG DLMIDRRENF 
QRVYDLRERV LPEWDDARIP DVETAQRTLI LAAAQALGAA PARWLADYFR LNKAETARIA 
ATLAANGALA TARVEGWRDP VYIHPGNLPL AQAAADGALR STMTTLLSPF DPVVWDRQRI 
RELFGFDYRI ECYTPAPKRR YGYFTLPILH RGALIGRLDP KAHRKDGIFE VKALYIEPGV 
DPDEDLALEL AAALRSCAAW HGTPDVVIRQ CDPPAFGILL KRALS