Gene RoseRS_4236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_4236
Symbol
ID	5211221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	5307338
End bp	5309050
Gene Length	1713 bp
Protein Length	570 aa
Translation table	11
GC content	53%
IMG OID	640597825
Product	BNR repeat-containing glycosyl hydrolase
Protein accession	YP_001278529
Protein GI	148658324
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000155192
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000114399
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGAATAGAC ATCACACTAT CCGCTACTAT CGTAAGTTTT TGATCGCTGC AACCCTGCTT 
ATTGGGTTGA TAGGCGCTTT TATCGGCTTG CACACAACTG TACATGGGCA GACGACACGT 
TGGTCACAAC CGGTAGATCT TTCGGTTGGG GCGAGGTCCT CATGGTTTCC AAGCCTGACT 
GTTGCGGCGG ATGGCAGTGT GCATGTCGTG TGGGCTAGCG GTCGACCGCT CACCGAGGAT 
AGTGGATTTA GTGCTGGTTC AAATCTTGCC AATGTTATGG ATCTGTTGAT GTATGCCGTG 
TATCGAAATG GCAAGTGGTC GCCAGCAAAT GATATTCTTT TTTCCGGTTT GGGCGGAGCG 
GCTGTCCGAA ACAGTATTGT AACTGGTCAT GATGGGAATC TCCACGTTGC TTTCCGGAGC 
AGCGAACGCA TCTTTTTCAG CAGCGCGGAT CCTGTGCAGG CATTTCGCCC GTTTGCCTGG 
CGCGATCCGA GAAGGATAAA TGGCTCGAGC GGACCGTACT ATGTTGAACT GGCGGTTGAT 
AGTAAAGGAA CATTGCACGT GGTATGGACG GAGGTCGTAG TTTCGGAAGA ACGATCACGG 
TATACCTTGT GCCCGTACTG CGCTAACCTC TTCTATCGCA ATTCGCAAGA TGGCGGGCTG 
ACCTGGTCGG CGCCTGTCAA TCTGGCGGAT TCGTTTGATG GAACGACCAA ACCGCACATT 
GCTATTGATC TGCAGGATGG GATTCATGTC GTATGGGATA TTGGCTTTGA TAATATAACT 
GGCAAAGGCG CCCCTCTTGC TGGCGGGTAT CGCTATTCAA GCGATGGCGG TATCACGTGG 
AATACTGTAG TGCGTTTTAC ACTCGCCGAA GGGCAATCTT CCCTTCAGCC GACCCTGCTT 
TCAACGTCAG TTGCGTTGCC AACCCAAACA GTCACTCCAC CCTCTACAGA AACTCCCGCG 
AATCCACTCA TTGAATCGCT CAGCGATGCG CCGCAGCAAA CGACGCTTGG ACTTTTTCAG 
CACCGTGATC CGATTGTTGT GTACCGCAGC ACACGAACTG ATCGGATTTA CTATCAGGTT 
TCACGTGACA ATGGTATAAC CTGGAGCAAT CCGCGTATAC TCCATGGCGT GCGCGCACGT 
GACCTTAGAG AAACACCATG GGATGCATAC ACGATGGCTA CCGATGGCTC GGGAAATGTC 
CATCTTATTC TCTCCGGTTT GCTGGATACA GGGAATGCTC CGACGAACCG CCAGAAGCCC 
TCACTGCTGC ATCTGGTCTG GAATGGCGCT TACTGGTCTC GTCCAGAAGT TGTTGTTGCG 
AATGACTTGT ATCCCGAATG GCCACGCCTC GTCGTGCACG GACAGCAGTT GCATCTCGTC 
TGGTTCACGC GTAGCGATGA AGACATTTTC AAGAGTGATA ATGCGAACTA TCGGGTGTGG 
TATAGCAGCG CGACTATCGA TGCACTGCCA TTGCCGGCAG CGCCAACGTT TACTCCTGCG 
CCAACTGACG GACCAACCCC TACAATCATT CCATCGCCTG CGCCTTCGCC GACCCCGTTA 
CCATCAGCGA TACAGCAAGT CCCGCCACCG AATGGATATC CAGCCTGGGA GTCGGTGGCA 
CTGACCGTCA TGAGCATTGC GTTACTGCCG GTGCTTGCCT TCGTAGCAAT CGTAGCAATC 
GCTCACTCAC GCGGTATGCG CTGGCGCATA TAA

Protein sequence

MNRHHTIRYY RKFLIAATLL IGLIGAFIGL HTTVHGQTTR WSQPVDLSVG ARSSWFPSLT 
VAADGSVHVV WASGRPLTED SGFSAGSNLA NVMDLLMYAV YRNGKWSPAN DILFSGLGGA 
AVRNSIVTGH DGNLHVAFRS SERIFFSSAD PVQAFRPFAW RDPRRINGSS GPYYVELAVD 
SKGTLHVVWT EVVVSEERSR YTLCPYCANL FYRNSQDGGL TWSAPVNLAD SFDGTTKPHI 
AIDLQDGIHV VWDIGFDNIT GKGAPLAGGY RYSSDGGITW NTVVRFTLAE GQSSLQPTLL 
STSVALPTQT VTPPSTETPA NPLIESLSDA PQQTTLGLFQ HRDPIVVYRS TRTDRIYYQV 
SRDNGITWSN PRILHGVRAR DLRETPWDAY TMATDGSGNV HLILSGLLDT GNAPTNRQKP 
SLLHLVWNGA YWSRPEVVVA NDLYPEWPRL VVHGQQLHLV WFTRSDEDIF KSDNANYRVW 
YSSATIDALP LPAAPTFTPA PTDGPTPTII PSPAPSPTPL PSAIQQVPPP NGYPAWESVA 
LTVMSIALLP VLAFVAIVAI AHSRGMRWRI