Gene RoseRS_3600 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_3600
Symbol
ID	5210578
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	4497522
End bp	4499273
Gene Length	1752 bp
Protein Length	583 aa
Translation table	11
GC content	62%
IMG OID	640597193
Product	fibronectin-binding A domain-containing protein
Protein accession	YP_001277905
Protein GI	148657700
COG category	[K] Transcription
COG ID	[COG1293] Predicted RNA-binding protein homologous to eukaryotic snRNP
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.110241
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATTTCG ATGCGTTGAC GCTTGCCGCC GTTGTCGATG AGTTACGCGC CACTCTTGTC 
GGTGGTCGTG TCCAGCATGT CCTGTTGCCG GGAGAGTTGA GCGTCGCTCT CGAAATCTAC 
GCCGGTCGGC GCTATTATCT CGTACTTTCC GCCCATCCGC AATTCGCGCG CGTTCACCTC 
AGCCCGGTGC GCATCTCGCG TGGCACGGAT GCGACGCCGC CACTGCTGCT GTTGCTGCGC 
AAGTATGTCA ATCGTGGTCG GATCACCGCT ATCGAGCAAC CGGATCTGGA GCGTGTGTTG 
CTGCTAAGTA TAGCCAAACG GCCGCTCCTG CGCAACTCTG ATGACGAACC TGAACTCGAT 
AGCGATGATG AGGATCGACC AGACACCACA TCACCGGAGA ATGAAACACT CCGGTGCGAA 
TTGATTGTTG AAATCATGGA ACGCCGCAGT AATATCGTGC TGGTGGGCGA CGATAACGTG 
ATTCTGGCGG CAGCACGGCA TGTGACGCCA CGTATGAGCC GGCGTCCGGT GTTGCCGCGT 
GAACCATACG AACTGCCGCC GCCCCAGTCC AGGCACGATC CGCGCCAGAC GACAGCAGTC 
GAGATGCGCG CTGCCGTGCC GGATGGTCAA CCCGATCTGG CGCGCGCGCT GGTGAGCGCC 
TACCGTGGGC TGTCGCCGCT TGCTGCGCGT GAGGTGGTCT ATCGTGTGAT GGGGCGCACC 
ATTGTGCCAA CCGGCGCCGA TCTGCCATGG GAAGCGCTTG CCGGTGCGTT GCGGCAGTTG 
TGTCAGCCTC CCTGGACGCC GCATATTGTG ATTGATGATG GCGAACCGGT CGCATTCGCG 
CCATACGAAC TGACCCATCT GCCGGGGGCG CGTCCCTGTC CATCGATGAG CGCTGCGCTG 
GACGCATACT ATGCAACGCG CGAGCGCCTT ACCGCCCATC ATCAACGGCG CGACGCTCTG 
CGTGAGCGGT TGAACGCCAT GCGTGAGCGT CTGGAGCGGC AACGTTCCGC CCTCCGCGCC 
GAACTGGAGC GCGCTTCCGA TCTTGAGCGG TTGCGCTGGG AAGGAGAAAT GATCTTTGCG 
TTCCTTCACG AACTGGCGCC AGGACAGGAT CATCTGGAGG TGGACGGGCG ACGTATCGCG 
CTCGATCCGC GCAAGTCGCC GGTCGAGTGT GCGCAGGATC GTTTCCGCGC CTATGAGAAA 
GCCAAAGGTG CGCTTGCTGG CGTTCCCGAA CGATTGCGCG CCGTCGAGTT GCGTCTGGCA 
GGTCTGGATG AAACGCTGGC GCTACTGGAA CTGGCGGAAG GATACGACGC TATCGAGGCA 
ATTGCACGTG AGGCAGAGGC GGAAGGCTAT CTCGGACCTG AAACAGGTCG CACCCGCAAG 
CGTCCTGATC GCCCTGCGCC GCCGTTACGC CTCGAATCAA GCGACGGCTT GACCATCTAT 
GTTGGACGCA CTGCACAGCA GAACGAACAT GTCACCTTTC GCCTCGGCGC ACCTGATGAT 
CTCTGGCTGC ACGTGCGCGG CGCACCTGGT GCGCACGTGA TTATCAAAGC CGGTCAGCGT 
GACGTCCCGG AGCGCACCAT CGAAGAAGCA GCAGCGCTGG CAGCGTACTA CAGCAGTCAG 
CGCGCCTCTG CCAGCGTCGA GGTTGAAATT GCACGGCGAC GCCACGTGCG GAAAGTGCGT 
GGCGGACCGC AGGGCCTGGT GACCTATCAG GCCGAGCGGG CAGTGCGTGT GACGCCACGC 
CCGCCGTGGT AG

Protein sequence

MYFDALTLAA VVDELRATLV GGRVQHVLLP GELSVALEIY AGRRYYLVLS AHPQFARVHL 
SPVRISRGTD ATPPLLLLLR KYVNRGRITA IEQPDLERVL LLSIAKRPLL RNSDDEPELD 
SDDEDRPDTT SPENETLRCE LIVEIMERRS NIVLVGDDNV ILAAARHVTP RMSRRPVLPR 
EPYELPPPQS RHDPRQTTAV EMRAAVPDGQ PDLARALVSA YRGLSPLAAR EVVYRVMGRT 
IVPTGADLPW EALAGALRQL CQPPWTPHIV IDDGEPVAFA PYELTHLPGA RPCPSMSAAL 
DAYYATRERL TAHHQRRDAL RERLNAMRER LERQRSALRA ELERASDLER LRWEGEMIFA 
FLHELAPGQD HLEVDGRRIA LDPRKSPVEC AQDRFRAYEK AKGALAGVPE RLRAVELRLA 
GLDETLALLE LAEGYDAIEA IAREAEAEGY LGPETGRTRK RPDRPAPPLR LESSDGLTIY 
VGRTAQQNEH VTFRLGAPDD LWLHVRGAPG AHVIIKAGQR DVPERTIEEA AALAAYYSSQ 
RASASVEVEI ARRRHVRKVR GGPQGLVTYQ AERAVRVTPR PPW