Gene RoseRS_4020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_4020
Symbol
ID	5211003
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	5029577
End bp	5030902
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	56%
IMG OID	640597609
Product	zinc finger SWIM domain-containing protein
Protein accession	YP_001278315
Protein GI	148658110
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTCCA TCACTGCCGA AGAAGCCAAA GCCCTTGCCC CTGACCTGGC TTCGCTTAAA 
GCCGCTCAGG AACTGGCAGA TATTTGTCAT TGGGTCAGCC TGGGCGCCAA CGAAGCAGCC 
TTGTGGGGTG AATGCAAGGG CAGTGCACAA AAGCCATACA AGGTGCAGGT AGATCTGTCC 
AATCGCGGCT TTGCCTGCAC CTGTCCAAGT CGCAAATCTC CCTGTAAACA TGTCCTGGGA 
TTGATGCTGC TGGCATCGGC TTCGCCAACC ATATTGAAAG ATGCCACACC CCCTGCCTGG 
GTCTCTGAAT GGCTGGAAAA ACGCACCGAC CAGACGTCGG ATCACGCGGG ACAGGCTGAA 
CCCGACACTG CTTCGTCGCA GTCGCGTCAG AAAGACGCTG CACGCCGCGC CGCCAGACGT 
GAAAAACTGG TTGCTGCGGG TCTCGAAACG CTCGACCTCT GGCTCAAAGA CCTGATCCGC 
CAGGGCCTGG CTTTCGCCCA GAGTGCGCCG GCTTCGTTTT GGGAACAGCA ATCTGCCCGC 
CTGGTAGATG CCCAATTGCC TGGTGCGGCG CGGATGGTAC GCGAGATGCG GGACATTCCC 
GGCGCCTCCC CCAACTGGAC GGAAATTCTG CTCCTGAAAA TGGCGCGACT CCACCTGCTC 
ATCCAGGCCT ACCGTCGTCT GGAAAGCCTG CCCGAACCCT CACGCACCGA TGTGCGCACC 
CTGCTCGGCT GGACTATCAA TCGCAAGGAG TTGATCCTCT CTTCTCCCGC CCTGAGCGAT 
GACTGGCTGG TAGTGGCTCA GACCCTCGAG GAAGACGAGA CAAGTGGGTT GCGCACCCAA 
ATCAACTGGT TGTGGGGCAA AACCAGCCGC AAACCTGCTC AACTTATCCT CTTCGCTTTC 
AGAACCAGAC CCTTCGAAGA TCACCTTTTC CCTGGCCTGA CCTTGCGCGG TGATCTGGTT 
TACTTCCCCA GCGCATACCC CTTGCGAGCC GTTTTCAAAA GCTACCGGAG GCTGGAATCC 
ACTTTTGTTC CTGCTGGCTT GCCGAATTTT CTCGCCTTTC TCGATGCGTA TTCTACCGCG 
CTCGGCCTCA ACCCATGGTT AGAGCATTTT CCTGTCGTGT TGGAACATGT GACCATTGAA 
AGGTTGGAAA CAAACTGGCT TTTGTGTGAT GGTGAGAATC AGGCAATCCC CGTATCCTCC 
CGTTCCCACT GTTGGGAACT TCTTTCTCTT TCTGGCGGTC ACCCTCTCAC CGTTTTTGGC 
TTGTGGGACG GATTCTCATT TTTCCCCATG ACGGCCTGGG AGAACGAAAG GTTTGTTCGC 
CTATGA

Protein sequence

MSSITAEEAK ALAPDLASLK AAQELADICH WVSLGANEAA LWGECKGSAQ KPYKVQVDLS 
NRGFACTCPS RKSPCKHVLG LMLLASASPT ILKDATPPAW VSEWLEKRTD QTSDHAGQAE 
PDTASSQSRQ KDAARRAARR EKLVAAGLET LDLWLKDLIR QGLAFAQSAP ASFWEQQSAR 
LVDAQLPGAA RMVREMRDIP GASPNWTEIL LLKMARLHLL IQAYRRLESL PEPSRTDVRT 
LLGWTINRKE LILSSPALSD DWLVVAQTLE EDETSGLRTQ INWLWGKTSR KPAQLILFAF 
RTRPFEDHLF PGLTLRGDLV YFPSAYPLRA VFKSYRRLES TFVPAGLPNF LAFLDAYSTA 
LGLNPWLEHF PVVLEHVTIE RLETNWLLCD GENQAIPVSS RSHCWELLSL SGGHPLTVFG 
LWDGFSFFPM TAWENERFVR L