Gene Sare_0165 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0165
Symbol
ID	5706355
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	178824
End bp	179954
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	69%
IMG OID	641269691
Product	radical SAM domain-containing protein
Protein accession	YP_001535091
Protein GI	159035838
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.263951
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000169446
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCGGTAC GGGGGCAGTC GAGTCGGATG CGCGGCCTGG CCGCCGTTCC GGCGTATGTG 
GTCATGCAGC CCACCACGCT CTGCAACCTC GACTGCGTGT ACTGCTACCT CCCGTTGAGG 
GCGGCCGACC GGCGGATGCC GGTTGCGGTT GCGGAGGCGG TGGCGGCATC GGTCAACCCG 
TGGGCGCGGG CCGGGCGGTT CTCCGTGGTG TGGCACGGCG GCGAGCCGCT CGCTGCGGGG 
AGAGAGCTAC TCGCCGCGCT GATCGCCCCG TTCGGGCCGG AGGTCGAGCA TCACGTCCAG 
ACCAATGCGG CGCTGATCGA TGACGCCTGG TGTCGGTTCT TCGCGGAGCA CCAGATCCGG 
GTGAGTGTCA GCGTGGACGG GCCGCGGGAG CACAACGGGG GCCGGGTCAC CCGAGGCGGA 
CGTCCCGCGT ATGACCGGAT CGTGCAGGGA GTCGCGGCGT TGCGGCGGCA CGGCCTACCG 
TTTTCGGCGC TGGCTGTGGT GGGGCACCCC AAGCCAGGTC TCGCCCGTGA ACTCTATGAC 
TTCTTCCTCG ACCTCGGCCC GGACGTGCTG GGTGTGAACA TCGAGGAGAC CGAGGGAGTC 
AACACCCGGG CCAACCGTCA CGACGCGGCC GCGGTGACCG CCTTCTGGGC GGAGCTGGTG 
GCGGCCTGGC GCCGGAATCC CCGCATCCAT CTGCGTGAGG TCGAGTGGTC CCTGCGGTAC 
GCCGCCGCGG CGCTGGACGG TGTCGAGGGT GAGGTGCTGC CCCACCAGCT GGATCCGATC 
CCCACGGTCG GTCACGACGG TTCGGTGACC GTGCTCTCGC CCGAGCTGGC CGGCTTCACG 
AACCCCCGCT ACGGCGACTT CAGTAGCGGC AACGTGCTGG TCACCCCGTT GGCGGAGATT 
CTGGCCGAGG CCACACAGAC ACCCTGGGTG GGGGAGTTTC TCACCGGGGT GGAGGCATGC 
CGGTCGTCAT GTCCCTACTT CGGCTTCTGC GGCGGCGGCC ACGCGGCCAA TCGCTACTTC 
GAGCAGGGAC GGTTTGACGG CACCGAGACC GAGCACTGCC GCAACAGCAA GATCCGCCTA 
CTGGAGGGAG TGTTGGAGCA TGCCCGAGGA CACCGGTCAC CGGCAGTCTG A

Protein sequence

MAVRGQSSRM RGLAAVPAYV VMQPTTLCNL DCVYCYLPLR AADRRMPVAV AEAVAASVNP 
WARAGRFSVV WHGGEPLAAG RELLAALIAP FGPEVEHHVQ TNAALIDDAW CRFFAEHQIR 
VSVSVDGPRE HNGGRVTRGG RPAYDRIVQG VAALRRHGLP FSALAVVGHP KPGLARELYD 
FFLDLGPDVL GVNIEETEGV NTRANRHDAA AVTAFWAELV AAWRRNPRIH LREVEWSLRY 
AAAALDGVEG EVLPHQLDPI PTVGHDGSVT VLSPELAGFT NPRYGDFSSG NVLVTPLAEI 
LAEATQTPWV GEFLTGVEAC RSSCPYFGFC GGGHAANRYF EQGRFDGTET EHCRNSKIRL 
LEGVLEHARG HRSPAV