Gene Sare_4700 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4700
Symbol
ID	5708160
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5321924
End bp	5323099
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	69%
IMG OID	641274098
Product	DNA integrity scanning protein DisA
Protein accession	YP_001539444
Protein GI	159040191
COG category	[R] General function prediction only
COG ID	[COG1623] Predicted nucleic-acid-binding protein (contains the HHH domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.018924
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGATCG ACCGCGATGC CACCAAGCCT GCCGGCGCGA CGCCGCATGC CCGCACCGCT 
GCCGTGGGTT CGCCCGCCCG TCCGATCAGC GTGCACGTGA CCGGAGGCGT GGCCAGTGAC 
CCGCTGCGCG CCAACCTGGC CCTGATGGCA CCGGGCACCG CCCTACGCGA CGGTCTGGAG 
CGGATCCTCC GCGGACGCAC CGGAGCCTTG ATCGTCCTCG GCTACGACAA GGTCGTCGAG 
AGCCTCTGCA CTGGCGGCTT CCCGCTCGAC GTGGAGTTCT CCGCCACCCG CGTACGAGAA 
TTGTGCAAAA TGGATGGCGC AGTGGTGCTT TCCAGCGACG GTAGCCGGAT CGTCCGCGCG 
GCAGTGCACC TGATGCCCGA TCCCGCGATC CCGACCGAGG AGTCCGGCAC CCGTCACCGT 
ACCGCCGAGC GGGTCGCCCG CCAGACCGGC TACCCGGTCA TTTCGGTGAG CCAGTCCATG 
CGGATCATCA GCCTCTACGT CAACGGTCAG CGGCACGTGC TGGACGACTC GGCCGCCATC 
CTCTCCCGAG CCAACCAGGC GCTCGCCACG CTCGAGCGAT ACAAGCTGCG CCTGGATGAG 
GTGTCCGGCA CCCTCTCCGC CCTGGAGATC GAGGACCTGG TCACCGTTCG GGACGCGGTC 
GCCGTCGTCC AACGACTGGA GATGGTCCGC CGGATCGCGG ACGAGATCGC CGGGTACGTG 
GTGGAACTGG GCACCGACGG CCGGCTGCTC GCCCTGCAAC TTGACGAGTT GATGGCCGGC 
GTGGACGCCG ACCGCACCCT GGTCATCCGG GACTACCTGC CCACCGGCCG CAAGTCACGC 
ACCCTTGACG AGGCCCTGGT CGAATTGGAC CTGCTGACCG CAACCGAACT GATCGATCTG 
GTTGCGGTCT CCCGAGCGAT CGGCTATCCG GCGGCCTCCG ACGCGCTGGA CGCCGCGCTC 
AGCCCGCGCG GCTTCCGGCT ACTGGCCAAG GTACCGCGCC TGCCGGTAGC GATCGTGGAC 
CGTCTGGTGG GGCACTTCGG CAGCCTTCAG CGGCTACTCG GCGCGACCGT GGAGGACCTG 
CAGGCCGTCG AGGGCGTGGG AGATGCCCGC GCCAGGGGCG TGCGGGAAGG GCTTTCCCGG 
CTCGCCGAGG CATCGATCCT GGAACGCTAC GTCTGA

Protein sequence

MPIDRDATKP AGATPHARTA AVGSPARPIS VHVTGGVASD PLRANLALMA PGTALRDGLE 
RILRGRTGAL IVLGYDKVVE SLCTGGFPLD VEFSATRVRE LCKMDGAVVL SSDGSRIVRA 
AVHLMPDPAI PTEESGTRHR TAERVARQTG YPVISVSQSM RIISLYVNGQ RHVLDDSAAI 
LSRANQALAT LERYKLRLDE VSGTLSALEI EDLVTVRDAV AVVQRLEMVR RIADEIAGYV 
VELGTDGRLL ALQLDELMAG VDADRTLVIR DYLPTGRKSR TLDEALVELD LLTATELIDL 
VAVSRAIGYP AASDALDAAL SPRGFRLLAK VPRLPVAIVD RLVGHFGSLQ RLLGATVEDL 
QAVEGVGDAR ARGVREGLSR LAEASILERY V