Gene Sare_2375 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2375
Symbol
ID	5705116
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2730498
End bp	2731559
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	73%
IMG OID	641271853
Product	5'-3' exonuclease
Protein accession	YP_001537224
Protein GI	159037971
COG category	[L] Replication, recombination and repair
COG ID	[COG0258] 5'-3' exonuclease (including N-terminal domain of PolI)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0822086
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00237783
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGTGTCGA CGCCCACCAC CGACGAGGAC CCGGCGCGGG AGGCCCCATG GCAGACCACA 
CCGGACCCGG AGCCCGGTCC GCCGGCGTGT CACACCATGC TGGCGTCCAC CCGGACGTCG 
GTGCGGTGTG CCAGGCTGTC GGGCGTGACA GCCCCGATCA TGCTCGTTGA TGCGCCCAGC 
CTCTACTTCC GGGCCTACTT CGGTATCCCC GAGTCCGCCG CCACCGCGCC GGGCGGTCAA 
CCGGTCAACG CCGTTCGCGG CTTCCTCGAC ATGCTGGCAA GTCTGATCCG CACCCGGGGG 
CCCGGCCGGA TGGTGTGCGC GATGGACCAC GACTGGCGGC CCGACTGGCG GGTGGCCCTG 
CTGCCCTCGT ACAAGGCGCA CCGGGTGGCG CCGGAAGGCG GTGAGGTGGT CCCGGACACC 
CTGAGCCCAC AGGTGCCGGT GATCCTCGAC GTGCTCGACG CGCTGGGCAT CGCCACTGTT 
GGCGCCTCCG GGTACGAGGC CGATGACGTG CTCGGCACCC TCTCGGTCAC CCAACCGGGG 
CCCGTCGAGG TGGTCTCCGG TGACCGCGAC CTGTTCCAGC TGGTCGACGA CGCCCGCGGG 
GTGCGGTTGC TCTACATCGG GCGGGGGGTG GCCAAGCTGG CGGACTGCGA CGACACCGCG 
GTCCGGGCCC GCTACGGTGT GCCAGCGGCC CGCTACGCCG ACTTCGCCGC GCTGCGCGGC 
GACCCCAGCG ACGGGCTGCC GGGGGTGCCC GGCGTCGGCG AGAAGACGGC GGCCCGGCTC 
GTTGACCGGC ACGGCGACAT CTCCGGTGTG CTCGCCGCCC TGGACGATCC CGGTGCGGGA 
TTCGCGCCGG GGCTGCGCGC GAAACTGGCC GCCGCGCGGG ACTACCTGGC CGTCGCCCCG 
ACGGTGGTCC GGGTCGCCCT CGATGTGCCC CTTCCGGCCC TGTCCACCGA CCTGCCGACC 
GTGCCGGCTG ACCCCGATCG GCTGCTCGAC CTCGCCGAGC GATGGAACGT CGCCGGTGCC 
GTCCGGCGCC TGGTCGATGC CCTGGCCGCC CGAACCGATT GA

Protein sequence

MVSTPTTDED PAREAPWQTT PDPEPGPPAC HTMLASTRTS VRCARLSGVT APIMLVDAPS 
LYFRAYFGIP ESAATAPGGQ PVNAVRGFLD MLASLIRTRG PGRMVCAMDH DWRPDWRVAL 
LPSYKAHRVA PEGGEVVPDT LSPQVPVILD VLDALGIATV GASGYEADDV LGTLSVTQPG 
PVEVVSGDRD LFQLVDDARG VRLLYIGRGV AKLADCDDTA VRARYGVPAA RYADFAALRG 
DPSDGLPGVP GVGEKTAARL VDRHGDISGV LAALDDPGAG FAPGLRAKLA AARDYLAVAP 
TVVRVALDVP LPALSTDLPT VPADPDRLLD LAERWNVAGA VRRLVDALAA RTD