Gene Sare_4641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4641
Symbol
ID	5706228
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	5262068
End bp	5263075
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	70%
IMG OID	641274042
Product	ADP-ribosylation/crystallin J1
Protein accession	YP_001539389
Protein GI	159040136
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1397] ADP-ribosylglycohydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGAAC TGAGTGTGTC GACTGCGGCA TCAGGGTGTT TGTTCGGCCT GGCATACGGC 
GACGCGCTGG GCAAACCGAC CGAGTTCATG ACGGTCGCCG ACATCGTTGC CCAGTACGGA 
CCCGGTGGCC CTCGTGAGTT GGCGGGCGAT CCCGCTCTGG TCACCGACGA CACCCAGCTG 
ACCCTGGCGG TCGGGACGGC GTTGATGAAC GCGCCCACGC TGTCGGCCGA GGTGCTGGAG 
CCCCTGCTTC GCGAGCGGTT CGTGCGCTGG GCCGGCAGCC CCGACAACGA CCGGGCGCCC 
GGTATGACCT GCCTGCGAGC TTGCGGTGAC CTCGCGCTCG GCCGGCCGTG GACACAGGCC 
ACAGTGATCG GCTCCAAAGG CTGCGGCGCG AACATGCGGG TCGCGCCGGT CGGGCTGGTC 
GCCGGCGACG ACCTGGACAC CCTTGCCGGG GTGGCGCAGC TGCAGGCGGC GATGACACAT 
GGGCATCCCA CCGCCCTCGC GGCCAGTGAG TTGACCGCAT ACGCCGTGCG GCTGTTGTGC 
GACGGGACGG AGCCGGCCGT CCTGCCCGCC CTGCTCCGGG CCCGATGCCA CGACCAGCGC 
ACTGTCTACC GCGCCGAGTG GCTGGACGTG CTGTGGCAAC AGCCCGGGGT CGCCAGCCCC 
GCCGACTACA TCAGCCGGGG CTGGGACGAG TGCCTACGGG TACTGGATCG GCTCGATCTC 
GCACTCGCCC CGGCCGACGA CCGTGACGAC GCCTGTCGGG TCACCGGTGC CGGTTGGGTC 
GCCGAGGAGG CCCTGGCCAC GGGACTGCTG TGTGCGATCC GGCATACCGA CGATCCGGTG 
TCCGCTCTTG CCCGCGCCGC TACGACCTCA GGTGACTCCG ACTCCATCGC CTGCCTGACC 
GGCGCGTTCC TCGGCGCCGC GTTCGGTATG GCCGCCTGGC CGGTGTCCTG GCGTGATCGG 
ATCGAGTACG CCGACGAGCT CACCACGATG GGTGAAGCCT GGAACTGA

Protein sequence

MRELSVSTAA SGCLFGLAYG DALGKPTEFM TVADIVAQYG PGGPRELAGD PALVTDDTQL 
TLAVGTALMN APTLSAEVLE PLLRERFVRW AGSPDNDRAP GMTCLRACGD LALGRPWTQA 
TVIGSKGCGA NMRVAPVGLV AGDDLDTLAG VAQLQAAMTH GHPTALAASE LTAYAVRLLC 
DGTEPAVLPA LLRARCHDQR TVYRAEWLDV LWQQPGVASP ADYISRGWDE CLRVLDRLDL 
ALAPADDRDD ACRVTGAGWV AEEALATGLL CAIRHTDDPV SALARAATTS GDSDSIACLT 
GAFLGAAFGM AAWPVSWRDR IEYADELTTM GEAWN