Gene Sare_4940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4940
Symbol
ID	5706490
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	5608318
End bp	5609529
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	66%
IMG OID	641274335
Product	epocide hydrolase domain-containing protein
Protein accession	YP_001539677
Protein GI	159040424
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.23787
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCCGT ACCGTGTTGA AATCCCAGCA GAGGCCATCG ACGACCTTCG TGCTCGATTG 
GGCCAGACCC GGTGGCCGGC CGAGACCCCG GACGTCGGCT GGAGCCGCGG GGTGCCGCAG 
ACCTACCTTC GGGATCTGGT CGAATACTGG CGCACCGAGT ACGACTGGCG CGCCACAGAG 
GCTCGGATCA ACCAGTATCC GCAGTTCATG ACCAACGTCG ACGGTGCGAA CATCCACTTC 
CTGCACGTGC GGTCACCCGA GCCCGACGCG GTGCCGATGG TGATCACCAC GGGCTGGCCG 
AGCTCGATCA TCGAGTATCT CGACGTGATC GGCCCACTGA CCGATCCCCG AGCCCACGGC 
GGCGACCCGA AGGATGCGTT CCACCTGGTC ATTCCCTCGC TGCCCGGGTT CGGGTTCTCC 
ACCCCGCTCA CCGAGCACGG CTGGACGGTC CCTCGGATGT CGGCCGTCTG GGCCAAGTTC 
ATGGCCGCCG TGGGGTATGA CCGATACATC GCGCAGGGCG CCGACTGGGG CTCGTTCATC 
TCGCTCATTC TCGCCGGGGT CGACCCCGAT CACGTGCTCG CCGCTCACGT GAACTTCCTC 
GTGACGCCGC CGACCGACGC GTCCGACCTG GCCGGCCTCA GTTCGGAAGA GCTGGCCCTG 
CTGGACCCGT ACATGCTGCC CGCGCCCGGC TACATGGTCG AGCACGCGAC CAAGCCGCAG 
ACCCTCAGCT ACTCTCTCAC CGACTCGCCG GTCGGCCAAC TCGCGTGGTA CATCGAGAAG 
TTTCACCAGT GGTCGGGCGC GGACAAGTCC CCCGAGGACG TCTTCGACCG CGATGCGCTG 
CTCGCCAACG TCACGCTGTA CTGGTTGACC GGGACGGCCG GCTCGGCGGC ACACTTCTAC 
TGCGACAACG CGCCGTTCAC GCGTACCTCG GCGACCCCGC ATCCGGAACT GGCCGTCGCC 
CACGAGAAGT TCGAAGCCCA CCGCACCTTT GTGGCGCCGC TGCCGCCGGT CACCAGGCCT 
GTCGGGGTTG CGCTGTACCC GGACGACATC ATGATGCCCA TTCGCAGTTA CGCAGAGCGC 
GCATTTACTG ACATCGTGCA TTGGAACAAA CTCGAGCGCG GAGGCCACTT CCCCGCCCTG 
GAGGCGCCTG ACCTGTTCGT CGAGGACCTG CGGGCATTCC GGCGTGCCCT GCGCACCCGA 
CAGGAAAGCT GA

Protein sequence

MRPYRVEIPA EAIDDLRARL GQTRWPAETP DVGWSRGVPQ TYLRDLVEYW RTEYDWRATE 
ARINQYPQFM TNVDGANIHF LHVRSPEPDA VPMVITTGWP SSIIEYLDVI GPLTDPRAHG 
GDPKDAFHLV IPSLPGFGFS TPLTEHGWTV PRMSAVWAKF MAAVGYDRYI AQGADWGSFI 
SLILAGVDPD HVLAAHVNFL VTPPTDASDL AGLSSEELAL LDPYMLPAPG YMVEHATKPQ 
TLSYSLTDSP VGQLAWYIEK FHQWSGADKS PEDVFDRDAL LANVTLYWLT GTAGSAAHFY 
CDNAPFTRTS ATPHPELAVA HEKFEAHRTF VAPLPPVTRP VGVALYPDDI MMPIRSYAER 
AFTDIVHWNK LERGGHFPAL EAPDLFVEDL RAFRRALRTR QES