Gene Sare_4491 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4491
Symbol
ID	5707377
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5075933
End bp	5077069
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	68%
IMG OID	641273905
Product	cupin 2 domain-containing protein
Protein accession	YP_001539254
Protein GI	159040001
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0456029
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTTTCC TCGTTCCCAT CCACGCGCCC GCGACCAGGG GCGAACCGTT CGATTTCGGT 
ACGCACGCCA ACGACTTCCT CGTCAAACGG GAAGAGGCGC GGGCGACCGA GACGTTCCTG 
GTCCGCGTCC CCGGCCTGGG CGCTGTTCCC GAGCACGTGC ACGCCGACAT GGAGCAGACA 
TTCGTCTTCC TGTCCGGGGT GGGCACGGCG ACCCTTCGCT GCGACGGCGA TCAGGTCACC 
TACCGATGCC TGCCCGGCGA CACGATCTTC GTCCCGGTCG GTTGGCACCA CTCGGTGGCT 
GCTGACTCGC TGGAGGGCGT CACTTACGTG ACCGTCAACG CCTTCCTGCC GGACGCCAAG 
CGGGTCGGCG GGACCGCCAT CTTCCACGCC GAGGAGGTGA ACACCGCATT CGCTAAGGTT 
CTCGCCGCTG GCCGCAGCGA ACGGGTGGCC GACGAGACGG CGCTGTTCCG CTGCGCGGAA 
ACGGCGTTCC GCTGGGACGG CCCGGCGGGA GCCTGGGTGC AGGACTACAC GTCGCTGATC 
ACGACGCTGA CCGGGTCGCC CGAGGCGTAT CGGGTCGATC GGATCGGGCC GTTCGAGATC 
GCGCGGACAG TGACCCCCGT GGCGGCCATC TTGACGCGAT CGTTGGCCGA CGAGATCCAC 
GCGACCGTGG CGGGCCTGGC CCCCGTGGTG GTGGAGGGGT CGCAGTCGCC ATTATCGGTC 
AAGCCGCCGT ACGCAGGCTC GGATCTTGAC CTGCTGGTGG TGGTACGGCA TTCGGATGAA 
CTCGCGGTCG CGTCAAAGAC GGTGCGAGCA TTCGACGCCG TCGCTGACCG GATCCAGCTT 
CCGCTCGCGG TAGGCATGGT CTACCAGCCC TGGCTGGCCC TGCCCGGCTT CTACTCCACG 
GTCAACATCG ACCCCAGTCA CGAAGACCGG TACTGGTTCT CCGCCGCCCA GCCCGAGCGG 
CTCGCCGAGG CGACCCGCAG GCTGAAAGCG GGCCTCGCCA CCGTACGCGA TCAGGCCCGG 
ATGGCCGAGA TGTTCCAGGC CACCGTGGCG CTGGCCGGGC TGGACCACGA CCTCGTCCGC 
GAGTGGCGGG TGACACCGCG CTGGCGCGGC CTCGATGTGC TGGAGCCCCT GACATGA

Protein sequence

MPFLVPIHAP ATRGEPFDFG THANDFLVKR EEARATETFL VRVPGLGAVP EHVHADMEQT 
FVFLSGVGTA TLRCDGDQVT YRCLPGDTIF VPVGWHHSVA ADSLEGVTYV TVNAFLPDAK 
RVGGTAIFHA EEVNTAFAKV LAAGRSERVA DETALFRCAE TAFRWDGPAG AWVQDYTSLI 
TTLTGSPEAY RVDRIGPFEI ARTVTPVAAI LTRSLADEIH ATVAGLAPVV VEGSQSPLSV 
KPPYAGSDLD LLVVVRHSDE LAVASKTVRA FDAVADRIQL PLAVGMVYQP WLALPGFYST 
VNIDPSHEDR YWFSAAQPER LAEATRRLKA GLATVRDQAR MAEMFQATVA LAGLDHDLVR 
EWRVTPRWRG LDVLEPLT