Gene Sare_1212 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1212
Symbol
ID	5706514
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	1362311
End bp	1363543
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	67%
IMG OID	641270729
Product	putative phiRv2 prophage protein
Protein accession	YP_001536110
Protein GI	159036857
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.131322
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCACC AACCGACCAA CACTGACCAG CCCCACGATG GCGCGGCAAT TCTCGACGTT 
CTGCACGCCT GCCTCACCAA ATACGTCATT CTCCCCAGCC CTGAGGCCGT CGACGCGGTG 
GCGCTGTGGA TCGCCGCCAC CCACGCCCAA ATCGCGTGGG CGCACGCTCC CCGCCTAGTG 
ATCCGGGCAC CAGAGAAGCG CTGCGGAAAG TCGCGGCTGC TCGACATCGT GGAAGGCACC 
TGCCACGACC CGCTCATCAC CGTCAACGCC AGCCCCGCAG CCGTCTACCG GGCCATCGGT 
ACCGGCCACC CACCCACGCT GCTGGTCGAT GAAGCCGACA CCCTTTTCGG CGGGAAGAAC 
GCCGACGCAA ACGAAGACCT ACGCGGACTA CTCAACGCCG GACACCAACG CAACCGCCCC 
GCCATCCGCT GGGACAACAA CACTCAAAGC TTGGAGAAGA TCCCCACCTT CGCCATGGCT 
GCCCTCGCCG GAATCGGCGC CATGCCCGAC ACCATCGAAG ATCGCGCCGT GGTCATTCGC 
ATGCGCCGCC GCGCACCCGG CGAAACCGTC GCACCATACC GACACAAGCG CGACGGCCCC 
GCCCTACGCG CCGTCGCCCA GCAACTGGCC CAATGGCTAC ATACCAACCT CACCACGCTC 
GAGGTCGCGG AGCCACCCAT GCCGGTCGAG GATCGGGCCG CCGACACCTG GGAACCCCTG 
GTGGCTGTCG CCGACCTCGC CGGGGGCGCC TGGCCTCAAC GCGCCCGACA GGCGGTAGCC 
ACGCTGACCG CCGAAGCCGA CGGATCGGGG AATGTCTCCC ATCGGGTACG CCTACTCGCC 
GACATCCGCA CCGCCTTTAC CACCCTCGGC GACCCAACCG CCGCGCCCAC ATCGGATCTA 
CTCGCCGCAC TCAACGGCGA CCCCGAGGCA CCCTGGGCCG ACAGCGGGCC CAACGGACTT 
ACCGGCAAAA AGCTTGGCGA CCTGCTCCGT GAGTTCGACA TCCGCTCCGA GACGGTTCGC 
TTCCCCGTCG GGCAGGCCAA GGGGTATACC CGCGACGCCT TTACCGACGC CTGGCAGCGC 
TACTGCCCGA CATCCGAAAC CCCTTCCACC GAGGTATCCG TACCATCCGT ACCAACGTCA 
TATCCGCAGG TCATCCCCGG TACGGATTAC ACCGCTGGTA CGGATCGATC CGTACCACAC 
CAACCCCACG CCAGCGCCCC TGGTACGCAT TAA

Protein sequence

MTHQPTNTDQ PHDGAAILDV LHACLTKYVI LPSPEAVDAV ALWIAATHAQ IAWAHAPRLV 
IRAPEKRCGK SRLLDIVEGT CHDPLITVNA SPAAVYRAIG TGHPPTLLVD EADTLFGGKN 
ADANEDLRGL LNAGHQRNRP AIRWDNNTQS LEKIPTFAMA ALAGIGAMPD TIEDRAVVIR 
MRRRAPGETV APYRHKRDGP ALRAVAQQLA QWLHTNLTTL EVAEPPMPVE DRAADTWEPL 
VAVADLAGGA WPQRARQAVA TLTAEADGSG NVSHRVRLLA DIRTAFTTLG DPTAAPTSDL 
LAALNGDPEA PWADSGPNGL TGKKLGDLLR EFDIRSETVR FPVGQAKGYT RDAFTDAWQR 
YCPTSETPST EVSVPSVPTS YPQVIPGTDY TAGTDRSVPH QPHASAPGTH