Gene Sare_4111 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4111
Symbol
ID	5707662
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4671274
End bp	4672287
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	71%
IMG OID	641273539
Product	hypothetical protein
Protein accession	YP_001538892
Protein GI	159039639
COG category	[T] Signal transduction mechanisms
COG ID	[COG3480] Predicted secreted protein containing a PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.404702
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0634839
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACGTC GCGGCCTGAC CGTCCTGCTC GGTGCCCTGT TCACTGCTCT GCTCGGCATC 
GGCGTGCTCG CAGCACCCAT CCCGTACGTG GTGCTGGGCC CCGGTCCGAC CGTCGACACG 
CTGGGCACCG AGGACGGTAC GGAGGTCATC CAGGTCACCG GCCGGGAGAC CTCCGACTCG 
ACTGGGGAGC TCCGGTTGAC CACGGTGGGG GTGCAGCCCT CGGTCAAGCT GCGCACGGCC 
ATCCAGGGGT GGTTCTCCGA CGACGAGGCG GTGGTGCCGC GCGAGTTGGT GTACCCGCCG 
GGGGAGAGCC GGGAGGAGGT CGAGGAACGC AACGCGGAGG ACTTCAAGGT CTCCCAGACC 
AGCGCGGAGA CGGTGGCTCT GCGTGAGCTC GGGTTCCCGG TGCGGGTGGT GGTCAAGACG 
GTGGCCGAGG ACGGGCCGTC GGTGGGCCTG CTCCGCCCCG GTGACGTGGT GGACTCGGTC 
AACGGGCAAC CCGTCCCGGT GGCCTCCCGG CTGACCGAGT TGATCCGGGC CGAGCCGCCC 
GGCGCCACCC TCGAGATCGG CTACATCCGG GACGGGGCTC CCGGGACCGC GCGGATCACC 
AGTCAGGAGA AGGACGGCCG GCCCCGGATC GGGGTCGGAA TCGAGCAGCA GCAGCCGCAC 
CCGTTCACAC TGACCATCGA CCTGGAGGAC ATCGGTGGCC CGAGTGCCGG GCTCATGTTC 
GCCCTCGGCA TCATCGACAA GCTGACGCCG GATGACCTGA CCGGTGGTCA GATCATCGCC 
GGCACCGGCA CGATCGACGA CGAGGGCCGG GTCGGCCCGA TCGGGGGCAT ACCCCAGAAG 
CTGGTCGGCG CCAAGGACGC CGGCGCGACC GCCTTCCTGG TTCCGGCCGA CAACTGTGCC 
GAGGCCGTCC GCAATCCACA ACCCGGCCTG CCGTTGCTCA AGGTGGCGAC GCTGGACGAG 
GCGCTGACCG CCCTTGAGGC CCTGCGAGCG GGGGGCGAAC CGGCCCGCTG CTGA

Protein sequence

MRRRGLTVLL GALFTALLGI GVLAAPIPYV VLGPGPTVDT LGTEDGTEVI QVTGRETSDS 
TGELRLTTVG VQPSVKLRTA IQGWFSDDEA VVPRELVYPP GESREEVEER NAEDFKVSQT 
SAETVALREL GFPVRVVVKT VAEDGPSVGL LRPGDVVDSV NGQPVPVASR LTELIRAEPP 
GATLEIGYIR DGAPGTARIT SQEKDGRPRI GVGIEQQQPH PFTLTIDLED IGGPSAGLMF 
ALGIIDKLTP DDLTGGQIIA GTGTIDDEGR VGPIGGIPQK LVGAKDAGAT AFLVPADNCA 
EAVRNPQPGL PLLKVATLDE ALTALEALRA GGEPARC