Gene Sare_4117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4117
Symbol
ID	5707668
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4676797
End bp	4678296
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	71%
IMG OID	641273545
Product	hypothetical protein
Protein accession	YP_001538898
Protein GI	159039645
COG category	[R] General function prediction only
COG ID	[COG0661] Predicted unusual protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.278989
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.434139
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACACCGG CCAGCCCGCC GGCTACGGCC CCCGCCCCCG TCCGCTGGAG CCCAGCCCTG 
GTCCGCTGGA GCCGGAGGTT CCCGCCCACC CGAAGGCGGC GCGGGCCCGC CCGCACGGCA 
GCCATGGGCC GCCCGGTCGG TCACAATGAC CAGGTGACCG AAATCCCGCG CCGGGCCGTC 
TCCCGGACCG CCAAGCTCGC CGCTCTGCCG CTCGGCTTCG CCGGCCGGAC CGTCCTCGGC 
ATGGGTAAAC GCGTCACCGG GCTCGCCTCC GACGTGATCT CGGCGGAGAT CCAGCAACGC 
ACTGCCGAAC AGCTCTTCAG CGTCCTCGGG CAGCTCAAGG GCGGTGCGAT GAAGTTCGGT 
CAGGCGCTGT CGGTCTTCGA GGCGGCGTTG CCCGAGGAGA TCGCCGCCCC CTACCGACAG 
GCGCTGACCC GACTTCAGGA GGCCGCGCCA CCGCTACCCG CCGCCTCCGT GCACAAGGTG 
CTCGCCGAGC AACTCGGTCC GGACTGGCGG GATCGATTCA TAGACTTCGA TGACACACCT 
GTTGCCGCCG CCAGCATCGG GCAGGTGCAC CGCGCCCGGT GGCGGGAGCC GGGGTACGAC 
GCTGCCGGCG CGCCGCACAC CCGCGACGTC GCGATCAAGA TTCAGTATCC AGGTGCAGGC 
GATGCCCTCC TCGCCGATTT CAAGCAGCTC TCCCGGCTCG GCGGGATGCT CCGGGCGGTC 
CAGCCAGGGC TGGACGTCAA GCCGCTCCTG GCCGAGCTGC GTGAACGGAT CACCGAGGAA 
CTCGACTACG AGCTGGAGGC CGAATCGCAA CGGGCCTTCG CCACGGCGTA CGCGGACGAC 
CCGGAAATCT ACGTCCCGGC GGTGGTCGCC GCATCGCCTC GGGTCCTCGT GACCGGGTGG 
GTCGACGGAA CTCCCCTCTC GCAGATCATC CGGGACGGCT CCGAACAGGA CCGGAACGAG 
GCAGGCCGGT TGATGGCCAC CCTGCACCTG TCCGCACCGA TGCGGGCCGG ACTGCTGCAC 
GCCGATCCGC ACCCGGGCAA CTTCCGGCTG CTGCCCGATG GCCGGCTCGG GGTGGTCGAC 
TTCGGGGCGG TGGCCCGGCT GCCCGAGGGG ACGCCCGAGC CGATCGGCCG CATCGCCGGG 
TTGGCGCTAC GCGGAGACGC CGCAGAGGTG ATGACCGGCC TTCGCGACGA GGGCTTCGTG 
AGCACCAACG AGACGATCGA TGGTCAGGCG CTGCTGGACT TCCTACAGCC GATGCTGGAG 
CCGATCGCCG CCGACGAATT CCGGTTCACC CGGGCCTGGC TGCGGGCCGA GGCGACCCGG 
CTGGCCAACC CTCGCTCGCC CGCGTACCAG CTGAGCCGGC ACCTCAACCT GCCCCCGTCG 
TACCTGCTGA TCCACCGGGT CACGCTCGGC TCCATCGGGG TGCTCTGTCA GCTGGAGGCG 
AAGGCGCCGT ACCGGGGGAT CCTGGAACGC TGGCTACCCG GCTTCGCCCC GGTCCGCTGA

Protein sequence

MTPASPPATA PAPVRWSPAL VRWSRRFPPT RRRRGPARTA AMGRPVGHND QVTEIPRRAV 
SRTAKLAALP LGFAGRTVLG MGKRVTGLAS DVISAEIQQR TAEQLFSVLG QLKGGAMKFG 
QALSVFEAAL PEEIAAPYRQ ALTRLQEAAP PLPAASVHKV LAEQLGPDWR DRFIDFDDTP 
VAAASIGQVH RARWREPGYD AAGAPHTRDV AIKIQYPGAG DALLADFKQL SRLGGMLRAV 
QPGLDVKPLL AELRERITEE LDYELEAESQ RAFATAYADD PEIYVPAVVA ASPRVLVTGW 
VDGTPLSQII RDGSEQDRNE AGRLMATLHL SAPMRAGLLH ADPHPGNFRL LPDGRLGVVD 
FGAVARLPEG TPEPIGRIAG LALRGDAAEV MTGLRDEGFV STNETIDGQA LLDFLQPMLE 
PIAADEFRFT RAWLRAEATR LANPRSPAYQ LSRHLNLPPS YLLIHRVTLG SIGVLCQLEA 
KAPYRGILER WLPGFAPVR