Gene Sare_4233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4233
Symbol
ID	5704404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4806271
End bp	4807506
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	75%
IMG OID	641273652
Product	hypothetical protein
Protein accession	YP_001539005
Protein GI	159039752
COG category	[R] General function prediction only
COG ID	[COG4076] Predicted RNA methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.118857
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACCTGG GACAGCTGGC GGAGCTGCGT ACGCCCGCGG GTTCGGCCGC GCTCGCGGCG 
GCGACCGAGG TGGCCGGTGC TGACCCGCTG GCCGCGGCGA TGGCGCTACG GTCCGCCGGG 
CTCCCGGCCG GGCTGGCGGC GGCGGCGCTG ACCCAGGCCG AGCTGCGCCG CCGCGCGATG 
GGCAAGTTCG GTCCGGCGGC GGCTGACATG TTCTTCACCC GCGCCGGCCT GGAACAGGCC 
ACCCGTCGGG TCGTGGCGCG GCGTCGCGCC GACCGGCTGC GGGCCGCCGG AGTCCGAACC 
CTGGCCGACC TGGGCTGCGG CCTCGGGGCC GATGCCCTCG CGGCAGCCCA CGCCGGCCTG 
CGGGTGTATG GCGTGGAGGC CGATCCGCTG ACCGCCGCGA TAGCCGCCGC GAACGCCGAG 
GCGGCCGGAC TCACCGAACG GTTCACCGTC GACCATGGGG ACGCGACCGC CTTCGACATC 
GACCGCGTGG ACGGCGTCTT CTGCGACCCC GCCCGGCGGC GCACCGGCAC CGGGCGGCGG 
ATCTTCGATC CGAGCGCGTA CGCGCCACCC TGGGACTTCG TGGTCGGGCT CGCTGGGCGG 
GTGCCGCGCA CGGTGGTGAA GGTCGCGCCC GGCCTTGATC ACCAGTTGAT CCCGGCCGGC 
GCGGAGGCGG AGTGGGTGAG CGTCCACGGG GACCTGGTCG AGGCCACCCT GTGGTGCGGC 
GAACTCGCGA CAGTGGCGCG CCGCGCGACC GTGCTGCGGG AAGCTTCCCC CGGCGACGCC 
TCCAGCAGCG CCGGTTCTGC CGCCCGCCGC GCGACAGCGC ACGAACTGAC TGGTTCCACC 
GTCGCCGAGG CGCCGGTCGG TCCGGTCCGC CGCTACGTCT ACGACCCGGA CCCGGCGGTG 
GTCCGCGCGC ACCTCGTCGC CGAACTGGCC GGAATGCTGG ACGCCAACCT TGCCGACCCG 
ACGATCGCCT ACCTGTACGC CGACACTCCG ACGCCGACAC CCTTCGCCCG CTGCTTGGAG 
ATCACCGACG TGCTGCCGTT CTCGCTGAAG CGACTTCGTG CCCTGCTGCG CGAGCGACGC 
GTCGGCCGGG TGGAGATCCG CAAGCGTGGC TCGGCCCTCG AGCCGGAGCG ACTCCGCCAC 
GATCTGCGCT TGACCGGCGA CCAGCCGGCC AGCCTCGTGC TGACCCGCGT GGGCGGTGCC 
CCCACGGTGC TGATCTGCCG TCCGCCCACC AGCTAG

Protein sequence

MDLGQLAELR TPAGSAALAA ATEVAGADPL AAAMALRSAG LPAGLAAAAL TQAELRRRAM 
GKFGPAAADM FFTRAGLEQA TRRVVARRRA DRLRAAGVRT LADLGCGLGA DALAAAHAGL 
RVYGVEADPL TAAIAAANAE AAGLTERFTV DHGDATAFDI DRVDGVFCDP ARRRTGTGRR 
IFDPSAYAPP WDFVVGLAGR VPRTVVKVAP GLDHQLIPAG AEAEWVSVHG DLVEATLWCG 
ELATVARRAT VLREASPGDA SSSAGSAARR ATAHELTGST VAEAPVGPVR RYVYDPDPAV 
VRAHLVAELA GMLDANLADP TIAYLYADTP TPTPFARCLE ITDVLPFSLK RLRALLRERR 
VGRVEIRKRG SALEPERLRH DLRLTGDQPA SLVLTRVGGA PTVLICRPPT S