Gene Sare_4736 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4736
Symbol
ID	5704561
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5359357
End bp	5361288
Gene Length	1932 bp
Protein Length	643 aa
Translation table	11
GC content	71%
IMG OID	641274134
Product	hypothetical protein
Protein accession	YP_001539480
Protein GI	159040227
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00027921
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCCGGGG CCCGGACGCG GACGGTGGCG CTTCTGCTGG CCCTCGGGGT CCTCGCCGGG 
GCCTCGATCG GCTGGCCGGG GGTCGGCGCG GCGGCGGCAC CGGCCACCGG AGTGACCGCG 
CTAGCCCCCT CCGGCCCCTG CACCACCGAG GAGTGGCAGG CCGACTTCCG CTCCTGCGTG 
TCCCGGCTCA CGGAGGTCGC CGAGGACGAG GTCACCTGCC GTAACGCCCC GACTCCGACG 
GCGCCGGACT CCGGCCTCGC GGGTTGGTTC GCAACCCGCC CGGATTCTGC GAAGCAGGAC 
GGCCGAAAGG GACTCTACAG CGACTACGGC TACGCAGGGT ACAGCTACAG CACGTACGAC 
ATCGACACCG GCTGCGCCAC CGCGGTGCTG CACCCCGACT ACAAGTTCAC CAACACGCTC 
GCCAATGGCG AGTTCATGAT CGCCACCGCG ATCGTCGGCG CCTCGAACGC TCTCCGGGAG 
CGGGCCTGGG ATCCGCGGTC GATGTGGGGC TGGGCCGATC CGCTGGTGGA CCAGGCCACC 
AAGGCGGTCT ACCAGAAGGT GTTCAGTGTC TTCGGGATCG TCACGCTCTG CGTGGTCGGG 
CTGTACCTGC TCTGGCGCTC CCGCCAGTCG GACATGAGCA ACGCCATGAC GACCGCGGGC 
TGGGCCCTGC TCGTAATGGT GGCGGTGACC GCGTTGGCCG CCTGGCCGGT CAAGTCCGCC 
AACGTCGCCG ACGGCACCCT CATCACCACG CTGGGCGTCG TCCACGACGC CGTTGGTCCG 
ACGTCCAAGG ACACGCCGCC GGACCAGTGC CCGGTCCCGA ATCCGGAGGC CTGCGTCGAC 
AACCGACCCC CGGCGGTACG GGCGAGCGAC ACGGCCACCG AGACCATGCT GTACCGCAAC 
TGGCTGCGGG GAGTGCTGGG CTCCGCCGAC AGCGAGACCG CGAAGAAGTA CGGGCCAGCA 
CTGTACGATG CCAAGTCCTT CTCCTGGGAG GAGGTGGAGA GGCTCCGCTC CAACCCAGCG 
ACGCGTGATC TGACGATCAA ACTCAAGAAG CAGCAATGGG CGCGGGTCGC CCAGCAGATC 
GCGCAGGAGG ATCCGGAGGC GTACGAGTAC CTCCAGGGGG TCCGGGACAT GGACCGGGTC 
GGCGCCGGGT TCATCGCGGT GCTCGCCGCG CTGCTCTTCG CGATGTTCGA CCTCACCGCG 
TCGGTGCTGG TGCTGTTGGG CTTCCTGATC TTCCGATGGG CGGTGATCGT CGCACCCATC 
CTCGGCACCA TCGGCCTGCT GCGCCCAGCG AGCACCGGCC TGCGTCGGCT GGGCAACGCC 
GTGGTCGCGG CCGTCTTCAA CATCGCCATC TTCGGCACCG GTGCCGCGAT CTACCTGTTC 
GCCGTGGACC TCATCATGAG CACGCCAACC CTGCCCGGCT GGCTCCAGGT GGTCCTGGTC 
TGGCTCTGCG GGCTGGTCGG CTGGCTGCTG CTGCGCCCCT ACCGGCGGAT CACCCAGCTC 
GGCGGCAAGG GCGGCAGCGA CGCGGGTAGC TCCCCCGGCT CCTGGCACCG CCGGTTCTTC 
CGCGACATGC GCGCCGCGGC TCGCCTCGAC GCCGCTGAAC CCCGCGGCAC CGGCGAGCCG 
ACGTCGGGCC GTCGCAGGCC GGTGGTCGCG GAGCAGAGCA GGCTACGCCC GGAGGCCCGA 
CACGAGGACC CGGTGCCCTC GTCCGATCGC GGTGACCGGC CGGACGGCCG CGGGCGGACG 
GAGGACGTGG CGAGGTCCGG GGAGCGGACC ACCGAGGGCC GCACCCCCGC CCCACGGCAA 
CGGCGGCAGC CGGCCACCTG GACCGAACCG GACGGCCCGC AGGAAAGCCC CTCCTTCGTC 
ATCTACCGAC CGGGCACGGC GAAGCCCGCG CCCGAACGCA GCACTCCCCG AATTCGCTCC 
GAGGCCCGGT GA

Protein sequence

MAGARTRTVA LLLALGVLAG ASIGWPGVGA AAAPATGVTA LAPSGPCTTE EWQADFRSCV 
SRLTEVAEDE VTCRNAPTPT APDSGLAGWF ATRPDSAKQD GRKGLYSDYG YAGYSYSTYD 
IDTGCATAVL HPDYKFTNTL ANGEFMIATA IVGASNALRE RAWDPRSMWG WADPLVDQAT 
KAVYQKVFSV FGIVTLCVVG LYLLWRSRQS DMSNAMTTAG WALLVMVAVT ALAAWPVKSA 
NVADGTLITT LGVVHDAVGP TSKDTPPDQC PVPNPEACVD NRPPAVRASD TATETMLYRN 
WLRGVLGSAD SETAKKYGPA LYDAKSFSWE EVERLRSNPA TRDLTIKLKK QQWARVAQQI 
AQEDPEAYEY LQGVRDMDRV GAGFIAVLAA LLFAMFDLTA SVLVLLGFLI FRWAVIVAPI 
LGTIGLLRPA STGLRRLGNA VVAAVFNIAI FGTGAAIYLF AVDLIMSTPT LPGWLQVVLV 
WLCGLVGWLL LRPYRRITQL GGKGGSDAGS SPGSWHRRFF RDMRAAARLD AAEPRGTGEP 
TSGRRRPVVA EQSRLRPEAR HEDPVPSSDR GDRPDGRGRT EDVARSGERT TEGRTPAPRQ 
RRQPATWTEP DGPQESPSFV IYRPGTAKPA PERSTPRIRS EAR