Gene Sare_0038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0038
Symbol
ID	5707318
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	46934
End bp	48370
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	74%
IMG OID	641269563
Product	hypothetical protein
Protein accession	YP_001534965
Protein GI	159035712
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAGAC GCGGCTGGGG AACATCGATC ACGACCGCGC TTGGCACCGC TGCCGGAGCG 
GGTGCAGCTC AACTGGGCTT CGGCTACGGC CTGGGCATCA TCAACTGGGC GCCACCACCC 
GACGAGAGCA CCGCCGCCAC CGCCTGGACC GCCAGTCTCA TCTGGGCCAT GTGGATCGCC 
GCCACGTCCA CTGTGGTTGG CGCCGTCGGT GCCCAACACC TGCGCCGCCG CAGCAGAGCT 
GGCGACCACG CAACCAGCAA CCGCAGCGGC AGCGGCAGCG GCGAGGCCGA AGCGACGTCG 
GCAACCACCA GCCCCGGCGA TCTCGACCCC GCCGCGACCA CGGAGACAGG GGCGCGACAC 
CTCTCGGTGG ACGCGAGCGA CACCGACGGT GCACTGGGCA GGCTGGCACT CGCCGCGGCA 
GCCGGATTCG GTGCGCTGGT CACGGTGCTG CTGACCGCCG TGCCGGCACG GGTCGCCGTG 
GTGCCCGGCG TCACCGCACC CCGGGACGTC GCCGCAGGGT ACGCCACAGT GGGCGTACTG 
GTCGGGGTGG CCATTGCTGT ATGGGCACTG CACTCCCGCG CTGCCGCCGG CAACGTGATC 
GCGACCTTGG GCTGGCTGTG GCTGCTCGCC GTGGTGGCCG TTGTCGACGG TGTCGTCGCG 
GGGCGTGGGC TCAGCAGCGC CCAGCTTGGT ATCTGGCAGC TCAGCGCCGG CGGGGAGGGG 
CTGTGGCTCC GCGACTGGTT CTACTGGCCG GGCGCAGTGC TGTCACTCGG TTCCGCCCTA 
CTCATCGGCG TACTGGTCGC CCGCCGTGCA CCCAGGCACC CCGACCGCCA GGTGGGTGCC 
ACCGCCTCCG GGGCGGCCGG CCCGCTCCTG GTCGCGGTTG CCTACCTGGT CGCCGTGCCG 
GACCTGGCCG AACTCGCTGC CGGACAGGCG TCGGCGCACC TCATCGCCCC GTACGCGGTC 
ATCGTCGGTT TCGGGGGCTC GGCACTGGTC ACGGCGCTCG GCAACCGGGC CGACCGCCGG 
ACGCGGGCCT ACCCGCCCCG ACCGGTGGAG TCCCACGCCG GCCCAGGCAC CGACGGTTCG 
ACCACCGCGA CGCCCACCAC TCGCGGTCGA GTGCGCGGAT CGGGCAGTCG GCGCTCGCGC 
ACCGTGAAGT CGGACCCGAC CGCCGAAGCG GGTGAGCCCA CGGCGGCCAG CGACGCTACC 
GGCGCGTCCG CCCCCGACGA CCAGCCGAGC GACGCATCCG GTCGCCCCTC GGCCCCCGGG 
GGCGCCCGTC GGGGCCGGGG CACCGCCGCC CGGTCGGGCT CCGCGGGCGG GGATCCGACC 
ACCGAGGTGC CGGTTCAGCG CACCGCAGAA GCCGCACCAG CGGACGCGAC CACCGCGTCG 
AAGGAGTCGA CGGACGGGGG CTCACGCCGG GCGCGGTCCA CCCGCCGCAC CAGCTGA

Protein sequence

MARRGWGTSI TTALGTAAGA GAAQLGFGYG LGIINWAPPP DESTAATAWT ASLIWAMWIA 
ATSTVVGAVG AQHLRRRSRA GDHATSNRSG SGSGEAEATS ATTSPGDLDP AATTETGARH 
LSVDASDTDG ALGRLALAAA AGFGALVTVL LTAVPARVAV VPGVTAPRDV AAGYATVGVL 
VGVAIAVWAL HSRAAAGNVI ATLGWLWLLA VVAVVDGVVA GRGLSSAQLG IWQLSAGGEG 
LWLRDWFYWP GAVLSLGSAL LIGVLVARRA PRHPDRQVGA TASGAAGPLL VAVAYLVAVP 
DLAELAAGQA SAHLIAPYAV IVGFGGSALV TALGNRADRR TRAYPPRPVE SHAGPGTDGS 
TTATPTTRGR VRGSGSRRSR TVKSDPTAEA GEPTAASDAT GASAPDDQPS DASGRPSAPG 
GARRGRGTAA RSGSAGGDPT TEVPVQRTAE AAPADATTAS KESTDGGSRR ARSTRRTS