Gene Sare_3080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3080
Symbol
ID	5706851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	3487147
End bp	3488343
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	70%
IMG OID	641272517
Product	hypothetical protein
Protein accession	YP_001537885
Protein GI	159038632
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000201414
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGACGCCAA CTACGTCGGC AAGCTCGAAC GGGGCGAGCA CCGCTGGCCC CGCGACTCCC 
GGCGCGAAGC CTTCCGCGCC GTGCTCGGAG CGGTCAGCGA TGCCGCCCTC GGCTTCTACG 
TCGTCCGCGG CGAACCGCAC CAGGCCGCCG ACCACGCGCA GATCGAGGTC GACCGGCTGG 
AGACGGCTGA CGGGGGTAGG CGTGCGCTGC TCGGCGGATT TGCCGGCCTG GTCGCTGCCC 
TCGGCCTGTT CGGTTGGGGA CCGCGTGGCG ACAAGAGCGC CCGGATCGGC GGCTCGGACG 
TGGCCCGCCT CAACGCCGTC GTGGCGCTGT ACCGATCGGT GGACTACGAG TCCGGCGGCG 
GCGTTGCGCG TCGAGGCGGG TCGGTTCGCC GAGGCGGCGT CGTCGCTGTC CGATCGACCC 
TGCAACGACA CGGTCAAGCC CGCCCTACTG GCCGCCATCG CCAACGCCCG CCAGCTCGCC 
GGTTGGGCCG CCTTCGACAC CGGCCACCAC TCCGACGCCC AACGCCACTG GCTATCGGCC 
GAACGCACCG CCGTCGCCGC AAGCGACCTG CGACTAGCCG CCCGCGTGCG CTACTGCCAG 
GCCCGACAGT TCCAGCACCT ACACCACAAC GGCGACGCCC TGGACACGCT GCGACTGGCC 
CACGACCACC TCGCCGGCCG CGCCACCCCG GCAATCAACG CCATGCTGCA CGGCGCCGAG 
GCCGCCTCCC TCGCGGCCAG AGGCGATCGA CAAGAGGCCC TGACCGCGCT CGGCGCCGCC 
ACCGACGCCT TCGACCGCAT CGACCCCGAC TGCGAACCGG AGTGGATGCG CTTCTACGAC 
CGCGGCGAGC TGCTCGCCCA ATACGGACGC GTCCACCGCG ACCTCGCCCG TAGCGACGAA 
CGACACGGCA ACGCCGCCGT TCAATGGGTC ACCGAGGCCA TCGCCGCATT CGGCCCCCAA 
AATGTACGCA GCACGGTACT CAACGAAGTC GGACTGTGTA GCGGCCTCTT CCTCGCCGGA 
GAACCACAGG AAGCCGTCAT CATCGGCACC CGGGTTATCC AGCACTCCAA CCAGTTAACC 
TCCCAGCGGG TACACGACCG CATCCGCAAC CTCCGCCGCG ACATGCATCG GTACGCAACC 
GACCCGGAGG TCGCCGAGTT CAGCCGAACC CTGTCCACGA TCGGCTCGGG CACATGA

Protein sequence

MTPTTSASSN GASTAGPATP GAKPSAPCSE RSAMPPSAST SSAANRTRPP TTRRSRSTGW 
RRLTGVGVRC SADLPAWSLP SACSVGDRVA TRAPGSAART WPASTPSWRC TDRWTTSPAA 
ALRVEAGRFA EAASSLSDRP CNDTVKPALL AAIANARQLA GWAAFDTGHH SDAQRHWLSA 
ERTAVAASDL RLAARVRYCQ ARQFQHLHHN GDALDTLRLA HDHLAGRATP AINAMLHGAE 
AASLAARGDR QEALTALGAA TDAFDRIDPD CEPEWMRFYD RGELLAQYGR VHRDLARSDE 
RHGNAAVQWV TEAIAAFGPQ NVRSTVLNEV GLCSGLFLAG EPQEAVIIGT RVIQHSNQLT 
SQRVHDRIRN LRRDMHRYAT DPEVAEFSRT LSTIGSGT