Gene Sare_4112 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4112
Symbol
ID	5707663
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4672401
End bp	4673684
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	71%
IMG OID	641273540
Product	hypothetical protein
Protein accession	YP_001538893
Protein GI	159039640
COG category	[S] Function unknown
COG ID	[COG5282] Uncharacterized conserved protein
TIGRFAM ID	[TIGR03624] putative hydrolase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.7351
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0620226
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCTGATA TTCCGTTCGG TTTCGCGCTC CCGGGTGGGC AACCACCAGA CCCCAACGAT 
CCCGCGCAGA TGCAGCAATT CATGACCCAG TTGCAGCACC TGCTCTCCGC ACCCGGTAGC 
GGACCGGTGA ACTGGGACCT GGCGCGCCAG GTGGCCGCGA GCCAACTCAG CGCCGGGGGC 
GACCCGGCTG TCTCGCCGTA CGAACGCAAT GCGGTGGAGG AGGCGCTGCG CCTGGCCGAT 
CACTGGCTGG AGCCGGCCTC GGCACTCCCA TCGGGAATCC ACACCTCGAT GGCATGGAAC 
CGCAATGAGT GGATTTACAA AACCCTCGAT GTCTGGCGCA AGCTGTGCGA CCCGGTGGCC 
AGCAGGATGG TCGGTGCGAT GGGTGACCTG GTGCCGCCGG AGGCCCGGGC CCAGCTCGGG 
CCGATGCAGT CGATGGTGGC CACCCTCGGC GGTGCGCTCT TCGGGGGCCA ACTGGGCCAA 
GCCCTCGGCT CCCTCGCCGC CGAGGTGCTC TCGGCTGGCG ACATCGGGTT GCCACTCGGC 
CCAGCCGGCA CGGCCGCGCT CATCCCGGCC AACATCCGGG CCTACGGTGC CGGGCTGGAA 
CTGCCCGAGG ACGAGGTACG CCTCTACGTG GCGCTACGCG AGGCCGCTCA CCAGCGACTC 
TTCGAACACG TGCCGTGGCT GCGCGGACAC GTGCTCAACG CGGTGGAGAT GTACGCCTCG 
GGTATCCGGG TCAACCGCGA GGCGATCGAG GAAGCGATGG GCCGAGTCGA CCCGACCGAC 
CCAGAGTCGA TGCAGGCGAT CGCGCTCGAG GGCATCTTCA CCCCGGAGGA CAGCCCGGCC 
CAGAAGGCGT CACTGGCCCG GCTGGAGACG GCGCTCGCCC TCGTCGAGGG TTGGGTCTGC 
CACGTGGTGG ACAGCGCGGC CGGAGGGCGG CTGCCCAACG TCGTCCGACT CGGTGAGGCG 
TTCCGCCGGC GGCGGGCCGC AGGCGGTCCG GCCGAACAGA CCTTCGCCGC CCTGGTCGGC 
CTGGAGTTGC GCCCACGCCG GCTACGGGAG GCGGCGGCGC TCTGGGCGGC CCTCGCCGAG 
CACCGGGGGA TTGCCGGCCG GGATGCGTTG TGGGGTCACC CCGACCTACT ACCGTCCGAC 
GACGACTTCG CCGACCCGGT GGCCTTCGCC CAGTCCCGGC TCGACGCCGG CGAGCTGGAG 
GGCTTTGACT TCAGCGCACC TGGTGGCCCG CCGGAGCAGG CTCCGGGCGA GGCCGACGGG 
GAGGAACCGC CCGCCACCCG CTGA

Protein sequence

MPDIPFGFAL PGGQPPDPND PAQMQQFMTQ LQHLLSAPGS GPVNWDLARQ VAASQLSAGG 
DPAVSPYERN AVEEALRLAD HWLEPASALP SGIHTSMAWN RNEWIYKTLD VWRKLCDPVA 
SRMVGAMGDL VPPEARAQLG PMQSMVATLG GALFGGQLGQ ALGSLAAEVL SAGDIGLPLG 
PAGTAALIPA NIRAYGAGLE LPEDEVRLYV ALREAAHQRL FEHVPWLRGH VLNAVEMYAS 
GIRVNREAIE EAMGRVDPTD PESMQAIALE GIFTPEDSPA QKASLARLET ALALVEGWVC 
HVVDSAAGGR LPNVVRLGEA FRRRRAAGGP AEQTFAALVG LELRPRRLRE AAALWAALAE 
HRGIAGRDAL WGHPDLLPSD DDFADPVAFA QSRLDAGELE GFDFSAPGGP PEQAPGEADG 
EEPPATR