Gene Sare_1344 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1344
Symbol
ID	5704271
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1551387
End bp	1552616
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	73%
IMG OID	641270855
Product	hypothetical protein
Protein accession	YP_001536236
Protein GI	159036983
COG category	[S] Function unknown
COG ID	[COG3214] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.471387
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000585185
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGACCACAC CGGAGTCGCT CTCGCTCGCC CAGGCCCGGC GGATCACGCT GGCGGCCCAG 
GGTTTCACCG ATCCTCCGCC GGCCGGTGTT GCCACCCGTC GGCACCTGCG TCGCGTGCTC 
GACCGGGTCG GCCTGATCCA GATTGACTCG GTCAACGTGC TCCAGCGGGC GCACTACCTG 
CCGCTCTACA GTCGGCTCGG CCCCTACCCG ACGGCGTTGC TCGACGCGGC GGCCTACCGC 
CGGCCCCGTG ACCTTTTCGA ATACTGGGGC CACGAGGCGT CGCTGGTGCC GGTCGCGTTG 
CAGCCGGCGC TGCGCTGGCG GATGGCCCGT GCCCGTAGCC AGGCTTGGGG CAGCATGCGC 
CGCGTCGCCG AGGAGCAGCC TGATCTGGTG GCATGGGTCC GGGACGAGGT GGCGGCCCGG 
GGCCCGGTCA CCGCCGCGGA GCTCGAGCAG GACGTCGACC GGGAGTCCGG CAACTGGGGG 
TGGAACTGGT CGGCGGCGAA GCGGGCGCTG GAGTTCCTGT TCTGGTCCGG CGAGGTGACC 
GCCGCTGAGC GTACGACGTC CTTCGCCCGT CGCTACGCCC TGTCGGAACG GGTGCTGCCG 
GCGGCTGTTC TGGACGCGCC CACCCCGACC GACGCCGAGG CGTACCGGAC GTTGGTGTCG 
GTGGCTGCCC GGTCCCTCGG GGTGGCGGCA GAGCCGGAAC TGCGGGACTA CTTCCGGTTG 
CCGCTCGCTG CGGCGCGGAC GGCGATCGCG GAGCTGACGG AGGCGGGTGA GCTGGTTCCG 
GTGACCGTGT CGGGCTGGCG GCAGCCGGCC TGGCTGCACG CTCGGGCCCG GCTGCCCCGG 
TGGGTCCGGG GCAACTGCCT GGTCAGCCCC TTCGATCCGC TGGTCTGGGA GCGGGGTCGC 
ACCCAGCGCC TGTTCGACTT CAGCTACCGC ATCGAGATCT ACGTACCGGC ACCGAAACGG 
CTGTACGGCT ACTACGTGTT GCCGTTTCTT CAGGGGGACC GGTTCACCGC CCGCGTCGAT 
CTGAAGGCTG ACCGGAAGAG CCGCGTGCTC CTGGTGCCGG CAGCCTGGCA GGAGCCCGGT 
GTCGACCCGG GCGAGACGGC GGTCGCGCTC GCCGCCGAGC TGTACCGGCT CGCCGGCTGG 
CTGGGCCTGG ACGCCGTGGT GCCCCCGGCG GCCGGTGATC TGGCGGCGCC GCTGGCCGCC 
GCCCTGAGGA GCGTGGTGGG TGTACCGTGA

Protein sequence

MTTPESLSLA QARRITLAAQ GFTDPPPAGV ATRRHLRRVL DRVGLIQIDS VNVLQRAHYL 
PLYSRLGPYP TALLDAAAYR RPRDLFEYWG HEASLVPVAL QPALRWRMAR ARSQAWGSMR 
RVAEEQPDLV AWVRDEVAAR GPVTAAELEQ DVDRESGNWG WNWSAAKRAL EFLFWSGEVT 
AAERTTSFAR RYALSERVLP AAVLDAPTPT DAEAYRTLVS VAARSLGVAA EPELRDYFRL 
PLAAARTAIA ELTEAGELVP VTVSGWRQPA WLHARARLPR WVRGNCLVSP FDPLVWERGR 
TQRLFDFSYR IEIYVPAPKR LYGYYVLPFL QGDRFTARVD LKADRKSRVL LVPAAWQEPG 
VDPGETAVAL AAELYRLAGW LGLDAVVPPA AGDLAAPLAA ALRSVVGVP