Gene Sare_0449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0449
Symbol
ID	5705319
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	515046
End bp	516224
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	71%
IMG OID	641269974
Product	hypothetical protein
Protein accession	YP_001535369
Protein GI	159036116
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.114768
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000434601
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGCCGGAAC CGCTGCACGC CGCGCTCGCT GAGGTACGGG CGCTGCTGCT CGCACCCGGG 
CTCAGCCGGG CGGTGGGCGC CGGACACCGC CGCGGGCTTC GCCCGACGGT GCACCGCGCG 
GAGCTACGGC CGGTCACCCT CAAATCCGGC CCCCGACTCC AGATCACCAC CTCGGACGGG 
AGTAGGCCGC ACACCCGCAA CGTCGGTTGG GACGGGGAAG CGGACGCGGC GGTGGACGCA 
CTGTTGGCCG AACCGTTCGG CAACTGGCAT GTGGAGACCG CGGAGACGAC CCTGCAACTG 
CGGGTCACGA AGTCCGGTGC GGCACAGGTA CACCGTGCGG CGGCCCAACC GGTAGCCGAG 
CCGGCCGCCC ACGACCGGAC GAAGGCCCAC CTACTCGATC CCGGTGACCC GATCTTCACC 
GTGATCGGTG CGTCGGCAGC CAAACGGCGA CAGGTGGACG CCTTTCTGCG GGCGCTCGCC 
GCAACGCTCC CGGACGATCT CGCCGGTCCG CTGCACGTCG TCGACCTGGG TTGCGGAAAC 
GCGTACCTGA CCTTCGCCGC GTACCACTGG TTGACCCAAC GGGGCCTCGA CGTCCACCTG 
ATCGGTGTCG ACGTACGCGA GGACCAGCGC CAACGCAACA CCGAGTTGGC CCGGCGGCTG 
GGTTGGACCG ACCGGGTGCG CTTCGTCGCG GGCACGATCG CCGACGCCCC GGTCGGGTCC 
GCCCCCGATC TGGTGCTGGC CCTGCACGCC TGCGACACCG CCACCGACGA GGCGCTGGCA 
CGGGCGGTGC GGTGGAGGTC TCGCTGGGTG CTCGCGGCGC CGTGCTGCCA CCACGACATC 
GCCGCGCAAC TGCGCTCCAG GCCAACTCCG CCCCCATATG AACTACTGAC TCGGCAGGGC 
ATCCTCCGCG AGCGGTTCGC GGACGTGCTC ACCGATGCGG TCCGGGCAGG ACTGTTGCGC 
CTACACGGCT ACCGGGCCGA GGTGGTCGAG TTCGTCGACT CCCGGCACAC ACCCCGGAAC 
CTGCTCATCC GGGCCCGACG TACCGGGGCG ATCCCCACCG GTGAGCGCTG GACGGAGTAC 
CGGACCCTGG TGGATGGATG GAGGGTGACC CCGAGGCTGG CGATGCTGCT CGACGAGCCA 
CCCGCTGGGA CGTCCACCGG TGCGGCCGTA GCCGACTGA

Protein sequence

MPEPLHAALA EVRALLLAPG LSRAVGAGHR RGLRPTVHRA ELRPVTLKSG PRLQITTSDG 
SRPHTRNVGW DGEADAAVDA LLAEPFGNWH VETAETTLQL RVTKSGAAQV HRAAAQPVAE 
PAAHDRTKAH LLDPGDPIFT VIGASAAKRR QVDAFLRALA ATLPDDLAGP LHVVDLGCGN 
AYLTFAAYHW LTQRGLDVHL IGVDVREDQR QRNTELARRL GWTDRVRFVA GTIADAPVGS 
APDLVLALHA CDTATDEALA RAVRWRSRWV LAAPCCHHDI AAQLRSRPTP PPYELLTRQG 
ILRERFADVL TDAVRAGLLR LHGYRAEVVE FVDSRHTPRN LLIRARRTGA IPTGERWTEY 
RTLVDGWRVT PRLAMLLDEP PAGTSTGAAV AD