Gene Sare_4342 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4342
Symbol
ID	5708410
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4909867
End bp	4911129
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	66%
IMG OID	641273764
Product	hypothetical protein
Protein accession	YP_001539114
Protein GI	159039861
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0527256
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGTTG TTCAGTCCTG CGCGAGATGC CGGACCGTGC TCATTCCCGG CCAGCAGGGG 
TGCGTGCGAT GTGGCCTCAC GGCCGCCGAG CCGACACGGG AGTGCCCCGC CTGTCAACGT 
CCCACCGCCG TGGATGCGCA GTACTGCCCT GCCTGCGGAG AACAGCTGAG GCAATCGTCA 
CCGATGCTCG CCGCCGACCT GGCTACGGCA CCGGCGCCGG GCACTGACCC GTCCGCCCCA 
TTGACGGCAG CGCCCGCCGT GTTCGCCACA GTGCGCAAAC CCCGTCGCTG GGTATATCTG 
CTCACCGGCG TCGCACTGGC AGTGCTGCTG ACCGGCATCA CGGGCCTCTA CGCGGTGCAG 
AGCATCGTCT ACACCCCCGA GCGTGTGGTG ACGGGCTACT TTGCCGCACT GTCCGAACGG 
GACGCCGCGG CGGCGCTGTC ATTCCTTGAG GAGCCGCGCA GCGAGATCCC GAATCGCCCC 
TTGGAACTGC CGATGGTCCC GTTGACCACG TCCTATCAGC CGCCATCGGG GGCAAAGGTC 
ACGTCGATCG GGGGCCTGAG CGAGGCCGAG TTAGAGGGCA GCCCGCCTGC GGAGAACAGT 
GATGACTGGC GTTCGGCGAG GGTTACGTAC AGGGTCGGCG ACCGTACCTA TCGGGACGTG 
CTCTATCTGC ACCGGCAGGA ACGGAAAGAG TTAGGCCTCT TCCGTGACTG GCTGATCTAC 
GGCGGGGTGA ATCAGCTGGC CGTACGCAAT CGGCCGGACA GTCCTGGCGT GCTTATCAAC 
GGGCAGGCGG TACCGACCCG CGAGGGGTAC GCGCGGGCAC GCGCCTTTCC CGGTATCCAC 
GAGGTGCGGC TGGCCGACGA CCCGTTGGTC GAGGTGGAGC CGGTGGTTCT GGAGGTTGGC 
CTGGTACGGC CCGACAATGT ACTGCTCAAG CCGATTCTCA GGGAATCCGC GCGCAGCGAG 
GTCGAGAGTC AGGTGAAGGC GTACCTGGAC GAGTGTGCCG AGAGCAGCGA CATGTCGCCG 
AAAGGCTGCC CCTTCTCCGG TCCTCCGTTC GGGACCGCGA CGAACGTCAG GTGGACGATC 
GACGCGTACC CGAAGCTTGA CATCCGGGCG ATCGACGGTG AGCTCACCGT CAGGGGCTGG 
TCGGGACGTG CCTCCGTGAC GTGGACTGGT TCCGGCGGCA GGACGCACGA ATACGACAAC 
CCCTTCGTTG TCACCGGTCG GGCCACAGTG ATCGACGGTA GGGTGACGTT CCTCAGCGAC 
TGA

Protein sequence

MTVVQSCARC RTVLIPGQQG CVRCGLTAAE PTRECPACQR PTAVDAQYCP ACGEQLRQSS 
PMLAADLATA PAPGTDPSAP LTAAPAVFAT VRKPRRWVYL LTGVALAVLL TGITGLYAVQ 
SIVYTPERVV TGYFAALSER DAAAALSFLE EPRSEIPNRP LELPMVPLTT SYQPPSGAKV 
TSIGGLSEAE LEGSPPAENS DDWRSARVTY RVGDRTYRDV LYLHRQERKE LGLFRDWLIY 
GGVNQLAVRN RPDSPGVLIN GQAVPTREGY ARARAFPGIH EVRLADDPLV EVEPVVLEVG 
LVRPDNVLLK PILRESARSE VESQVKAYLD ECAESSDMSP KGCPFSGPPF GTATNVRWTI 
DAYPKLDIRA IDGELTVRGW SGRASVTWTG SGGRTHEYDN PFVVTGRATV IDGRVTFLSD