Gene Sare_4375 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4375
Symbol
ID	5705066
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4942782
End bp	4944179
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	66%
IMG OID	641273797
Product	parallel beta-helix repeat-containing protein
Protein accession	YP_001539147
Protein GI	159039894
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000665337
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAACTATC AGCACCACAC CCACAAACTC GACCCTGACC GGCCCGACGG GCGCCGGGCG 
AGGTCACGAT GGTGGGCGGT CGGATTGGCC GCCATGACCG GCCTGGCCCT CACCACGGTC 
GGCGTTGCCA CCGCCACCCC CGCCGCCGAC GCCGCCGAGC ACCCCCCCAA CGCCACGGAC 
GACCGCCCGT CCGCCGACGA CCACCGCGGC AAACGCGACG GCGGCACGCA CGACAACCGG 
GGCACGGGCA AGGACGACGT AAGGGGGAAG AAGGAGGTGA GGCCGAAGGG CGTTCCGGTG 
CCCTGCGACG CGGACAAACT GATCGCCGCG ATCACCCTGG CCAACGCCCG CGGCGGCGCC 
GTGCTCGACC TCGCCAAGAA ATGCACCTAC CTACTCACCG CCAACATCGA CGACGGCAAC 
GGCCTACCCA CCATCACCGC CCCCATCACC CTCAACGGCG GCAAACACAC CACCATCAAG 
CGCGCCGCCG GGGTGGAGCA GTTCCGCATC GTCACCGTCG GCACCGGCGG CGACCTCACC 
CTCAACCACC TCAAAATCAC CGGCGGACAG ACCGACGGCG ACGGCGGAGC AATCCTGGTC 
AACCCCGGCG GAACACTCCA CCTCCACCAC AGCACCGTCA CCCGCAACAT CACCGGTGGA 
AGCGGCGGCG GCATCGCCAA CAACGGCACC ACCCGGATCA AAGACTCCAC CATCAGCCGC 
AACATTGCTG GTCCCACCGG CGGAGGCGTC ATGAGCTCCG GCCTGCTCGA GATCAGTAAA 
TCCCACGTAC ACGCCAATAC CGCCGTCGTT GCGGCTGGAG TGACCAGCTC GGGCACAGCC 
CGGATCAGTC ACAGCACCAT CTCCGCCAAC CAGGCCCAGG ACTCTGTCGG CGGCCTGCTG 
ATCAACACCG GCACCGGCAC TGTTACGAAA ACCCGCATCA CGAACAACAC CGCCGGAGAG 
GTTGGCGGTG TCCTCGCGAA CAGCGGCACC CAACTCACTC TCAGGTCCGT CACCATCGAC 
AAGAACACGG CAAGTACAGC CCGTGCTGGT GGCCTGGCAG TGAACCCGGA TGCTGCCGTG 
GTCGTGGAAC ACAGCGTCAT CGAAAAGAAC TACGCCACCA CCGAGGGTGG CGGCATCTAC 
AACGACGGCG AGCTGGTACT GCGCAAGACG AAGGTCACCG GCAACCAGGC CAACCTGGGC 
GGCGGCATCT ACAACGCCGA CGGTGGCATA CTCACCCTGT TCACCACCAA GGTCATCAAG 
AACATCGCCG TCACCGACGG CGGCGGCATC TTCAACGAAA TGGGCGGCAC GGTAGAACTG 
AACACCGCTA CCGGCACCGT CGTCATCAAG AACCGACCGA ACAACTGCTC CGGCGACGTA 
CCCGGCTGCG CCGGGTAA

Protein sequence

MNYQHHTHKL DPDRPDGRRA RSRWWAVGLA AMTGLALTTV GVATATPAAD AAEHPPNATD 
DRPSADDHRG KRDGGTHDNR GTGKDDVRGK KEVRPKGVPV PCDADKLIAA ITLANARGGA 
VLDLAKKCTY LLTANIDDGN GLPTITAPIT LNGGKHTTIK RAAGVEQFRI VTVGTGGDLT 
LNHLKITGGQ TDGDGGAILV NPGGTLHLHH STVTRNITGG SGGGIANNGT TRIKDSTISR 
NIAGPTGGGV MSSGLLEISK SHVHANTAVV AAGVTSSGTA RISHSTISAN QAQDSVGGLL 
INTGTGTVTK TRITNNTAGE VGGVLANSGT QLTLRSVTID KNTASTARAG GLAVNPDAAV 
VVEHSVIEKN YATTEGGGIY NDGELVLRKT KVTGNQANLG GGIYNADGGI LTLFTTKVIK 
NIAVTDGGGI FNEMGGTVEL NTATGTVVIK NRPNNCSGDV PGCAG