Gene Sare_0909 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0909
Symbol
ID	5706055
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	1022485
End bp	1023615
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	73%
IMG OID	641270427
Product	GCN5-related N-acetyltransferase
Protein accession	YP_001535817
Protein GI	159036564
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1670] Acetyltransferases, including N-acetylases of ribosomal proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.738896
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.27677
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCCAG AGACCATCGA GGGGCCCGGA ATCCGGCTGC GTCCGTTCCA CCTCACCGAC 
GCCCCCGCCA CCGCGACCGC CTGCGCCGAC CCGCTGACCC AACGCTTCCT GCCCGCACTG 
CCGTCGCCGT ACACGGAGGC CGACGCCCGG TTGTGGATCA CCGAAGGGGC ACCCGGGGTC 
TGGGCCACCG GCGGGGCCGC CTACGCCATC ACGGACCGGG CCACGGACCA GCTCCTCGGC 
TCGGTCGGGT TGCACGACGT GATCCCCGGT CGCCAGGAGG CGGCGATCGG CTACTGGGTC 
GCCCCGTGGG CGCGGGGACG CGGCGTCGCC ACGGCCGCGA CCCGGACCCT CGCCGAGCGG 
GCATTCACCA CCGGGACGAT CCGGCTGGAG CTGCTCACCA CAGCTGAGAA CACCGCCAGT 
CAGCGGGTGG CGCTGGCCGC CGGCTTCCGC CACGAGGGCG TGCGCCGGTC GGCGAGCCCC 
CGTCGCGGTG GCCAGGGACG AGATGATCTC CTCGCCTGGG CGCGTCTCGC CAACGATCCC 
CCGGGTCCGA CCCCGCGGTT GCTGCCAGAC CTGCCCGACG GCCGGGTCAC CGACGGCGTG 
GTGGAGCTAC GGGCGCTCGG CCCGCAGCAC GCGGCCCACA TGCACGACCT GAACACGCGG 
CCCGAGGTGG TCGCCTCCCG GGTGCCGCCG GAGCCGCCGA CGCGGGCGGA CACCGAGCGG 
CACTGCCGGG AGGCGATGTC CCGGTGGCTG TGCGACAAGG CCGCGAACAT GGTCATCCTC 
GACGCGACGA GCGGAGCCAC CGCTGGCACC TGCACTCTGG TCCTCGACCA TCCGCCGTTC 
CGACAGGCGA TGATCGGCTA CAGCCTGCTG CCGGACTGGC GCGGACGCGG CTTCGCGACC 
CGCACGATCC GGCTGCTCAC CGCATGGGGA TTCAACGAGG TCCGGCTCGA ACGGATCTGG 
GCGGGTACCC ACTCCGGCAA CGTTGCCTCG GAGCGGGTGC TGGAACGGGC CGGGTTCCGC 
CGGGAGGGGC GAACACGCGG GGGCCTTCCC AGCGTCGGCA ATGCCCGGGC GGACTGCACG 
CTGTACGGCC TGCTCTCCGG TGATCTCGCG CCACCACCCG GAACGTGTTG A

Protein sequence

MTPETIEGPG IRLRPFHLTD APATATACAD PLTQRFLPAL PSPYTEADAR LWITEGAPGV 
WATGGAAYAI TDRATDQLLG SVGLHDVIPG RQEAAIGYWV APWARGRGVA TAATRTLAER 
AFTTGTIRLE LLTTAENTAS QRVALAAGFR HEGVRRSASP RRGGQGRDDL LAWARLANDP 
PGPTPRLLPD LPDGRVTDGV VELRALGPQH AAHMHDLNTR PEVVASRVPP EPPTRADTER 
HCREAMSRWL CDKAANMVIL DATSGATAGT CTLVLDHPPF RQAMIGYSLL PDWRGRGFAT 
RTIRLLTAWG FNEVRLERIW AGTHSGNVAS ERVLERAGFR REGRTRGGLP SVGNARADCT 
LYGLLSGDLA PPPGTC