Gene Arth_1153 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1153
Symbol
ID	4446352
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	1250628
End bp	1251623
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	65%
IMG OID	639688959
Product	GCN5-related N-acetyltransferase
Protein accession	YP_830647
Protein GI	116669714
COG category	[R] General function prediction only [S] Function unknown
COG ID	[COG3153] Predicted acetyltransferase [COG3602] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0563526
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGCCG TTCCCCGCGG GGAACGGCCG CCATTGTTGT TTAATGGCTC AATGACTGGT 
GAAAAGGACA TCCGTGCCCT CTTGGCATCC ATCCACCCCG TCCTGCGCGA GGGGGAATAC 
GTGTACGTCC TGTGGCCCTA CGGCAGGCCG CTGGTTCCAG GCATCGAAGC CGCAGTCCGG 
GAAGCGGAAG GGCTCACCGT GGTGCTGCCC CGGGCTGAGG CGGACAGGCT GGAGCTTCGC 
TACGACTTCG TTGCCTCCTG GATCACCCTT CAGGTGCATT CGTCCCTCGA AGCCATCGGA 
TTGACTGCAG CGGTCAGTGC GGCGCTCACC AACTCCCGAA TCAGCTGCAA CGTCCTCGCC 
GGGTTCCACC ACGACCACCT CCTGGTTCCG GTGGCTGATG CGGACCGCGC CTTGGAGATA 
CTCCACGAAC TGGCTGCAGC AAGTACCGAG CAGCCTGCAC CGAAGCTTGT CCTGCGCACT 
GAACAGCCGG CGGACAGGCC CGCCATCCTG GAGCTCACGG CGGCTGCTTT CTCGGTGTCG 
CCGGTTACCG GGCTTCCCGT GGACGGTGAA CCCGTGGAAG TGGGGCTGTT GAAGCAGCTT 
TTCGACTGCG ACGAGTATCT GCCTGAGTTC AGCATCGTCG CCGAACAGAA TGGTGAAGTG 
GTGGGCCACG TCATCAGCAC GCGGGGCTGG GTGGGGGACC TTGAGCTGCT GGGGCTTGGC 
CCCATTGGTG TGGTGCCGCG GCTGCAACGC CACGGCATCG GCTCGGCACT TATGCAGGAA 
ACCGTCTCGC GCGCCAACGC GGCGGGGGAG AGGGGCATCG CCCTGCTGGG CAGCCCGGAG 
TACTACTCCC GTTTCGGCTT TGTGCCGTCC GTGTCCCTGG GCGTTGAACC GCCCAGCGCT 
GAATGGGGAG ATGCCTTCCA GTTCCTCCCG CTCGCTGTCT GGCCCGGTGG TATCCACGGC 
ACGTTCCGGT ATGCCGGGCC CTTTCAGCGG CTCTGA

Protein sequence

MAAVPRGERP PLLFNGSMTG EKDIRALLAS IHPVLREGEY VYVLWPYGRP LVPGIEAAVR 
EAEGLTVVLP RAEADRLELR YDFVASWITL QVHSSLEAIG LTAAVSAALT NSRISCNVLA 
GFHHDHLLVP VADADRALEI LHELAAASTE QPAPKLVLRT EQPADRPAIL ELTAAAFSVS 
PVTGLPVDGE PVEVGLLKQL FDCDEYLPEF SIVAEQNGEV VGHVISTRGW VGDLELLGLG 
PIGVVPRLQR HGIGSALMQE TVSRANAAGE RGIALLGSPE YYSRFGFVPS VSLGVEPPSA 
EWGDAFQFLP LAVWPGGIHG TFRYAGPFQR L