Gene Noca_2333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2333
Symbol
ID	4595948
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	2489563
End bp	2490825
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	76%
IMG OID	639776932
Product	hypothetical protein
Protein accession	YP_923525
Protein GI	119716560
COG category	[R] General function prediction only
COG ID	[COG4552] Predicted acetyltransferase involved in intracellular survival and related acetyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.774321
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCCCG ACCCGATCAA GGTGGATCGC GCCACCGACG CCGAGCGGTA CCTCGCCACC 
GACCACACGG TCTGGTTCGC CGAGGTGCCG AGCGCGCCGA CGGAGGTGCA GCTGACCGGG 
CTCGCGCCCG AGCAGCGCTT CGCCGTCGAC CTGGACGGCG CGGACCCGGC GACGTATCCC 
GGGATCTACG GCGTCTTCCC TCTCACCCTG TCGATCCCCG GCCCCGATGC CGGGGCCCGG 
CAGGTGCCGT GCGCGGGCCT GACCTGGGTG GGCGTGCACC CCGACCACCG GCGTCGCGGC 
GTCCTCACGG CGATGCTGCG CCACCACTTC GAGCAGGTGC GGGCCGAGGG CCTGCACCTC 
TCGGCCCTGC ACGCGAGCGA GCCGGCGATC TACGGGCGGC ACGGCTACGG CCTGGCGTCG 
CTGGAGCTGG AGGTGCGGCT CGGGCGGGGT ACGGCGCTGT CCGCGCCCGG CCTCGAGGCG 
CCCGCGGCCG CGCTCACCAC CCGGATGGTC CCGGCCTCGG AGCCCGACGT ACCGGCGCGG 
CTGCGAGCCT GCCACCTCGC CCACGCCGAG CTGGGCACGG TCGTCGGCGA GCCCGGCTAC 
TACCACCAGG TGTGCCTGCA GCTGCCCGAG CACCTGCGCG GCAAGGAGCC GTGGCGGGTG 
CTGTTCGCGC TGCGCGACGG CGTGGACGTC GGGTTCGCGG CGTTCCGGCG CACCGAGAAG 
TGGGAGAAGG CGCGGCCGGC CGGGGAGGTG GAGGTGTGGA CGGTCGTCGG CGAGCCGGCA 
GCACGCCTGG CGCTGCTGAG GCGGCTGGTC GACCTGGACC TGATCGCGAC CGTGAAGGTC 
GGCAGCGTCG GCGTCGAGGA CCCGCTGCTC TCGTGGCTGG GTGGACCCCG GTCGGCCGCG 
GACGTGGGGA CGTACGACGG CCTGTGGGTG CGCCTCGTCG ACCTGCCGGC CGCGCTGCAG 
GCCCGCGGGT GGAGCGCGGC GTGCGACGTC GTGGTCGAGG TCACCGACAC CGCGGCGCCC 
TGGAACGAGG GCAGGTGGCG GATCCGCGCG GATGCCTCGG GCGAGGCCGT CGTGGAGCGC 
GCGTCCGGGG ACCCGGACCT ACGGCTGGAT GTCGCGGCGC TGGGCTCGGC GTACCTCGGC 
GGTGGGAACC TGCTCGCCCG GCACCGGGCG GGCCTGGTGC AGGAGCAGCG GCCCGGCGCG 
GTGCGCGAGC TGTGGCGGGC CATGCGCACC GATCTCGCGC CGACCGCGGC GGTGGGGTTC 
TGA

Protein sequence

MSPDPIKVDR ATDAERYLAT DHTVWFAEVP SAPTEVQLTG LAPEQRFAVD LDGADPATYP 
GIYGVFPLTL SIPGPDAGAR QVPCAGLTWV GVHPDHRRRG VLTAMLRHHF EQVRAEGLHL 
SALHASEPAI YGRHGYGLAS LELEVRLGRG TALSAPGLEA PAAALTTRMV PASEPDVPAR 
LRACHLAHAE LGTVVGEPGY YHQVCLQLPE HLRGKEPWRV LFALRDGVDV GFAAFRRTEK 
WEKARPAGEV EVWTVVGEPA ARLALLRRLV DLDLIATVKV GSVGVEDPLL SWLGGPRSAA 
DVGTYDGLWV RLVDLPAALQ ARGWSAACDV VVEVTDTAAP WNEGRWRIRA DASGEAVVER 
ASGDPDLRLD VAALGSAYLG GGNLLARHRA GLVQEQRPGA VRELWRAMRT DLAPTAAVGF