Gene Arth_1926 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1926
Symbol
ID	4445545
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	2168946
End bp	2170037
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	62%
IMG OID	639689736
Product	Nitrilase/cyanide hydratase and apolipoprotein N-acyltransferase
Protein accession	YP_831408
Protein GI	116670475
COG category	[R] General function prediction only
COG ID	[COG0388] Predicted amidohydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.342174
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCGATC CATTTGTCGT CGTTGCGGTT TCGCCGCGGA CAATCAATGT GAAGAATCCC 
GGCGACGGCG TCGCCAACGT CAAGCGCATC AACGAATTCA TCGACACGGC GGTCATGGTC 
GGCGCCTGGG AAGGTTCTCC GGTCAAGCTG GTAGTCCTGC CCGAGATGGC GATCCAGGGC 
ATGATGGCCA ACACGCCTGG GAACCGTAAG AAGGAGGCCC ACTTTGCCGT GACGATCCCT 
GGTCCGGAGA CGGACGAGCT GGCGAAGAAG GCCGTGGAGC TCAATACCTA CATCGCTGCC 
GAGCTGTACA TGGTCAAGGA CGAGGACTTC CCGGACCGCC ACTTCAATGT CGCCTTCATC 
ATCGATCCGC AGGGCGAGAT CATCTACAAG CGCTACAAGG CCACCAGTGA TGCCTACGAA 
GGAGGCATGC TCGGCAACAT GAACCCGCAC GACGTGTGGG ACGAGTGGAT CGAAAAGAAG 
GGAAATGGCA ACGCAATGGA CGCCATCTTC CCTGTGGCTA AGACCGAGAT CGGCAACATC 
GGGTACGCCA TCTGCCACGA GGGTGTCTAC CCCGAGGTGC CGCGTGGGCT CGCGATGAAC 
GGCGCCGAGA TCATTATCCG GGGCACCCTG ATCGAGCCGG CCGTCCAAAA CGGCATGTGG 
GAACTGCAGA ACCGGGCACA CGCCATGTTC AACTCGGCGT ACATCGTCGC TCCGAACCTG 
GGGCCCGAAG TCCGCGACGA CGGGAGCATG CAGGACCTGT TCGGCGGCCA GTCCATGATC 
GTCGGTCCAC GCGGGCAGAT CCTCACCAAG CAGCAGGGCT GGACCTCGGG CGACTCGTTC 
GTCTGCACCA CAATCGACAT CGAAGCGCTC CGCCGGGCCA GGGTCGCCAA CGGCCTGTAC 
AACCAGTTCA AGGACCTGCG CACCGAGCAG TACCGGGTCA TCTATGACAA CCCGATTTAT 
CCGAAGAACC AGTACCTCGA CGCGCCGCCG AGCGAGGGAT GGCTCGCCCG GGAAGACGCA 
ACGCGGGCCG CTAATATCGA GAAACTCATC GAGCGCGGCG TGCTCACACC GCCCTCGGGC 
TACAGGGCAT AA

Protein sequence

MVDPFVVVAV SPRTINVKNP GDGVANVKRI NEFIDTAVMV GAWEGSPVKL VVLPEMAIQG 
MMANTPGNRK KEAHFAVTIP GPETDELAKK AVELNTYIAA ELYMVKDEDF PDRHFNVAFI 
IDPQGEIIYK RYKATSDAYE GGMLGNMNPH DVWDEWIEKK GNGNAMDAIF PVAKTEIGNI 
GYAICHEGVY PEVPRGLAMN GAEIIIRGTL IEPAVQNGMW ELQNRAHAMF NSAYIVAPNL 
GPEVRDDGSM QDLFGGQSMI VGPRGQILTK QQGWTSGDSF VCTTIDIEAL RRARVANGLY 
NQFKDLRTEQ YRVIYDNPIY PKNQYLDAPP SEGWLAREDA TRAANIEKLI ERGVLTPPSG 
YRA