Gene Spro_4201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_4201
Symbol
ID	5602783
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	+
Start bp	4656838
End bp	4658289
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	61%
IMG OID	640939761
Product	amidohydrolase
Protein accession	YP_001480423
Protein GI	157372434
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.888012
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAACC CGCAACTGCT TACGTTTATC AATCAGTACA TTGACCAACA CCAGCCGCAG 
TTCAGCGCAC TGAGCGACAG CATCTGGGAT CACCCGGAGA CGCGCTTTAC CGAAACCTAT 
TCTGCCAATC TGCTGGCCGA CGCGCTGGAG CAGGAAGGTT TTCGGCTTGA GCGCGGCGTT 
GGCGGCATTG AAACCGCGTT TATCGCCAGC TACGGCAGCG GCCAGCCGGT GATCGCGCTG 
CTGGGCGAGT ACGACGCTCT CGCCGGACTG AGCCAACAGG CCGGCTGTGC CACGCCGCAG 
CCGCTGGTGG AAAACGGCAA CGGCCACGGC TGCGGCCACA ATCTGCTGGG CACCGCCGCG 
CTGGCGGGGG CATTCGCGGT GAAGGCCTGG ATGCAACAGC AGCATCTGTC CGGCACCGTG 
CGTTTCTACG GCTGCCCGGG TGAAGAAGGC GGCTCCGGCA AAACCTTTAT GGTGCGTGAA 
GGCCTGTTCG ATGACGTTGA TGCCGCCCTC ACCTGGCATC CGGAAGGCTT CAGCGGCATG 
TTCAATACCA GCACTTTGGC CAACATTCAG GCGGCGTTTC AGTTCAAGGG CATCGCTGCT 
CACGCCGCCA ACTCACCGCA CCTTGGCCGC AGCGCGCTGG ATGCGGTAAC GCTGATGAAC 
ACCGGTGCCA ACTTCCTGCG TGAGCACATC GTACAGGAAG CCCGGCTGCA CTATGCCGTC 
ACCAATACCG GTGGCAGTTC ACCCAATGTG GTGCAAGCCG ATGCCGAGGT GCTGTACCTG 
GTCCGCGCGC CACAGCTCGA TCAGGCGCAG GATATTTACC AACGGGTGAT CAACATCGCC 
AAAGGCGCAG CGCTGATGAC CGATACCCAG ATGACGGTGC GTTTCGACAA GGCTTGCTCC 
AACTACGTGC CAAACCGCAG CATGGAGCAG GTGATGTATC GCTATGTCTG CGACTTCGGC 
CTGCCGGAAT ACAGTGAGGC GGAACGCGAA TTCGCCGGCG AAATCCGCCA AACGCTCAAC 
AAAGATGACC TGCGTAATGC CAGGTTAAAT ATCGCCCGTA CCGGCGGCGC GGCGGGCCGC 
GAGTGGGTTC AGAATTTGGG CGACAAGGTG TTGATGGATC AGGTAGCTCC TTATGTGGCA 
TCGGAAGATC TACTGTACGG CTCTACCGAC GTCGGCGATG TCAGTTGGGT CGCGCCGACC 
GCCCAGTGCT TCAGCCCCTG CTTTGCGTTC GGCACTCCGC TGCACACCTG GCAACTGGTG 
GCACAGGGTC GCACTTCGAT CGCCCACAAA GGCATGTGCC TGGCCGGCAA GGTGATGTCG 
GCCACCGCCG TCGAACTGCT GAGCGACAGC GCCCTGCTGG CGGACTGCCG CCGCGAGTTC 
GAAGGCCAGC GCGCCGAACA GCCTTATAGC TGCCCGATCC CTAAAGACAT CAGGCCTTCC 
CCGTTAAAGT AA

Protein sequence

MSNPQLLTFI NQYIDQHQPQ FSALSDSIWD HPETRFTETY SANLLADALE QEGFRLERGV 
GGIETAFIAS YGSGQPVIAL LGEYDALAGL SQQAGCATPQ PLVENGNGHG CGHNLLGTAA 
LAGAFAVKAW MQQQHLSGTV RFYGCPGEEG GSGKTFMVRE GLFDDVDAAL TWHPEGFSGM 
FNTSTLANIQ AAFQFKGIAA HAANSPHLGR SALDAVTLMN TGANFLREHI VQEARLHYAV 
TNTGGSSPNV VQADAEVLYL VRAPQLDQAQ DIYQRVINIA KGAALMTDTQ MTVRFDKACS 
NYVPNRSMEQ VMYRYVCDFG LPEYSEAERE FAGEIRQTLN KDDLRNARLN IARTGGAAGR 
EWVQNLGDKV LMDQVAPYVA SEDLLYGSTD VGDVSWVAPT AQCFSPCFAF GTPLHTWQLV 
AQGRTSIAHK GMCLAGKVMS ATAVELLSDS ALLADCRREF EGQRAEQPYS CPIPKDIRPS 
PLK