Gene Spro_4701 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_4701
Symbol
ID	5607394
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	5195187
End bp	5197229
Gene Length	2043 bp
Protein Length	680 aa
Translation table	11
GC content	59%
IMG OID	640940267
Product	oligopeptidase A
Protein accession	YP_001480922
Protein GI	157372933
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0339] Zn-dependent oligopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAATC CGTTGCTGAC CCCGTTTTCC CTGCCACCGT TTTCCGCCAT TCGCCCAGAA 
GATATCGTGC CTGCGGTGCA ATCCGCATTG GCCGATTGCC GCGCTGCGGT AGAGCGCGTT 
GTCGCGCAGC CGGGGCCATT CACCTGGGAT AACCTGTGTC AGCCGCTGGC GGAGTCTGAC 
GATCGCCTGT CGCGCATCTG GTCGCCGGTG GGGCATTTGA ACTCGGTAAA AAACAGCCCG 
GAACTGCGTG CCGCCTATGA GCAGGCGTTG CCGTTGCTGT CTGAGTACGG CACCTGGGTT 
GGGCAACACG AAGGTTTGTA TCAGGCGTAC CGCAGCCTGA AAGAAGGCGA AGCCTTCAAT 
CAACTGACCG CACCACAGCG CAAGTCGGTA GAAAATGCGC TGCGTGATTT TGAGCTGTCG 
GGCATCGGCC TGTCGCCGGA AAAACAGCGT CGCTATGGTG AAATCGTCGC GCGTCTGTCC 
GAGCTGGGTT CTACCTACAG CAACAACGTG CTCGACGCCA CCATGGGTTG GAGCAAGCTG 
ATTACCAATG AAACCGAGCT GAGCGGCCTG CCGGAAAGCG CGTTGGCCCA GGCTCAGGCG 
ATGGCGCAGG CCAAAGAGCA GGACGGCTGG CTGCTGACGC TGGATATGCC GAGCTATCTG 
CCGGTACTGA CCTACGGCGA CAACCGCGCA CTGCGTGAAG AGATGTATCG CGCCTTCGCT 
ACCCGCGCTT CCGATCAGGG GCCGAATGCC GGTAAGTGGG ACAACAGCGA AGTGATGGCG 
GAAACGCTGG CGCTGCGCCA TGAACTGGCC CAACTGCTGG GCTTTGACAG CTACGCCGAC 
AAATCGCTGG CGACCAAAAT GGCGGAAAAC CCGGAGCAGG TGCTCGGTTT CCTCAGCGAT 
CTGGCCAAAC GCGCCCGTCC ACAGGCCGAG CAGGAATTGG CGCAGCTGCG CGCCTTCGCC 
AAACAGCATT ACGGCGTAGA TGAACTGGAA GCCTGGGACA TTACCTATTA CGGCGAAAAA 
CAGAAACAAC ACCTGTTCTC GATCAGCGAC GAGCAACTGC GCCCGTACTT CCCGGAACAG 
CGGGTGGTGG AAGGTCTGTT CGAAGTGGTC AAACGCATTT ACGGCATCAC TGCCAAAGAG 
CGCAAGGATG TGGATACCTG GCATCCAGAG GTGCGCTTCT TTGATCTGTT CGACGCCAAC 
GGCGAGCTGC GCGGCAGCTT CTACCTTGAC CTGTATGCGC GTGAAAACAA ACGCGGCGGG 
GCGTGGATGG ACGACTGCGT CGGCAGCCTG CGCAAGGCCA ACGGCGAACT ACAAAAACCG 
GTCGCCTATC TGACCTGTAA CTTTAACCGT CCGCTGGGCG ACAAGCCGGC GCTGTTCACC 
CATAACGAAG TGACCACCTT GTTCCACGAG TTCGGCCACG GTCTGCACCA TATGCTGACC 
CAGATCGACA CCGCCGGCGT TTCCGGCATC AGCGGTGTGC CATGGGATGC GGTCGAACTG 
CCAAGCCAGT TTATGGAAAA CTGGTGCTGG GAGCCGGAAG CGCTGGCGTT TATCTCCGGC 
CACTATCAGA GCGGTGAACC GCTGCCGAAA GAGATGCTCG ACAAGCTGCT GGCCGCCAAA 
AATTACCAGG CGGCGCTGTT TATTCTGCGT CAGTTGGAGT TCGGCCTGTT CGACTTCCGC 
ATGCACGCCG AATACAACCC TTCAAGCGGC GCGCAGATCC TGCCAACCTT GGCGGAAGTG 
AAGAAAATGG TGGCGGTGGT ACCTTCACCA AGCTGGGGCC GTTTCCCACA TGCTTTCAGC 
CATATCTTCG CTGGCGGCTA CGCGGCGGGC TACTACAGCT ACCTGTGGGC GGAAGTGCTG 
TCGGCCGATG CCTATTCGCG CTTTGAGGAA GAGGGGATTT TCAACGCCGA AACCGGTAAA 
TCCTTCCTCG ACAACATCCT GTCGCGCGGC GGTTCGGAAG AGCCGATGGA ACTGTTCAAA 
CGCTTCCGTG GCCGTGAGCC GCAGCTGGAT GCTATGCTGC GCCATTACGG CATTAAAGGA 
TAA

Protein sequence

MTNPLLTPFS LPPFSAIRPE DIVPAVQSAL ADCRAAVERV VAQPGPFTWD NLCQPLAESD 
DRLSRIWSPV GHLNSVKNSP ELRAAYEQAL PLLSEYGTWV GQHEGLYQAY RSLKEGEAFN 
QLTAPQRKSV ENALRDFELS GIGLSPEKQR RYGEIVARLS ELGSTYSNNV LDATMGWSKL 
ITNETELSGL PESALAQAQA MAQAKEQDGW LLTLDMPSYL PVLTYGDNRA LREEMYRAFA 
TRASDQGPNA GKWDNSEVMA ETLALRHELA QLLGFDSYAD KSLATKMAEN PEQVLGFLSD 
LAKRARPQAE QELAQLRAFA KQHYGVDELE AWDITYYGEK QKQHLFSISD EQLRPYFPEQ 
RVVEGLFEVV KRIYGITAKE RKDVDTWHPE VRFFDLFDAN GELRGSFYLD LYARENKRGG 
AWMDDCVGSL RKANGELQKP VAYLTCNFNR PLGDKPALFT HNEVTTLFHE FGHGLHHMLT 
QIDTAGVSGI SGVPWDAVEL PSQFMENWCW EPEALAFISG HYQSGEPLPK EMLDKLLAAK 
NYQAALFILR QLEFGLFDFR MHAEYNPSSG AQILPTLAEV KKMVAVVPSP SWGRFPHAFS 
HIFAGGYAAG YYSYLWAEVL SADAYSRFEE EGIFNAETGK SFLDNILSRG GSEEPMELFK 
RFRGREPQLD AMLRHYGIKG