Gene Spro_3157 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_3157
Symbol
ID	5605267
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	3475817
End bp	3477442
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	59%
IMG OID	640938700
Product	extracellular solute-binding protein
Protein accession	YP_001479385
Protein GI	157371396
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.821676
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTAATT TCTCTTTCAA TCGATTAACC AGCGGGATAA CAGTGGCATT GGGACTGGCG 
GCGGCGATGA ATCCGGCGCT GGCGTCGGTG CAGGGCGGCA CGCTTGTCTA CCTGGAACAG 
CAGGCTCACA CCAACCTTTA TCCGCCTTCC GGCGGTTTCT ACCCCAACGG CGGTATCCTC 
AATCAAATCA CCGACAAACT GACCTACCAG AACCCGCAAA CGCTGGAGAT TGAGCCGTGG 
ATTGCCGAGT CCTGGAGCAG CAACGCCGAT AAAACCGAAT ACACCTTCAA GCTGCGGCCT 
GGCGTGACTT TCTCCGACGG TACACCGCTG GATGCCAATG CAGTGGCGAA AAACTTCGAT 
ACCTATGGCC TGGGCAATAA AGAGAAACGT CTGCCGGTGT CCGAAGTCAT CAATAACTAC 
GACCACAGCG AAGTGATCGA CCCGTTAACC GTCAAGTTTT ACTTCAAGCA CTCGTCTCCC 
GGCTTCCTGC AGGGCACCGC CACCATTGGT TCTGGCCTGG TTTCGCTCAG CACCCTGAAC 
CGCAGCTATG ACCAACTCGG TGATGCGCGC CATATCATCG GTTCCGGCCC GTTTGTGGTC 
AGCGCCGAGA CGCTGGGGCG TGAGGTCAGC CTGAGCGTTC GCAAGGATTA TCACTGGGGT 
CCGGCCAAAT TGGCTCAGCA AGGGCGCGCT AATCTGGATG GCATCAAGGT GATTGTCACC 
GGCGAAGACA GCGTGCGTAT CGGTGCGTTG CAGGCTGGGC AGGCGGACTT TATTCGCCAG 
ATCCAGGCCT ACGACGAGAA GCAGACGCAG GAACAGGGCT TTACGATTTA CGCGGCCCCC 
ACTCGTGGTG TCAACGACAG CGTCGCCTTC CGGCCGGATA ACCCGCTGGT GAGCGACCTG 
CGCGTGCGTC AGGCACTGCT GCACGCCACC GACAGCAAGC AAATTGTCGA TACGCTGTTC 
TCGGTTAACT ACCCACAGGC TAAATCGGTG ATTGCTTCTT CCGCCGCCGG TTTCGTCGAC 
TTATCCGCCA AGCTGAAATT CGACCCGGAG CTGGCCAACC GTCTGCTGGA TGAGGCGGGC 
TGGAAAAAGG GCGGCGACGG CCTGCGTGAG AAGGACGGCA AAAAATTGCT GCTGAATGTC 
TATGAATCGC TGCCGCAGCC GCAGAACAAG GCGGTGCTGC AGCTGGTTTC GCAGCAGTGG 
GGCAAGGTCG GCGCGCGCTT GAACATTCTG GCGGGCGACG CCGGCAGCAA GGTGGCGGAT 
AACCTCGATC CGCAGAAAAC CCCGGCGGCG GTGGTGGAGG TGGGACGGGC GGATCCGGAC 
GTGATTAAGA GCCAGTTCTA CCCGACCAAC CGCGATGCGC TGTTGCAGCA GGGCGGGACG 
GGCAAAAACA GCGCATTCAA AGATGACAAG CTGAACGCGC TGCTGCTGGG CATCGCCTCT 
GAGGTGGACC CGAAAAAACG CCTGCAGATT GCCGGTGAGG CGCAGAATTA CCTGCTTGAT 
CAGGCCTATG TGATCCCGTT CTTCGAGGAG CCGCAGGTGT TTGCCGGTGC ACCTTATCTG 
AAGGGGGTTA GTTTCGAAGC GGTCGGTCGC CCGAGTTTCT ACGGCGCCTG GTTAGAGAAA 
CACTGA

Protein sequence

MFNFSFNRLT SGITVALGLA AAMNPALASV QGGTLVYLEQ QAHTNLYPPS GGFYPNGGIL 
NQITDKLTYQ NPQTLEIEPW IAESWSSNAD KTEYTFKLRP GVTFSDGTPL DANAVAKNFD 
TYGLGNKEKR LPVSEVINNY DHSEVIDPLT VKFYFKHSSP GFLQGTATIG SGLVSLSTLN 
RSYDQLGDAR HIIGSGPFVV SAETLGREVS LSVRKDYHWG PAKLAQQGRA NLDGIKVIVT 
GEDSVRIGAL QAGQADFIRQ IQAYDEKQTQ EQGFTIYAAP TRGVNDSVAF RPDNPLVSDL 
RVRQALLHAT DSKQIVDTLF SVNYPQAKSV IASSAAGFVD LSAKLKFDPE LANRLLDEAG 
WKKGGDGLRE KDGKKLLLNV YESLPQPQNK AVLQLVSQQW GKVGARLNIL AGDAGSKVAD 
NLDPQKTPAA VVEVGRADPD VIKSQFYPTN RDALLQQGGT GKNSAFKDDK LNALLLGIAS 
EVDPKKRLQI AGEAQNYLLD QAYVIPFFEE PQVFAGAPYL KGVSFEAVGR PSFYGAWLEK 
H