Gene Spro_3641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_3641
Symbol
ID	5606101
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	4026711
End bp	4028621
Gene Length	1911 bp
Protein Length	636 aa
Translation table	11
GC content	58%
IMG OID	640939192
Product	twin-arginine translocation pathway signal
Protein accession	YP_001479865
Protein GI	157371876
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATCA CCAGACGCGA TTTTCTTAAT GGGGTGGCGA TCACTATCGC CGCCGGGTTA 
ACGCCGATGC AGATCCTGCG GGCATCGCCG CAAACCGCCA ATCAAACCCT CTATTATCCG 
CCGACGCTGA CCGGATTGCG GGGCAACCAT CCCGGTTCGT TTGAGCATGC TCACCAACTG 
GGGCGTGACG GCAAGGCCTT CGATTTTGCC AGCATCCCGG CGACGGAAGA GTTCGATCTG 
GTGGTAGTCG GCGCCGGGAT CAGCGGACTG GCCGCCGCCT GTTTCTGGCA GCAAATGAAA 
GGTCAGCAGC AGCGTATCTT GCTGATCGAC AACCATGATG ATTTCGGTGG CCACGCCAAG 
CGCAATGAAT TCAGCAGCGA AAATGGCACC ATTCTCGGCT ACGGCGGCAG CGAGTCGCTG 
CAGTCGCCGC GCTCCAACTT CAGCCCGGTG GCGATGAGGC TGCTGCAAAA GCTGGGCGTC 
AGCATCGACA ACCTGGAAAA GGCTTTCGAT AAAACCTTCT ACCCGGATCT TAACCTGAGC 
CGTGGCGTCT ATTTCGATCG CAAAAACTTC GGCGTCGACA AAGTGGTGAA CGGGGATCCT 
GGCCGTATGG TGGCGGATGA TATTCCCCAT GACCGCCTTA ATGGCCGTTC CTACGAAGCC 
TTTATCGGTG ATTTCCCGCT GCCGGAAAGC GATCGCCAGG CGCTGATTGC ACTGCATACG 
GTGGATAAGG ATTACCTGCC GGAAATGAGT CAGGAGCAGA AAAGCGAATG GCTCGACAAG 
CACAGTTATA CCGAATTCCT GCGTGACAAG GTTGGCCTGA GCGAAATGGC GATCCGCTAT 
TTCCAACAAA CCACCAGTGA CTTCCAGGCG GTGGGTATCG ACGCCACTTC GTGCAGCGAT 
GCGCGTATTT GCGATCTGCC TGGCCTGAAC GGCATGAACC TGCCGCCGCT GGATGAAGAG 
TCACAGGCGG ATCTCGACGA TCCTTACGTG TTCCACTTCC CGGACGGCAA CGCCACGCTG 
ACACGCTTAA TGGTGCGCCA TCTGATCCCG GCGGTAGCGC CTGGCGGTAA GGACATGAAT 
GACATAGTGC TGGCGAAGTT CGACTACAGC CAGCTTGACC GGGCGGAGTC ACCGGTAAAA 
CTGCGCTTGA ACAGCACCGG GCTGCACGCG GCTAACGTCG GCGACAAGGT CGAAGTGACC 
TACATGACCG GCGAGAAAAT GACCAAGGTG CGCGCCGGGC AGGTAGTGAT GGCCGGCTAC 
AATATGATGA TCCCTTATCT GGTGCCGGAA ATGTCGCCGG AGCAGCAACT GGCGCTGAAG 
CAGAACGTCA AGTCGCCGCT GGTGTACAGC AAAGTGGTGA TCCGTAACTG GCAGTCGTTT 
ATTAAACTGG GCGTGCATGA AGTTTACTCG CCAACGGCGC CTTATTGCCG TGTGAAGCTG 
GATTATCCGG TGAGCATGGG CGGCTACCAG CATCCACGCG ATCCGAACCA GCCGATTGGC 
CTGCACATGG TGTATGTGCC GACGCTGGCG GGCAGCGGGT TAAGCCCACG CGAGCAGTCG 
CGCAAGGGCC GTGCCTTGCT GTTGGGCACG CCGTTTGAAG TGCATGAGCA GATGATCCGT 
GAGCAGTTGC AGGGCATGCT CGGTTCCGCC GGTTTTGATC ATCAGCGTGA TATTGAAGCG 
ATCACCGTTA ACCGCTGGTC GCACGGCTAT TCCTACTTCC TCAACGGGCT GTTTGACGAT 
GAGGACGAGG CGAAGAAAAT CATTGAGACG GCGCGTAAGC CGATCGGCAA AATTGTGATT 
GCCAACTCGG ATTCAGACTG GAGTCCGTAC GCCAACTCGG CGATCGATCA GGCGTGGCGC 
GCGGTTAATG AACTGGCCTT CGGCCAGGTT GCCGCCAAGG AGGGAGCATG A

Protein sequence

MSITRRDFLN GVAITIAAGL TPMQILRASP QTANQTLYYP PTLTGLRGNH PGSFEHAHQL 
GRDGKAFDFA SIPATEEFDL VVVGAGISGL AAACFWQQMK GQQQRILLID NHDDFGGHAK 
RNEFSSENGT ILGYGGSESL QSPRSNFSPV AMRLLQKLGV SIDNLEKAFD KTFYPDLNLS 
RGVYFDRKNF GVDKVVNGDP GRMVADDIPH DRLNGRSYEA FIGDFPLPES DRQALIALHT 
VDKDYLPEMS QEQKSEWLDK HSYTEFLRDK VGLSEMAIRY FQQTTSDFQA VGIDATSCSD 
ARICDLPGLN GMNLPPLDEE SQADLDDPYV FHFPDGNATL TRLMVRHLIP AVAPGGKDMN 
DIVLAKFDYS QLDRAESPVK LRLNSTGLHA ANVGDKVEVT YMTGEKMTKV RAGQVVMAGY 
NMMIPYLVPE MSPEQQLALK QNVKSPLVYS KVVIRNWQSF IKLGVHEVYS PTAPYCRVKL 
DYPVSMGGYQ HPRDPNQPIG LHMVYVPTLA GSGLSPREQS RKGRALLLGT PFEVHEQMIR 
EQLQGMLGSA GFDHQRDIEA ITVNRWSHGY SYFLNGLFDD EDEAKKIIET ARKPIGKIVI 
ANSDSDWSPY ANSAIDQAWR AVNELAFGQV AAKEGA