Gene Spro_4414 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_4414
Symbol
ID	5605893
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	+
Start bp	4888615
End bp	4889616
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	57%
IMG OID	640939976
Product	putative sulfite oxidase subunit YedY
Protein accession	YP_001480636
Protein GI	157372647
COG category	[R] General function prediction only
COG ID	[COG2041] Sulfite oxidase and related enzymes
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0244066
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAAC AACGAAAACT CACTGAGGCC GATGTCACGC CAGAGAGCGT ATTTTATCAG 
CGCCGTAAAG TGTTGCAGGC GTTGGGCATT ACCGCCGCAT CACTGGCCCT GCCGCATAAT 
GCGCAGGCCG ATTTGCTGTC ATGGTTTAAG GGTAACGATC GGCCCAAGGC ACCGCCGGGT 
AAACCGCTGG AGTTCAGCAA ACCTGCCGCC TGGCAGGCCC AGTTGGATTT GACGCCCGAA 
GATAAAGTCA CCGGCTATAA CAACTTCTAC GAATTCGGTC TGGACAAGGC CGATCCGGCA 
GCCAATGCCG GCGGCTTGAA AACCGAAGGC TGGCAGGTAC GCATCGACGG TGAAGTCGCC 
AAACCCATCA CGCTGGACAT AGATGATTTA ATCAAACGCT TCCCGCTGGA ACAGCGCATC 
TATCGCATGC GCTGCGTTGA AGCCTGGTCA ATGGTGGTGC CGTGGATTGG CTTTGAATTG 
GGTAAACTGA TCAAATTCGC GGAACCCAAC AGCAACGCAC GCTACGTCGC TTTCCAGACG 
TTGTACGACC CGGAACAGAT GCCCGGCCAG AAAGACCGCT TTATCGGCGG CGGGTTGAAG 
TATCCCTATG TCGAAGGGCT GCGTCTCGAC GAGGCGATGA ACCCGCTGGC ACTGCTGACC 
GTCGGCGTGT ACGGCAAAAC GCTGCCGCCG CAAAATGGCG CGCCGCTGCG CTTGATCACC 
CCATGGAAAT ACGGTTTTAA GGGGATAAAG TCGATCGTCC ATATCCGCCT GGTGCGCGAT 
CAGCCGCCGA CCACCTGGAA TCAGTCGGCG CCGAATGAAT ACGGCTTCTA CGCCAACGTG 
AATCCGCACG TCGATCATCC CCGTTGGTCG CAGGCCACCG AGCGTTTTAT CGGTTCCGGC 
GGCATTCTGG ACGTTAAACG CCAACCCACC CTGCTGTTTA ATGGCTATGC GGAACAGGTC 
GCATCGCTGT ACCGTGGCCT GGATCTACGG GAGAATTTCT AA

Protein sequence

MSKQRKLTEA DVTPESVFYQ RRKVLQALGI TAASLALPHN AQADLLSWFK GNDRPKAPPG 
KPLEFSKPAA WQAQLDLTPE DKVTGYNNFY EFGLDKADPA ANAGGLKTEG WQVRIDGEVA 
KPITLDIDDL IKRFPLEQRI YRMRCVEAWS MVVPWIGFEL GKLIKFAEPN SNARYVAFQT 
LYDPEQMPGQ KDRFIGGGLK YPYVEGLRLD EAMNPLALLT VGVYGKTLPP QNGAPLRLIT 
PWKYGFKGIK SIVHIRLVRD QPPTTWNQSA PNEYGFYANV NPHVDHPRWS QATERFIGSG 
GILDVKRQPT LLFNGYAEQV ASLYRGLDLR ENF