Gene Spro_4594 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_4594
Symbol
ID	5607047
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	5067736
End bp	5069004
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	59%
IMG OID	640940160
Product	cytosine deaminase
Protein accession	YP_001480815
Protein GI	157372826
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAGTTTA TCGATAACCT GCGTCTGAGC GGGCATGAAG GGCTGTGGCA ATTGGCCATT 
GAGCTGGGGC GCATCGCCCA TATCGTGCCG CAGCCGGAAG GGCGGGAATG GCGCAGCGAC 
GTGCTGGATG CACAGGGCGG GCTGGCGCTG CCGGCGTTTG TCGAACCGCA TATCCATCTG 
GATACCACCC AGACCGCCGG GCAACCGGCC TGGAACCAGT CAGGCACCCT GTTTGAAGGC 
ATTGAGCGCT GGGCCGAGCG CAAGGCGCTT CTGACCCACG AGGACGTCAA ACAACGCGCC 
TGGCAGACGC TGAAATGGCA GATCGCCAAC GGCGTACAGT ACGTGCGTAC CCACGTTGAC 
GTTTCTGACC CGACCCTGAC CGCGCTACGT GCGATGCTGG AAGTGAAACA GGAAGTCGCA 
CCCTGGGTCA CGCTGCAAAT CGTCGCTTTT CCACAGGAAG GCATTATGTC TTATCCCAAC 
GGCGAGACGC TGTTGGAAGA GGCGCTGCGG CTGGGCGCTG ACGTGGTAGG AGCCATTCCG 
CACTTTGAGT TTACGCGCGA GTACGGCGTG GAGTCCCTGC ACAAGGCATT CGCCCTGGCG 
CAGAAATACG ATCGGCTGGT GGATGTTCAC TGTGATGAGA TAGACGACGA ACAGTCGCGC 
TTTGTCGAAA CCGTGGCGGC GCTGGCGCTG AAGCTGGATA TGGGCGCCAG GGTCACCGCC 
AGTCACACCA CGGCGATGCA TTCCTACAAT GGGGCTTACA CTTCACGGCT GTTCCGCCTG 
CTGAAAATGT CCGGCATCAA CTTTGTCGCT AACCCTTTGG TCAATATTCA CCTGCAGGGC 
CGCTTCGACA GCTACCCGAA ACGGCGCGGC ATCACCCGGG TGAAGGAGAT GCTGGAGGCG 
GAAATTAACG TCTGCTTCGG CCATGATGAT GTGTTCGATC CCTGGTACCC GCTGGGCACT 
GCCAATATGC TGCAGGTGCT GCATATGGGG CTGCACGTGT GCCAACTGAT GGGATATGGC 
CAGATCGACG ACGGGCTGAA ACTGATCACC AGCCACAGTG CACGAACTCT GAACCTGAGC 
GACTATGGCT TGAAGGCTGG CAACAGCGCC AATCTGGTGA TATTACCGGC CGATAGCGGC 
TTTGATGCGG TGCGCCGACA GACGCCGGTG CGTTACTCGA TACGTCAGGG CACGGTGATT 
GCCGAAACCC AGCCGGCAGA AACCACGCTG TATCTGGCGC AGGATGAGAA GGTGGATTTC 
CGGCGTTGA

Protein sequence

MKFIDNLRLS GHEGLWQLAI ELGRIAHIVP QPEGREWRSD VLDAQGGLAL PAFVEPHIHL 
DTTQTAGQPA WNQSGTLFEG IERWAERKAL LTHEDVKQRA WQTLKWQIAN GVQYVRTHVD 
VSDPTLTALR AMLEVKQEVA PWVTLQIVAF PQEGIMSYPN GETLLEEALR LGADVVGAIP 
HFEFTREYGV ESLHKAFALA QKYDRLVDVH CDEIDDEQSR FVETVAALAL KLDMGARVTA 
SHTTAMHSYN GAYTSRLFRL LKMSGINFVA NPLVNIHLQG RFDSYPKRRG ITRVKEMLEA 
EINVCFGHDD VFDPWYPLGT ANMLQVLHMG LHVCQLMGYG QIDDGLKLIT SHSARTLNLS 
DYGLKAGNSA NLVILPADSG FDAVRRQTPV RYSIRQGTVI AETQPAETTL YLAQDEKVDF 
RR