Gene Spro_4503 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_4503
Symbol
ID	5606216
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	4990506
End bp	4992104
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	55%
IMG OID	640940065
Product	malate synthase
Protein accession	YP_001480725
Protein GI	157372736
COG category	[C] Energy production and conversion
COG ID	[COG2225] Malate synthase
TIGRFAM ID	[TIGR01344] malate synthase A

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00577319
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACGCAAC AGATAGTAGG CACGGAATTA ACGTTTACGC AGGGTTTTAG CGCTGCTGAA 
CGACAGGTGT TGACGGATGA CGCGGTCGAA TTCCTGGCGG AATTGGTGAG TAAATTTACT 
CCACAGCGTA ACAAACTGTT GGCTGCGCGT GCCTGCTGGC AGCAGAAGAT CGATCAAGGT 
GAACGTCCAG ACTTCATTTC GGAAACTAAT TCCATTCGCA ATGAAAAGTG GTCGATCCGT 
GGCATACCAG AGGATCTTCG CGACCGCCGG GTGGAAATCA CCGGTCCGGT TGAACGCAAG 
ATGGTCATCA ACGCCCTGAA CGCCAATGTG AAGGTGTTTA TGGCGGACTT CGAAGACTCA 
CTGGCACCGA GCTGGGACAA AGTCATCGAC GGCCAAATCA ACCTGCATGA CGCGGTGAAC 
GGCACCATCT CTTACACCAA TGAAGCCGGC AAGATTTATC AGTTAAAGCC GAACCCGGCG 
GTATTGATTG CTCGCGTACG CGGCCTGCAT TTGCCGGAAA AACACGTGCA ATGGCAGGGG 
GAAGCGATCC CCGGTGGCCT GTTCGATTTT GCGCTGTATT TCTTCCATAA CTATCGTCAA 
CTGCTGGCTA AAGGCAGTGG CCCTTATTTC TACCTGCCAA AAACCCAGTC CTGGCAGGAA 
GCGGCCTGGT GGAGCGAAGT CTTCAGCTTT GCCGAGGATC GTTTCTCCCT GCCACGCGGC 
ACGATCAAAG CCACGGTGCT GATCGAAACG CTGCCGGCAG TATTCCAGAT GGACGAGATC 
CTCTACCACC TGCGCGATCA TATCGTCGGC TTGAACTGCG GCCGTTGGGA TTACATCTTC 
AGCTACATCA AGACGCTGAA AAACCATGCT GACCGGGTAT TGCCGGATCG TCAGTCGGTC 
ACCATGGACA AGTCATTCCT TAGCGCCTAT TCCCGATTGC TGATCAAGAC CTGCCACAAG 
CGCGGTGCCT TTGCCATGGG CGGCATGGCG GCGTTTATCC CGAGCAAAGA CGCCGAGAAA 
AATGCCTGGG TGCTGAACAA GGTGCGGGCG GATAAAGAGC TGGAGGCCAA TAACGGCCAC 
GACGGTACCT GGGTGGCCCA TCCAGGGCTG GCGGATACCG TAATGGAAGT CTTCAGCCGG 
GTGCTCGGTG AGCGCCGTAA CCAACTCGAA GTGCTGCGTG AAAACGACGC GCTAATCAGT 
GCTGCGCAGT TGCTTGAACC TTGTGACGGG GAGCGTACCG AAGCCGGCAT GCGCGCCAAT 
ATCCGCGTGG CGGTGCAGTA CATCGAAGCC TGGATCTCCG GCAATGGCTG CGTCCCGATT 
TATGGCCTGA TGGAAGACGC GGCGACGGCG GAAATTTCCC GTACCTCTAT CTGGCAGTGG 
ATCCACCATG AAAAGAGCCT GAGTGATGGC CAACTGGTCA CCAAGGCGCT GTTCCGTCAG 
ATGCTGAAAG AAGAAATGCT GGTAGTACGT GAAGAGTTGG GTGAGGCACG CTTTAACGCT 
GGCCGCTTCG ACGAAGCGGC ACGCCTGATG GAGCGTATCA CTACGCAAGA CGAATTAATC 
GATTTCCTGA CTTTACCTGG CTATGAGCTA CTGGCCTGA

Protein sequence

MTQQIVGTEL TFTQGFSAAE RQVLTDDAVE FLAELVSKFT PQRNKLLAAR ACWQQKIDQG 
ERPDFISETN SIRNEKWSIR GIPEDLRDRR VEITGPVERK MVINALNANV KVFMADFEDS 
LAPSWDKVID GQINLHDAVN GTISYTNEAG KIYQLKPNPA VLIARVRGLH LPEKHVQWQG 
EAIPGGLFDF ALYFFHNYRQ LLAKGSGPYF YLPKTQSWQE AAWWSEVFSF AEDRFSLPRG 
TIKATVLIET LPAVFQMDEI LYHLRDHIVG LNCGRWDYIF SYIKTLKNHA DRVLPDRQSV 
TMDKSFLSAY SRLLIKTCHK RGAFAMGGMA AFIPSKDAEK NAWVLNKVRA DKELEANNGH 
DGTWVAHPGL ADTVMEVFSR VLGERRNQLE VLRENDALIS AAQLLEPCDG ERTEAGMRAN 
IRVAVQYIEA WISGNGCVPI YGLMEDAATA EISRTSIWQW IHHEKSLSDG QLVTKALFRQ 
MLKEEMLVVR EELGEARFNA GRFDEAARLM ERITTQDELI DFLTLPGYEL LA