Gene Spro_2271 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_2271
Symbol
ID	5604906
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	+
Start bp	2472046
End bp	2473104
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	62%
IMG OID	640937810
Product	DNA-binding transcriptional repressor MalI
Protein accession	YP_001478500
Protein GI	157370511
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.485606
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0115429
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAGGA TCGGGCTTGC AGAGGTCATG ACCATCAAAA AGATCACCAT CACCGATGTT 
GCACAGCAGG CCGGCGTCTC GGTCACTACC GTTTCGCTGG TGCTGAGCGG CAAAGGGCGT 
ATTTCACCCA CCACCGTGGC GCGGGTGAAC CAGGCGATTG AGCGCTTGGG CTACGTGCGC 
AACCGTCAGG CGGCGACGCT ACGTGGTGGC GAGTCGGGGG TGATTGGGCT GATCCTGCGT 
GATATCTGCG AGCCGTTTTA TGCAGAAATG ACCGCGGGCC TGAGCGAGGT GCTGGAGGCG 
CACGGCAAAG TGCTGTTTCT GACTCAAAGC GGTCGCGACG GCAAGGGGCT GATGCGCTGT 
TTTGATACTT TGCTCGAGCA CGGCATTGAC GGCATGGTGC TGGCGGGCGG CGTACGCTCG 
GCTGAGGGCC TGAAGGAAAA GGCTGCGGAG CAGGGCGTGC CGCTGGTGTG CGCAGCGCGC 
TCTAATGGGC TGGAAGGGGT CGACGTGGTG CGGCCGGACA ACATGCAGGC GGCTAAAATG 
GCCACCGAAT TTCTGATCAA ACGCGGTCAC AGCCAAATTG CCTATCTGGG TGGGCAAAGC 
AGTTCGTTAA CCCGCGCAGA ACGGTTGGGG GGCTTTTGTG CCACGCTGGT GCAATATGGC 
CTGCCATTCC GCTCCGACTG GATTGTCGAA TGTGACTGCC ATCAACGGGC CGCGGCGGAG 
GCGGCGGAAA ACCTGCTACG GCAACATCCC AATATCAGCG CGCTGGTTTG CCACAAGGCG 
TCGGTGGCAT TGGGCGCCTA TTTTGGCATT GTGCGTAGTG GGCGCAGCAT CGGTTCTGAG 
GGGGTGGATA CCTATTACGG CCAGCAGGTG GCGCTGATTG GTTTTGGCGA CGTGCCTGAG 
GCCGAACTGA CCGAACCGCC GCTGACGCTG GTCTCCAGTT CCGCGCGGGA AGTGGGGCGC 
AGCGCCGCCT CACGCTTGCT GCAACGGATT GCCGACGCCG ACTTACCGCC GCAAAACGTG 
ATCCTGCCGC CATTGCTGAT CAAGCGCGGC TCGGCCTGA

Protein sequence

MPRIGLAEVM TIKKITITDV AQQAGVSVTT VSLVLSGKGR ISPTTVARVN QAIERLGYVR 
NRQAATLRGG ESGVIGLILR DICEPFYAEM TAGLSEVLEA HGKVLFLTQS GRDGKGLMRC 
FDTLLEHGID GMVLAGGVRS AEGLKEKAAE QGVPLVCAAR SNGLEGVDVV RPDNMQAAKM 
ATEFLIKRGH SQIAYLGGQS SSLTRAERLG GFCATLVQYG LPFRSDWIVE CDCHQRAAAE 
AAENLLRQHP NISALVCHKA SVALGAYFGI VRSGRSIGSE GVDTYYGQQV ALIGFGDVPE 
AELTEPPLTL VSSSAREVGR SAASRLLQRI ADADLPPQNV ILPPLLIKRG SA