Gene Spro_2053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_2053
Symbol
ID	5607094
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	+
Start bp	2246509
End bp	2247546
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	56%
IMG OID	640937591
Product	LacI family transcription regulator
Protein accession	YP_001478284
Protein GI	157370295
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGGCA AGAAAACCAC CCTGGCCGCC ATTGCCAGAG AGGCACATGT TGGTATCGCT 
ACGGTTGATC GGGTAATAAA CCAGCGCGCA ACAGTACGGC CGGAAACGGC ACGCAGGGTC 
ATTGCGGCGG CGCACAAATT AGGCTTCGCA CTAGAGAAAT CGCATCAACT GTTTGAGACG 
ATGGGCCAAC CAGCCGCACG GATTAAAATG GGCTTTATCC TGCTGCGCAA GGAACATTCG 
TTCTACGCAC AATTGGCGGA TAGCCTGCTG GAACAGGCCG CACCCTATTA CGACGCTGAG 
CACCCGCCAC AGTTCATGTT TCATGATATC AGTGCGGTCA GCGACACCGC TGCCGCCATC 
ACACAGTTAA GCCAAAATGT GGATGTGATC GGCGTGCTGG CGCTGGATAA CCCGATGATC 
CGTTTTGCGG TGGAAGAGGC TAGCAGGCAG GGGGTAAAGG TATTCACGTT GCTGTCTGAT 
TTATCGGTAC ACAGCCGTGC CGGTTATATC GGCTGGGATA ACCAGCAGGC AGGTCGTACC 
GCCGGCTGGG CGGTGGAGCG CTTGTGCCAT CGGCAGGGCG ATGTCGGGGT CATTATCGGC 
GATAACCGTT TTCTGTGTCA GGAAACCTGC GAAATCAGCT TTCGATCTTA CCTGCGCGAA 
CACCTGAGTG GTCTGCGGGT GCTTGAGCCG GTACGCAGTC ATGAACGGAC CGAAAGCGCA 
AGACAAGTCA CTCAAACCTT GCTGGAGCAG CATCCCAATC TGGTGGCTCT GTATGCACCC 
TGCGGGGGTG TGGAAGGGAT TATTGCTGCG CTGCGGGAAA GCGGCAGGCA GCATCAGGTG 
ATGCTGATTT GCCATGGCCC GGTTACAGGT GGCGAAATGG CGCTGATCGA CGGCACGCTG 
GATCTGATGC TCAGACATCG TATTGCCGAG TTTGCGGCGT CAGTCATCAG CACTTTTGTC 
GCCGCCACCG TTGGCGGCTC CTCCGGTTTT AGTCACACCA TTAACCGCTT TGATCTGATC 
ACCAAAGAAA ACCTCTGA

Protein sequence

MAGKKTTLAA IAREAHVGIA TVDRVINQRA TVRPETARRV IAAAHKLGFA LEKSHQLFET 
MGQPAARIKM GFILLRKEHS FYAQLADSLL EQAAPYYDAE HPPQFMFHDI SAVSDTAAAI 
TQLSQNVDVI GVLALDNPMI RFAVEEASRQ GVKVFTLLSD LSVHSRAGYI GWDNQQAGRT 
AGWAVERLCH RQGDVGVIIG DNRFLCQETC EISFRSYLRE HLSGLRVLEP VRSHERTESA 
RQVTQTLLEQ HPNLVALYAP CGGVEGIIAA LRESGRQHQV MLICHGPVTG GEMALIDGTL 
DLMLRHRIAE FAASVISTFV AATVGGSSGF SHTINRFDLI TKENL