Gene Ent638_2023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_2023
Symbol
ID	5113439
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	+
Start bp	2196518
End bp	2197534
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	54%
IMG OID	640492211
Product	LacI family transcription regulator
Protein accession	YP_001176750
Protein GI	146311676
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID	[TIGR02417] D-fructose-responsive transcription factor

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.072894
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGAAAAA CAAAACGCAT CACCATTAAA GACGTAGCAG AACTGGCGGG CGTATCGAAA 
GCGACCGCCA GTCTGGTTTT GAATGGTCGC AGCAAAGAAT TACGTGTCGC AGAAGAAACG 
CGCGATCGCG TGCTTGCCAT TGCAAAACAG CATCACTACC AGCCCAGTAT TCATGCGCGA 
TCGCTGCGGG ATAATCGTAG CCATACCATC GGACTGGTCG TGCCAGAAAT CACCAACTAC 
GGCTTTGCTG ATTTTTCACA TGAGCTGGAG ACGTTGTGCC GCGAAGCTGG CGTCCAGTTG 
CTTATCTCCT GTACGGACGA AAATCCGGGG CAAGAAACCG TGGTGGTCAA CAATATGGTT 
TCCCGCCAGG TCGATGGCTT GATTGTTGCC TCGAGCATGT TGAATGACAC CGACTACCAA 
AAGCTGAGCG AACAACTGCC CATCGTGCTG TTTGACCGGC ATATGAATGA CAGTTCGTTA 
CCGCAGGTGA TTACCGACTC CATTACGCCA ACCCGTGAAC TCGTCGCCGA CATCGCTCGG 
CAGCATCCGG ATGAAATCTA TTTTCTCGGA GGGCAGCCGC GGCTTTCGCC CACGCGCGAT 
CGCTTAGAAG GATTCAAACA GGGGTTAGCG CAGGCGGGCG TCACGTTGCG TCCGGAATGG 
ATTATTCACG GGAACTATCA TCCAAGTTCC GGCTACGAGA TGTTCGCCGC GCTGTGCGCG 
CAGTTGGGGC GGCCACCGAA GGCCGTTTTC ACTGCTGCCT GTGGCTTACT CGAAGGGGTG 
TTGCGCTACA TGGGCCAGCA CAATCTGTTG CAAAGTGATA TGCGACTGGC CAGTTTTGAC 
GATCACTATC TTTATGATTC TCTGGCCATC CCGATTGATA CGATACGACA GGATAATCGC 
CAACTGGCGT GGCACTGCTT TGATTTGATT GGCAAGTTGA TTGAAGGGGA CGTTCCTGAT 
CCGCTGCAAC GCAAGCTCGA TGCAACGCTT CAACGGCGGC ATAAAACGGC AGGGTGA

Protein sequence

MRKTKRITIK DVAELAGVSK ATASLVLNGR SKELRVAEET RDRVLAIAKQ HHYQPSIHAR 
SLRDNRSHTI GLVVPEITNY GFADFSHELE TLCREAGVQL LISCTDENPG QETVVVNNMV 
SRQVDGLIVA SSMLNDTDYQ KLSEQLPIVL FDRHMNDSSL PQVITDSITP TRELVADIAR 
QHPDEIYFLG GQPRLSPTRD RLEGFKQGLA QAGVTLRPEW IIHGNYHPSS GYEMFAALCA 
QLGRPPKAVF TAACGLLEGV LRYMGQHNLL QSDMRLASFD DHYLYDSLAI PIDTIRQDNR 
QLAWHCFDLI GKLIEGDVPD PLQRKLDATL QRRHKTAG