Gene Ent638_2981 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_2981
Symbol
ID	5112517
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	+
Start bp	3237050
End bp	3238369
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	54%
IMG OID	640493175
Product	PTS system lactose/cellobiose family IIC subunit
Protein accession	YP_001177696
Protein GI	146312622
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1455] Phosphotransferase system cellobiose-specific component IIC
TIGRFAM ID	[TIGR00359] phosphotransferase system, cellobiose specific, IIC component [TIGR00410] PTS system, lactose/cellobiose family IIC component

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.299528
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.716838
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAATG TTCTGGGATT TCTCGAAGCA AAACTGATGC CGCTGGCGGC TAAAACGGCT 
CAACAACGTC ATCTGGGCGC TATTCGTGGC GCCTATGTTT CTTTCATGCC GTTTATTATT 
GTCGGCTCAA TCCTGCTGGT TATCTCTTCT TTCCCCAATC AGACTTACCA GCAGTTTATG 
TCTCAGGCTT TTGGTGCGAG CTGGAGCGCC ATTATCGAGA TCCCGTTCAA CGCGGTGTTC 
TCCACGATGT CGCTGTTTAT CAGCTTCCTC GTCGCGTACC GTCTGGCGGA ACACTACAAT 
GAAGATCGCG TGTCGTGCGG CATCCTTGCG CTGGTGAGTT TCCTGATCCT CACGCCGTTT 
ATCAAAGTGG CCGAGAACGG CGGCATCACG GTCATCCCCG TGGAATGGAT CGGCAGCAAA 
GGGCTTTTCG TAGCGATGAT TGGCTCGCTG CTGTGGACCG AATTGTTCTG CTGGCTGAAG 
CGCAAAAATC TGGTGATCAA AATGCCAGAA GGCGTACCGC CTGCGGTACA GGAATCGTTC 
GCCGCGCTCA TCCCCGCGCT GGTGGTCATG ATTCTGGTAC TGATGATTCG CATCGCGTTT 
GAAAACACCC ACTACAACAC CATTCACCAG TTCATCTACG AAGTGGTCGC CACGCCAGTG 
CGACATTACG GGACATCCTA CTTTGGCGCG CTGATGACGG TATTCAGCAT CACCATTTTG 
TGGTCAGTGG GCATTAACTC CGGCTCGATG GTTAACGGCA TTATTCGTCC GCTATGGATG 
GAAAATCAGA CCGACAATAT CGCTGCCATT CAGGCTGGCG TGACCCCGCC GCACATTATC 
ACCGAACAGT TTTTTGACAT GATCTGGATG GGTGGCGCAG GTGCAACGCT GTCGTTGGTC 
ATTGCGATGC TGATTTTTGC TCGCAGTAAA AACATGCGTG AAGTGGCACG ACTCGGCGCG 
GGGGCGTCGG TGTTTAACAT CAACGAGCCG ATTCTGTTTG GTCTGCCGGT CATCATGAAT 
CCGATCATGC TCATCCCGTT CAACCTGGTG CCGCTGGTGC TCGTCACCGT GCAGTATGCC 
GCGATGAAAC TCGGCGCGGT GGCGGTGACG ACGGGCGTTT TCATCCCCTG GACGCTACCA 
CCGGTCATCA GCGGATTTAT CGTTACCGGA CACATTAGCG GCAGCGTGAT GCAGCTTCTC 
AATTTGCTGA TCGGCGCGAT GCTCTACCTG CCGTTTATGC GCATCCTGGA CAAACAATAC 
CGCGCCGCGG AGCTTGCAAC CGCGATGCCA ACTGAAACCA CGCTGGCCAA ACAGGAGTAA

Protein sequence

MNNVLGFLEA KLMPLAAKTA QQRHLGAIRG AYVSFMPFII VGSILLVISS FPNQTYQQFM 
SQAFGASWSA IIEIPFNAVF STMSLFISFL VAYRLAEHYN EDRVSCGILA LVSFLILTPF 
IKVAENGGIT VIPVEWIGSK GLFVAMIGSL LWTELFCWLK RKNLVIKMPE GVPPAVQESF 
AALIPALVVM ILVLMIRIAF ENTHYNTIHQ FIYEVVATPV RHYGTSYFGA LMTVFSITIL 
WSVGINSGSM VNGIIRPLWM ENQTDNIAAI QAGVTPPHII TEQFFDMIWM GGAGATLSLV 
IAMLIFARSK NMREVARLGA GASVFNINEP ILFGLPVIMN PIMLIPFNLV PLVLVTVQYA 
AMKLGAVAVT TGVFIPWTLP PVISGFIVTG HISGSVMQLL NLLIGAMLYL PFMRILDKQY 
RAAELATAMP TETTLAKQE