Gene Ent638_0037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_0037
Symbol
ID	5110640
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	40986
End bp	42311
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	56%
IMG OID	640490193
Product	PTS system lactose/cellobiose family IIC subunit
Protein accession	YP_001174778
Protein GI	146309704
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1455] Phosphotransferase system cellobiose-specific component IIC
TIGRFAM ID	[TIGR00359] phosphotransferase system, cellobiose specific, IIC component [TIGR00410] PTS system, lactose/cellobiose family IIC component

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.908472
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.420759
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTCGT TATATCAATC CATGGTTGCG GTGATTGAGC AGTCCATTAC CCCGCTGGCG 
GCCAAGCTCG GTCAGCAAAA GTACGTGATT GCGATCCGTG ACGGCTTTAC CGCCGCCCTG 
CCGTTTATGA TCATCGGCTC GTTTATGCTG GTGTTCATCT TCCCGCCGTT CTCTGCGGAC 
ACGACCAACA GTTTTGCGCG CGGCTGGCTT GATTTCTCCC AGACCTACCG CGAACAGCTG 
ATGCTGCCGT TTAACCTCAG CATGGGCGTG ATGACCTTCT TTATTTCGGT GGGCATTGGT 
GCAAGCCTGG GCCGCCAGTT TAATCTCGAT CCGGTGATGT CAGGCCTGCT GGCGTTTATG 
GCATTCCTGC TGGTCGCCGC GCCGTATGCC GACGGTAAAA TCTCCACGCA GTACATGTCC 
GGTCAGGGCA TTTTCACCGC GCTGATTACC GCTATTTACT CCACCCGCGT TTATGCGTGG 
CTGAAGGAAA ACAAAGTGAC GATCCGTCTG CCGAAAGAAG TCCCAACCGG CGTGGCGCGT 
TCCTTTGAAA TCCTGATCCC TGTGATGGTC GTTATCGGTA CGCTGCACCC GCTGAACCTG 
TTCATCGAAG CGCAGACCGG CATGATTATC CCACAGGCGA TTATGCACCT GCTGGAGCCG 
CTGGTTTCTG CATCGGATTC CCTGCCTGCC ATTCTGCTTT CCGTCCTGCT GTGCCAGATC 
TTCTGGTTCG CGGGTATCCA CGGCTCGCTG ATTGTCACCG GCATTATGAA CCCGTTCTGG 
ATGGCGAACC TGTCGGCAAA CCAGGCTGCA CTGGCGGCTG GCGCGGCGCT TCCACACGTT 
TATCTGCAAG GTTTCTGGGA TCACTACCTG CTGATTGGCG GCGTGGGCTC AACTCTGCCG 
CTGGCGTTCC TCCTGCTGCG TAGCCGTGTG GCGCACCTGC GCACTATCGG CAAAATGGGC 
GTGGTGCCAA GCTTCTTTAA CATCAACGAA CCGATTCTGT TCGGCGCACC GATCATCATG 
AACCCAATGT TGTTCCTCCC GTTCGTGTTC GTGCCGTTGA TTAACGCCTG CCTGGCGTAT 
GGCGCAACCA AACTCGGTTG GATCGCACAA GTTGTCTCTC TGACGCCATG GACTACGCCT 
GCCCCAATCG GTGCATCGTG GGCCGCCAAC TGGGCGTTTA GTCCGGTCGT GATGTGCGTT 
ATTTGTATGG TGATGTCAGC AATCATGTAT CTGCCGTTCC TGCGTGCTTA CGAGCGTTCT 
TTGATGAAAA ACGAAGAGCA AAAAGCCCAG GCGACCGTGG GTGCAGTTGA GACAGCAAGT 
CAATAA

Protein sequence

MSSLYQSMVA VIEQSITPLA AKLGQQKYVI AIRDGFTAAL PFMIIGSFML VFIFPPFSAD 
TTNSFARGWL DFSQTYREQL MLPFNLSMGV MTFFISVGIG ASLGRQFNLD PVMSGLLAFM 
AFLLVAAPYA DGKISTQYMS GQGIFTALIT AIYSTRVYAW LKENKVTIRL PKEVPTGVAR 
SFEILIPVMV VIGTLHPLNL FIEAQTGMII PQAIMHLLEP LVSASDSLPA ILLSVLLCQI 
FWFAGIHGSL IVTGIMNPFW MANLSANQAA LAAGAALPHV YLQGFWDHYL LIGGVGSTLP 
LAFLLLRSRV AHLRTIGKMG VVPSFFNINE PILFGAPIIM NPMLFLPFVF VPLINACLAY 
GATKLGWIAQ VVSLTPWTTP APIGASWAAN WAFSPVVMCV ICMVMSAIMY LPFLRAYERS 
LMKNEEQKAQ ATVGAVETAS Q