Gene Ent638_3933 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_3933
Symbol
ID	5111585
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	+
Start bp	4251669
End bp	4253231
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	50%
IMG OID	640494142
Product	putative cytoplasmic protein
Protein accession	YP_001178639
Protein GI	146313565
COG category
COG ID
TIGRFAM ID	[TIGR03369] cellulose biosynthesis protein BcsE

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.147057
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.327931
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACCCCA TATTTTCAGT TGGTATCCAG TCATTGTGGG ATGAATTGCG CCACATGCCA 
GCCGGCGGAG TCTGGTGGAT TAGCACGGAT CGCAATGACG ATGCTATAAG TCTGGTGAAT 
CAAACAATTG CAGCACAAGA TAAGGGCGCA AAAGTCGCCG TTGTCACTAT GGGTGAAGAC 
CCTAAAAAAA TCATCAGACT CAATGAAACG CGCGGTCCCG ATAAAGTGCG TTTGTTTTCC 
ATGCCCCATG AAGAAGATGG TCTATACTTT TTGCCCCGCG ATATTCAATG CAGTATTGAC 
CCTGAACATT ATTTAGTGAT CCTCAAATGC ACAAATAATT TTTGGCAAAA TATATCTTCA 
GAAAAATTGC GTCTGTGGCT GGAAAAGATC AATAAATGGG TGCGGGTTCA AAATTGTACG 
CTGCTGGTAA TCAGCCCAGG CAGTAATAAT GATAAGCAGT TCTCATTTTT AATGAGTGAA 
TATCGATCCC TTTTTGGTCT TGCCAGCCTC CGCCATCAGG CTGACAGCCA TCTTTACGAT 
ATTGCTTTCT GGTGTAATGA AAAAGGCGTA AGCGCGCGGC AACAACTCAC CCTTATGCAT 
AATAATGGCG AGTGGCATGT TGCGCGGCAA GAAGAAACGG TCGTTCAGCC GCGTAATGAT 
GAAAAACGTA TTTTGAGTCA CATTGCGGTA TTAGAAGGTG CGCCTGCGCT TTCTGAATAT 
TGGTCGCTGT TTGAAACCAA CGAAGGTTTG TTTAACGAGG CCCGCACGAC TCAGGCCGCC 
ACGATTGTTT TTTCGCTCAC TCAGAATAAT CAAATTGAGG CGATTGCGCG GCAGATCCAT 
ACCTTGCGCC GTCAGCGCGG AAGCGCGTTG AAAATCGTCG TGCGTGAGAA TACCACCAGC 
CTGCGCGCCA CCGATGAGCG TCTGCTCCTG GGCTGTGGGG CAAACATGGT GATTCCATGG 
AACGCGCCGC TTTCGCGCTG CTTAACGTTG ATCGAAAGCA TTCAGGGCCA GCAGTTTAAT 
CGCTACGTCC CGGAGGATAT TTCGACGCTG CTTTCCATGA CCCAGCCGAT GAAACTGCGC 
GGCTATCAGA AGTGGGACAC CTTCTGCGAA GCGGTCAGCA ATATGATGAG CAACACGCTG 
TTGCCAGAAA ATGGTAAAGG CGTGATGGTC GCGCTGCGCC CGGTTCCGGG CATTCGTATT 
GAACAGGCGC TGACGCTGTG CCGTCCAAAC CGTACCGGCG ATATCATGAC CATTGGCGAT 
AATCGTCTGG TGCTGTTTTT ATCCTTCTGT CGGGTTAACG ACCTGGATAC CGCGCTGAAC 
CACATATTCC CGCTGCCGAC CGGCGATATC TTCTCTAACC GCATGATTTG GTTTGAAGAC 
AACTTGATCA GCGCCGAAAT CGTACAGATG CAAACGCTGG AACCTGAGCA GTGGGGCAAA 
CCGCTGCTGA TGGCGAGCGA TGCGAAACCC GTTCTGAATG CTACGCATGA CGGGCACGCC 
TGGCGCCGTA CCCCTGAGCC GCTTCGTTTA CTGAACGATG CGGAAGAGAG AGCTTCATCA 
TGA

Protein sequence

MNPIFSVGIQ SLWDELRHMP AGGVWWISTD RNDDAISLVN QTIAAQDKGA KVAVVTMGED 
PKKIIRLNET RGPDKVRLFS MPHEEDGLYF LPRDIQCSID PEHYLVILKC TNNFWQNISS 
EKLRLWLEKI NKWVRVQNCT LLVISPGSNN DKQFSFLMSE YRSLFGLASL RHQADSHLYD 
IAFWCNEKGV SARQQLTLMH NNGEWHVARQ EETVVQPRND EKRILSHIAV LEGAPALSEY 
WSLFETNEGL FNEARTTQAA TIVFSLTQNN QIEAIARQIH TLRRQRGSAL KIVVRENTTS 
LRATDERLLL GCGANMVIPW NAPLSRCLTL IESIQGQQFN RYVPEDISTL LSMTQPMKLR 
GYQKWDTFCE AVSNMMSNTL LPENGKGVMV ALRPVPGIRI EQALTLCRPN RTGDIMTIGD 
NRLVLFLSFC RVNDLDTALN HIFPLPTGDI FSNRMIWFED NLISAEIVQM QTLEPEQWGK 
PLLMASDAKP VLNATHDGHA WRRTPEPLRL LNDAEERASS