Gene Ent638_3292 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_3292
Symbol
ID	5112121
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	+
Start bp	3595798
End bp	3597084
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	53%
IMG OID	640493499
Product	extracellular solute-binding protein
Protein accession	YP_001178007
Protein GI	146312933
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.309737
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAG TGCTTTTAAG CGCAGCAATC TCCGCTACCC TGGGCCTTAC CGCGCTGCCA 
TCCATGGCGC AAGATGTTGA TTTACGTATG TCCTGGTGGG GCGGCAATGG CCGCCATCAG 
GTGACGCTGA AAGCGTTAGA AGAGTTCCAT AAACAGAACC CTGACATCAA CGTCAAAGCA 
GAATACACCG GTTGGGACGG TCACTTGTCT CGTCTGACCA CGCAAATCGC GGGCGGCACT 
GAGCCAGACG TGATGCAGAC CAACTGGAAC TGGCTGCCAA TTTTCTCGAA AAATGGCGAC 
GGTTTCTACG ATCTGAACAA AATGAAAGAC GTGATCGACT TATCTCAGTT TGATCCGAAA 
GAGCTGCAGT CCACCACGGT TAACGGCAAG CTAAACGGGA TCCCAATCTC CGTAACGGCG 
CGTGTGTTCT ACTTCAACGA TGAAGTGTGG AAAAAAGCGG GCGTCGAGTA CCCGAAAACC 
TGGGATGAGC TGAAAGCTGC CGGTAAGGCC TTCGAAAGCA AGCTGGGCAA ACAGTACTAT 
CCGGTGGTGC TGGAGCACCA GGATACGCTG GCGCTGCTGA ACTCCTACAT GATTCAGAAG 
TACAACGTCC CTGCGGTTGA CGAGAAAGCG AAAAAACTCG CCTGGAGCAA AGAGCAGTGG 
GTTGAGGTCT TCCAGACCTA TAAATCCCTG GTTGATAGCC ACGTGATGCC GGACACCAAG 
TACTACGCGT CGTTTGGTAA GAGCAACATG TACGAGATGA AGCCGTGGAT CGAGGGTGAA 
TGGGGCGGTA CCTACATGTG GAACTCCACC ATCAAAAAAT ATTCCGATAA CCTGAAGCCA 
CCAGCAAAAC TGGAGCTGGG TAACTACCCA ATGCTGCCAG GTGCAACCGA TGCGGGCCTG 
TTCTTCAAAC CAGCACAGAT GCTCTCTATC GGTAAAACCA CCAAAAACCC AGAAGCCGCT 
GCAAAAGTGA TTAACTTCCT GCTGAACAGC AAAGAAGGCG TGCAGACTCT GGGCCTGGAG 
CGCGGCGTAC CATTGAGCAA AGTCGCGGTT CAGTACCTGA CCGAAGATGG CACCATCAAA 
GAGAGCGATC CGTCTGTTGC GGGTCTGCGC ATGGCGCAGT CTCTGCCAGC CAAACTCTCC 
GTGTCACCAT ACTTTGACGA TCCACAGATC GTGGCGCAGT TTGGTACCTC TCTGCAGTAC 
ATCGACTACG GCCAGAAAAC CGTGGAAGAG ACCGCGACAG ACTTCCAACG TCAGGCTGAA 
CGTATCCTGA AACGCGCAAT GCGCTAA

Protein sequence

MKKVLLSAAI SATLGLTALP SMAQDVDLRM SWWGGNGRHQ VTLKALEEFH KQNPDINVKA 
EYTGWDGHLS RLTTQIAGGT EPDVMQTNWN WLPIFSKNGD GFYDLNKMKD VIDLSQFDPK 
ELQSTTVNGK LNGIPISVTA RVFYFNDEVW KKAGVEYPKT WDELKAAGKA FESKLGKQYY 
PVVLEHQDTL ALLNSYMIQK YNVPAVDEKA KKLAWSKEQW VEVFQTYKSL VDSHVMPDTK 
YYASFGKSNM YEMKPWIEGE WGGTYMWNST IKKYSDNLKP PAKLELGNYP MLPGATDAGL 
FFKPAQMLSI GKTTKNPEAA AKVINFLLNS KEGVQTLGLE RGVPLSKVAV QYLTEDGTIK 
ESDPSVAGLR MAQSLPAKLS VSPYFDDPQI VAQFGTSLQY IDYGQKTVEE TATDFQRQAE 
RILKRAMR