Gene ECD_02565 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_02565
Symbol	ascF
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	2679491
End bp	2680948
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	57%
IMG OID
Product	fused cellobiose/arbutin/salicin-specific PTS enzymes: IIB component/IC component
Protein accession	ACT44384
Protein GI	253978714
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCAAAA ATTATGCGGC GCTGGCACGC TCGGTGATAG CGGCACTGGG CGGCGTTGAT 
AACATCTCGG CAGTCACCCA CTGTATGACG CGTTTGCGCT TTGTTATCAA AGATGATGCG 
CTTATCGACA GCCCGACGTT AAAAACCATC TCCGGCGTGC TCGGCGTGGT ACGTAGTGAC 
AACCAGTGTC AGGTGATTAT CGGCAATACC GTTTCACAAG CCTTTCAGGA AGTCGTCAGC 
CTGCTGCCGG GAGATATGCA GCCCGCCCTG CCCGTGGGTA AACCCAAACT CACGCTGCGT 
CGCATTGGTG CGGGGATCCT CGATGCGCTG ATCGGCACCA TGTCACCGCT GATCCCGGCG 
ATTATCGGCG GATCGATGGT CAAACTGCTG GCGATGATCC TCGAGATGAG CGGCGTGCTG 
ACAAAAGGAT CGCCGACCTT AACCATTCTG AATGTGATTG GTGACGGTGC TTTCTTCTTC 
CTGCCGCTGA TGGTCGCGGC ATCTGCCGCC ATCAAATTTA AAACCAATAT GTCGCTGGCG 
ATTGCCATCG CGGGTGTGCT GGTACATCCG AGTTTTATTG AACTGATGGC GAAAGCGGCC 
CAGGGTGAAC ATGTCGAATT TGCCCTGATC CCGGTCACCG CGGTGAAATA CACCTACACG 
GTGATCCCGG CGCTGGTGAT GACCTGGTGC CTGTCATATA TCGAACGCTG GGTGGACAGC 
ATTACACCGG CGGTGACCAA AAACTTCCTC AAGCCAATGC TGATTGTGTT GATTGCCGCA 
CCGCTGGCAA TCCTGCTGAT TGGCCCGATT GGTATCTGGA TCGGTAGCGC CATTTCGGCG 
CTGGTTTACA CCATTCATGG TTATCTGGGC TGGCTTTCAG TCGCCATTAT GGGCGCGCTG 
TGGCCTCTGC TGGTAATGAC CGGGATGCAC CGCGTCTTTA CGCCAACCAT CATTCAGACC 
ATTGCCGAAA CCGGCAAAGA AGGGATGGTC ATGCCGTCAG AGATCGGCGC TAACCTGTCG 
CTGGGCGGTT CATCACTGGC GGTGGCGTGG AAAACGAAAA ACCCGGAACT GCGCCAGACG 
GCGCTGGCTG CGGCGGCATC AGCCATTATG GCGGGGATTT CCGAACCGGC GTTATACGGC 
GTGGCGATCC GCCTGAAACG TCCGCTTATC GCCAGTCTTA TCAGCGGCTT TATTTGCGGC 
GCGGTTGCCG GTATGGCGGG GCTTGCCAGC CACTCAATGG CAGCGCCGGG GCTATTTACC 
AGCGTGCAAT TCTTCGATCC GGCGAATCCA ATGAGCATCG TCTGGGTGTT CGCGGTCATG 
GCGCTGGCGG TGGTGCTGTC GTTTATCCTC ACACTATTGC TCGGCTTTGA GGATATTCCT 
GTTGAGGAAG CGGCTGCCGA GGCGCGAAAG CATCAGAGCG TACAACCGAC CGTCGCCAAA 
GAAGTAAGTC TTAATTGA

Protein sequence

MAKNYAALAR SVIAALGGVD NISAVTHCMT RLRFVIKDDA LIDSPTLKTI SGVLGVVRSD 
NQCQVIIGNT VSQAFQEVVS LLPGDMQPAL PVGKPKLTLR RIGAGILDAL IGTMSPLIPA 
IIGGSMVKLL AMILEMSGVL TKGSPTLTIL NVIGDGAFFF LPLMVAASAA IKFKTNMSLA 
IAIAGVLVHP SFIELMAKAA QGEHVEFALI PVTAVKYTYT VIPALVMTWC LSYIERWVDS 
ITPAVTKNFL KPMLIVLIAA PLAILLIGPI GIWIGSAISA LVYTIHGYLG WLSVAIMGAL 
WPLLVMTGMH RVFTPTIIQT IAETGKEGMV MPSEIGANLS LGGSSLAVAW KTKNPELRQT 
ALAAAASAIM AGISEPALYG VAIRLKRPLI ASLISGFICG AVAGMAGLAS HSMAAPGLFT 
SVQFFDPANP MSIVWVFAVM ALAVVLSFIL TLLLGFEDIP VEEAAAEARK HQSVQPTVAK 
EVSLN