Gene EcolC_3939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3939
Symbol
ID	6064434
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4322981
End bp	4324513
Gene Length	1533 bp
Protein Length	510 aa
Translation table	11
GC content	48%
IMG OID	641603352
Product	D-allose transporter ATP-binding protein
Protein accession	YP_001726867
Protein GI	170021913
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.650182
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCACGC CATATATATC GATGGCGGGG ATCGGCAAGT CCTTTGGTCC GGTTCACGCA 
TTAAAGTCGG TTAATTTAAC GGTTTATCCT GGTGAAATAC ATGCATTACT AGGAGAAAAT 
GGCGCGGGTA AATCCACGCT AATGAAAGTT TTATCCGGAA TACATGAGCC GACCAAAGGC 
ACCATTACCA TTAATAACAT TAGCTATAAC AAGCTGGATC ATAAATTAGC GGCACAACTC 
GGTATCGGGA TTATTTATCA GGAACTCAGC GTTATTGATG AATTAACCGT ACTGGAAAAT 
TTATATATTG GTCGTCATCT GACGAAAAAA ATCTGTGGCG TCAATATTAT CGACTGGCGA 
GAAATGCGTG TCCGCGCCGC CATGATGTTA TTACGCGTGG GCTTGAAAGT TGATCTAGAT 
GAGAAAGTGG CGAATTTATC TATCAGCCAC AAGCAGATGC TAGAAATTGC CAAAACGCTG 
ATGCTCGATG CCAAAGTCAT CATCATGGAT GAACCCACCT CCTCACTCAC CAATAAAGAG 
GTGGACTATC TGTTTCTGAT CATGAATCAG TTGCGTAAAG AGGGTACGGC CATCGTCTAT 
ATCTCGCATA AGTTGGCGGA AATTCGCCGT ATTTGCGACC GCTATACGGT GATGAAAGAC 
GGCAGCAGCG TTTGCAGCGG CATAGTAAGC GATGTGTCAA ATGACGATAT CGTCCGTCTG 
ATGGTAGGCC GCGAACTGCA AAACCGTTTT AACGCGATGA AGGAGAATGT CAGCAACCTT 
GCGCACGAAA CGGTTTTTGA GGTGCGGAAC GTCACCAGTC GTGACAGAAA AAAGGTCCGG 
GATATCTCAT TTAGCGTCTG CCGGGGAGAA ATATTAGGCT TTGCCGGACT GGTCGGTTCC 
GGACGTACTG AACTGATGAA TTGTCTGTTT GGCGTGGATA AACGCGCTGG CGGAGAAATC 
CGTCTTAATG GCAAAGATAT CTCTCCACGT TCACCCCTGG ATGCCGTGAA AAAAGGGATG 
GCTTACATCA CTGAAAGCCG CCGGGATAAC GGTTTTTTCC CCAACTTTTC CATCGCTCAG 
AACATGGCGA TCAGCCGCAG TCTGAAAGAC GGCGGCTATA AAGGCGCGAT GGGCTTGTTT 
CATGAAGTTG ACGAGCAACG TACCGCTGAA AATCAACGCG AACTGCTGGC GCTGAAATGT 
CATTCGGTAA ACCAGAATAT CACCGAACTC TCCGGGGGAA ATCAGCAGAA AGTCCTGATC 
TCCAAATGGC TGTGCTGTTG CCCGGAAGTG ATTATTTTCG ATGAACCTAC CCGCGGCATC 
GACGTTGGCG CGAAAGCCGA AATTTACAAA GTGATGCGCC AACTGGCGGA CGACGGAAAA 
GTCATCCTGA TGGTGTCATC TGAACTACCT GAAATTATCA CCGTCTGCGA CCGCATCGCC 
GTGTTCTGCG AAGGACGACT GACGCAAATC CTGACGAATC GCGATGACAT GAGCGAAGAG 
GAGATTATGG CATGGGCTTT ACCACAAGAG TAA

Protein sequence

MATPYISMAG IGKSFGPVHA LKSVNLTVYP GEIHALLGEN GAGKSTLMKV LSGIHEPTKG 
TITINNISYN KLDHKLAAQL GIGIIYQELS VIDELTVLEN LYIGRHLTKK ICGVNIIDWR 
EMRVRAAMML LRVGLKVDLD EKVANLSISH KQMLEIAKTL MLDAKVIIMD EPTSSLTNKE 
VDYLFLIMNQ LRKEGTAIVY ISHKLAEIRR ICDRYTVMKD GSSVCSGIVS DVSNDDIVRL 
MVGRELQNRF NAMKENVSNL AHETVFEVRN VTSRDRKKVR DISFSVCRGE ILGFAGLVGS 
GRTELMNCLF GVDKRAGGEI RLNGKDISPR SPLDAVKKGM AYITESRRDN GFFPNFSIAQ 
NMAISRSLKD GGYKGAMGLF HEVDEQRTAE NQRELLALKC HSVNQNITEL SGGNQQKVLI 
SKWLCCCPEV IIFDEPTRGI DVGAKAEIYK VMRQLADDGK VILMVSSELP EIITVCDRIA 
VFCEGRLTQI LTNRDDMSEE EIMAWALPQE