Gene ECD_03959 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_03959
Symbol	alsA
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	4216635
End bp	4218167
Gene Length	1533 bp
Protein Length	510 aa
Translation table	11
GC content	48%
IMG OID
Product	fused D-allose transporter subunits of ABC superfamily: ATP-binding components
Protein accession	ACT45749
Protein GI	253980079
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCACGC CATATATATC GATGGCGGGG ATCGGCAAGT CCTTTGGTCC GGTTCACGCA 
TTAAAGTCGG TTAATTTAAC GGTTTATCCT GGTGAAATAC ATGCATTACT AGGAGAAAAT 
GGCGCGGGTA AATCCACGCT AATGAAAGTT TTATCCGGAA TACATGAGCC GACCAAAGGC 
ACCATTACCA TTAATAACAT TAGCTATAAC AAGCTGGATC ATAAATTAGC GGCACAACTC 
GGTATCGGGA TTATTTATCA GGAACTCAGC GTTATTGATG AATTAACCGT ACTGGAAAAT 
TTATATATTG GTCGTCATCT GACGAAAAAA ATCTGTGGCG TCAATATTAT CGACTGGCGA 
GAAATGCGTG TCCGCGCCGC CATGATGTTA TTACGCGTGG GCTTGAAAGT TGATCTAGAT 
GAGAAAGTGG CGAATTTATC TATCAGCCAC AAGCAGATGC TAGAAATTGC CAAAACGCTG 
ATGCTCGATG CCAAAGTCAT CATCATGGAT GAACCCACCT CCTCACTCAC CAATAAAGAG 
GTGGACTATC TGTTTCTGAT CATGAATCAG TTGCGTAAAG AGGGTACGGC CATCGTCTAT 
ATCTCGCATA AGTTGGCGGA AATTCGCCGT ATTTGCGACC GCTATACGGT GATGAAAGAC 
GGCAGCAGCG TTTGCAGCGG CATAGTAAGC GATGTGTCAA ATGACGATAT CGTCCGTCTG 
ATGGTAGGCC GCGAACTGCA AAACCGTTTT AACGCGATGA AGGAGAATGT CAGCAACCTT 
GCGCACGAAA CGGTTTTTGA GGTGCGGAAC GTCACCAGTC GTGACAGAAA AAAGGTCCGG 
GATATCTCAT TTAGCGTCTG CCGGGGAGAA ATATTAGGCT TTGCCGGACT GGTCGGTTCC 
GGACGTACTG AACTGATGAA TTGTCTGTTT GGCGTGGATA AACGCGCTGG CGGAGAAATC 
CGTCTTAATG GCAAAGATAT CTCTCCACGT TCACCCCTGG ATGCCGTGAA AAAAGGGATG 
GCTTACATCA CTGAAAGCCG CCGGGATAAC GGTTTTTTCC CCAACTTTTC CATCGCTCAG 
AACATGGCGA TCAGCCGCAG TCTGAAAGAC GGCGGCTATA AAGGCGCGAT GGGCTTGTTT 
CATGAAGTTG ACGAGCAACG TACCGCTGAA AATCAACGCG AACTGCTGGC GCTGAAATGT 
CATTCGGTAA ACCAGAATAT CACCGAACTC TCCGGGGGAA ATCAGCAGAA AGTCCTGATC 
TCCAAATGGC TGTGCTGTTG CCCGGAAGTG ATTATTTTCG ATGAACCTAC CCGCGGCATC 
GACGTTGGCG CGAAAGCCGA AATTTACAAA GTGATGCGCC AACTGGCGGA CGACGGAAAA 
GTCATCCTGA TGGTGTCATC TGAACTACCT GAAATTATCA CCGTCTGCGA CCGCATCGCC 
GTGTTCTGCG AAGGACGACT GACGCAAATC CTGACGAATC GCGATGACAT GAGCGAAGAG 
GAGATTATGG CATGGGCTTT ACCACAAGAG TAA

Protein sequence

MATPYISMAG IGKSFGPVHA LKSVNLTVYP GEIHALLGEN GAGKSTLMKV LSGIHEPTKG 
TITINNISYN KLDHKLAAQL GIGIIYQELS VIDELTVLEN LYIGRHLTKK ICGVNIIDWR 
EMRVRAAMML LRVGLKVDLD EKVANLSISH KQMLEIAKTL MLDAKVIIMD EPTSSLTNKE 
VDYLFLIMNQ LRKEGTAIVY ISHKLAEIRR ICDRYTVMKD GSSVCSGIVS DVSNDDIVRL 
MVGRELQNRF NAMKENVSNL AHETVFEVRN VTSRDRKKVR DISFSVCRGE ILGFAGLVGS 
GRTELMNCLF GVDKRAGGEI RLNGKDISPR SPLDAVKKGM AYITESRRDN GFFPNFSIAQ 
NMAISRSLKD GGYKGAMGLF HEVDEQRTAE NQRELLALKC HSVNQNITEL SGGNQQKVLI 
SKWLCCCPEV IIFDEPTRGI DVGAKAEIYK VMRQLADDGK VILMVSSELP EIITVCDRIA 
VFCEGRLTQI LTNRDDMSEE EIMAWALPQE