Gene B21_03919 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03919
Symbol	alsA
ID	8115378
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	4214725
End bp	4216257
Gene Length	1533 bp
Protein Length	510 aa
Translation table	11
GC content	48%
IMG OID	644850072
Product	hypothetical protein
Protein accession	YP_003001645
Protein GI	251787341
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCACGC CATATATATC GATGGCGGGG ATCGGCAAGT CCTTTGGTCC GGTTCACGCA 
TTAAAGTCGG TTAATTTAAC GGTTTATCCT GGTGAAATAC ATGCATTACT AGGAGAAAAT 
GGCGCGGGTA AATCCACGCT AATGAAAGTT TTATCCGGAA TACATGAGCC GACCAAAGGC 
ACCATTACCA TTAATAACAT TAGCTATAAC AAGCTGGATC ATAAATTAGC GGCACAACTC 
GGTATCGGGA TTATTTATCA GGAACTCAGC GTTATTGATG AATTAACCGT ACTGGAAAAT 
TTATATATTG GTCGTCATCT GACGAAAAAA ATCTGTGGCG TCAATATTAT CGACTGGCGA 
GAAATGCGTG TCCGCGCCGC CATGATGTTA TTACGCGTGG GCTTGAAAGT TGATCTAGAT 
GAGAAAGTGG CGAATTTATC TATCAGCCAC AAGCAGATGC TAGAAATTGC CAAAACGCTG 
ATGCTCGATG CCAAAGTCAT CATCATGGAT GAACCCACCT CCTCACTCAC CAATAAAGAG 
GTGGACTATC TGTTTCTGAT CATGAATCAG TTGCGTAAAG AGGGTACGGC CATCGTCTAT 
ATCTCGCATA AGTTGGCGGA AATTCGCCGT ATTTGCGACC GCTATACGGT GATGAAAGAC 
GGCAGCAGCG TTTGCAGCGG CATAGTAAGC GATGTGTCAA ATGACGATAT CGTCCGTCTG 
ATGGTAGGCC GCGAACTGCA AAACCGTTTT AACGCGATGA AGGAGAATGT CAGCAACCTT 
GCGCACGAAA CGGTTTTTGA GGTGCGGAAC GTCACCAGTC GTGACAGAAA AAAGGTCCGG 
GATATCTCAT TTAGCGTCTG CCGGGGAGAA ATATTAGGCT TTGCCGGACT GGTCGGTTCC 
GGACGTACTG AACTGATGAA TTGTCTGTTT GGCGTGGATA AACGCGCTGG CGGAGAAATC 
CGTCTTAATG GCAAAGATAT CTCTCCACGT TCACCCCTGG ATGCCGTGAA AAAAGGGATG 
GCTTACATCA CTGAAAGCCG CCGGGATAAC GGTTTTTTCC CCAACTTTTC CATCGCTCAG 
AACATGGCGA TCAGCCGCAG TCTGAAAGAC GGCGGCTATA AAGGCGCGAT GGGCTTGTTT 
CATGAAGTTG ACGAGCAACG TACCGCTGAA AATCAACGCG AACTGCTGGC GCTGAAATGT 
CATTCGGTAA ACCAGAATAT CACCGAACTC TCCGGGGGAA ATCAGCAGAA AGTCCTGATC 
TCCAAATGGC TGTGCTGTTG CCCGGAAGTG ATTATTTTCG ATGAACCTAC CCGCGGCATC 
GACGTTGGCG CGAAAGCCGA AATTTACAAA GTGATGCGCC AACTGGCGGA CGACGGAAAA 
GTCATCCTGA TGGTGTCATC TGAACTACCT GAAATTATCA CCGTCTGCGA CCGCATCGCC 
GTGTTCTGCG AAGGACGACT GACGCAAATC CTGACGAATC GCGATGACAT GAGCGAAGAG 
GAGATTATGG CATGGGCTTT ACCACAAGAG TAA

Protein sequence

MATPYISMAG IGKSFGPVHA LKSVNLTVYP GEIHALLGEN GAGKSTLMKV LSGIHEPTKG 
TITINNISYN KLDHKLAAQL GIGIIYQELS VIDELTVLEN LYIGRHLTKK ICGVNIIDWR 
EMRVRAAMML LRVGLKVDLD EKVANLSISH KQMLEIAKTL MLDAKVIIMD EPTSSLTNKE 
VDYLFLIMNQ LRKEGTAIVY ISHKLAEIRR ICDRYTVMKD GSSVCSGIVS DVSNDDIVRL 
MVGRELQNRF NAMKENVSNL AHETVFEVRN VTSRDRKKVR DISFSVCRGE ILGFAGLVGS 
GRTELMNCLF GVDKRAGGEI RLNGKDISPR SPLDAVKKGM AYITESRRDN GFFPNFSIAQ 
NMAISRSLKD GGYKGAMGLF HEVDEQRTAE NQRELLALKC HSVNQNITEL SGGNQQKVLI 
SKWLCCCPEV IIFDEPTRGI DVGAKAEIYK VMRQLADDGK VILMVSSELP EIITVCDRIA 
VFCEGRLTQI LTNRDDMSEE EIMAWALPQE