Gene B21_03918 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03918
Symbol	alsC
ID	8115379
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	4213766
End bp	4214746
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	52%
IMG OID	644850071
Product	hypothetical protein
Protein accession	YP_003001644
Protein GI	251787340
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCTTTA CCACAAGAGT AAAAAGCGAA GCGAGCGAGA AGAAACCGTT CAACTTTGCG 
CTGTTCTGGG ATAAATACGG CACCTTTTTT ATCCTGGCGA TCATCGTCGC CATCTTTGGT 
TCGCTGTCAC CAGAATATTT TCTGACCACC AATAATATTA CCCAGATTTT TGTTCAAAGC 
TCCGTGACGG TATTGATCGG CATGGGCGAG TTTTTCGCTA TCCTGGTCGC TGGTATCGAC 
CTCTCGGTTG GCGCGATTCT GGCGCTTTCC GGTATGGTGA CCGCCAAACT GATGTTGGCA 
GGTGTTGACC CGTTTCTCGC AGCGATGATT GGCGGTGTAC TGGTTGGCGG CGCACTGGGG 
GCGATCAACG GCTGCCTGGT CAACTGGACG GGGCTACACC CGTTCATCAT CACCCTTGGC 
ACCAACGCGA TTTTCCGTGG GATCACGCTG GTGATCTCCG ATGCCAACTC GGTATACGGC 
TTCTCATTTG ACTTCGTGAA CTTCTTTGCC GCCAGCGTAA TTGGGATACC TGTCCCCGTT 
ATCTTCTCAC TAATTGTCGC GCTCATCCTT TGGTTTCTGA CAACGCGTAT GCGGCTCGGG 
CGCAACATCT ACGCACTGGG CGGCAACAAA AATTCGGCGT TCTATTCCGG GATTGACGTG 
AAATTCCACA TCCTGGTGGT GTTTATCATC TCCGGTGTTT GTGCAGGTCT GGCAGGCGTC 
GTCTCAACTG CACGACTCGG TGCCGCAGAA CCGCTTGCCG GTATGGGTTT TGAAACCTAT 
GCCATTGCCA GCGCCATCAT TGGCGGCACC AGTTTCTTCG GCGGCAAGGG GCGCATTTTC 
TCTGTGGTGA TTGGCGGGTT GATCATCGGC ACCATCAACA ACGGTCTGAA TATTTTGCAG 
GTACAAACCT ATTACCAACT GGTGGTGATG GGCGGATTAA TTATCGCGGC TGTCGCCCTT 
GACCGTCTTA TCAGTAAGTA A

Protein sequence

MGFTTRVKSE ASEKKPFNFA LFWDKYGTFF ILAIIVAIFG SLSPEYFLTT NNITQIFVQS 
SVTVLIGMGE FFAILVAGID LSVGAILALS GMVTAKLMLA GVDPFLAAMI GGVLVGGALG 
AINGCLVNWT GLHPFIITLG TNAIFRGITL VISDANSVYG FSFDFVNFFA ASVIGIPVPV 
IFSLIVALIL WFLTTRMRLG RNIYALGGNK NSAFYSGIDV KFHILVVFII SGVCAGLAGV 
VSTARLGAAE PLAGMGFETY AIASAIIGGT SFFGGKGRIF SVVIGGLIIG TINNGLNILQ 
VQTYYQLVVM GGLIIAAVAL DRLISK