Gene B21_02954 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02954
Symbol	agaS
ID	8115350
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	3149681
End bp	3150835
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	57%
IMG OID	644849139
Product	hypothetical protein
Protein accession	YP_003000712
Protein GI	251786408
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2222] Predicted phosphosugar isomerases
TIGRFAM ID	[TIGR02815] putative sugar isomerase, AgaS family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAGAAA ATTACACCCC TGCTGCCGCC GCAACCGGTA CATGGACTGA AGAAGAGATC 
CGCCATCAGC CTCGCGCATG GATCCGTTCA CTCACCAACA TCGACGCGCT ACGTTCCGCG 
CTCAATAACT TCCTTGAACC GTTACTGCGC AAAGAGAATC TGCGGATCAT CCTGACCGGA 
GCCGGAACGT CGGCATTTAT CGGTGACATC ATCGCGCCGT GGCTCGCCAG CCATACCGGT 
AAAAACTTCA GCGCCGTACC GACCACCGAT CTGGTCACCA ATCCGATGGA CTACCTGAAC 
CCAGCCCATC CGCTGCTGTT GATCTCCTTC GGTCGATCCG GCAACAGCCC GGAAAGCGTC 
GCTGCCGTGG AACTGGCAAA TCAATTTGTA CCAGAATGCT ATCACCTGCC GATCACCTGC 
AACGAAGCGG GCGCTCTTTA CCAAAACGCG ATCAACAGCG ATAACGCGTT TGCCCTGCTG 
ATGCCCGCAG AAACGCACGA TCGCGGCTTT GCGATGACCA GCAGCATTAC CACCATGATG 
GCCAGCTGCC TCGCGGTTTT CGCACCTGAG ACGATCAACA GCCAAACCTT CCGCGACGTG 
GCGGATCGTT GCCAGGCGAT CCTGACCTCA CTGGGCGATT TCAGCGAAGG TGTGTTTGGT 
TACGCACCGT GGAAACGGAT CGTTTATCTC GGCAGCGGTG GCTTACAGGG CGCAGCACGC 
GAGTCGGCGC TGAAAGTGCT GGAACTGACT GCGGGTAAAC TGGCGGCCTT CTATGATTCC 
CCGACCGGAT TCCGTCATGG CCCGAAATCA CTGGTCGATA ACGAAACGCT GGTGGTGGTA 
TTTGTCTCAA GCCACCCTTA CACCCGTCAG TATGATCTTG ATCTGCTGGC TGAACTCCGC 
CGTGACAACC AGGCAATGCG CGTAATCGCC ATCGCCGCGG AAAGCACCGA CATCGTCGCT 
GCCGGTCCAC ATATTATCCT GCCGCCGTCA CGTCACTTTA TCGACGTTGA GCAGGCATTT 
TGCTTCCTGA TGTACGCCCA GACGTTTGCA CTGATGCAGT CGCTGCACAT GGGCAATACG 
CCGGATACCC CATCAGCCAG CGGCACCGTT AACCGCGTGG TGCAAGGCGT AATCATTCAT 
CCGTGGCAGG CATAA

Protein sequence

MPENYTPAAA ATGTWTEEEI RHQPRAWIRS LTNIDALRSA LNNFLEPLLR KENLRIILTG 
AGTSAFIGDI IAPWLASHTG KNFSAVPTTD LVTNPMDYLN PAHPLLLISF GRSGNSPESV 
AAVELANQFV PECYHLPITC NEAGALYQNA INSDNAFALL MPAETHDRGF AMTSSITTMM 
ASCLAVFAPE TINSQTFRDV ADRCQAILTS LGDFSEGVFG YAPWKRIVYL GSGGLQGAAR 
ESALKVLELT AGKLAAFYDS PTGFRHGPKS LVDNETLVVV FVSSHPYTRQ YDLDLLAELR 
RDNQAMRVIA IAAESTDIVA AGPHIILPPS RHFIDVEQAF CFLMYAQTFA LMQSLHMGNT 
PDTPSASGTV NRVVQGVIIH PWQA