Gene B21_01383 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_01383
Symbol	gapC
ID	8115365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	1442406
End bp	1443407
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	48%
IMG OID	644847626
Product	hypothetical protein
Protein accession	YP_002999199
Protein GI	251784895
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAAG TTGGTATTAA CGGTTTTGGT CGTATCGGTC GACTGGTGTT GCGTCGATTA 
CTTGAAGTCA AAAGCAACAT AGACGTTGTC GCTATTAATG ATCTCACTTC CCCAAAAATT 
CTCGCCTACC TGCTGAAACA TGATTCAAAC TACGGACCAT TCCCCTGGAG CGTTGATTTT 
ACGGAAGATT CACTTATCGT TGATGGGAAA AGTATCGCGG TTTACGCCGA AAAAGAGGCT 
AAAAATATTC CGTGGAAAGC GAAAGGTGCA GAAATCATTG TCGAATGTAC TGGCTTTTAT 
ACCTCCGCCG AGAAATCGCA GGCGCATCTT GATGCTGGTG CGAAGAAGGT GTTGATTTCC 
GCCCCTGCCG GTGAAATGAA AACTATCGTT TATAACGTCA ATGACGACAC TCTGGATGGC 
AACGACACCA TTGTTTCCGT GGCGTCATGC ACCACTAACT GTCTTGCGCC GATGGCCAAA 
GCCTTGCATG ACAGTTTCGG GATAGAAGTC GGCACGATGA CGACCATTCA TGCCTATACT 
GGCACCCAGT CACTGGTGGA TGGCCCACGT GGTAAAGATT TACGTGCTTC ACGCGCAGCG 
GCAGAAAATA TCATTCCCCA CACTACGGGG GCGGCAAAAG CCATTGGTCT GGTGATCCCG 
GAACTGAGCG GCAAACTGAA AGGTCATGCG CAACGCGTGC CGGTGAAAAC AGGTTCGGTC 
ACTGAGCTGG TGTCCATTCT CGGAAAAAAA GTGACTGCCG AAGAGGTGAA TAACGCACTT 
AAACAAGCAA CCACCAATAA CGAGTCATTT GGTTATACCG ATGAAGAAAT AGTCTCTTCC 
GATATCATTG GCAGCCATTT CGGTTCGGTG TTTGATGCCA CGCAAACGGA AATTACCGCT 
GTGGGCGATT TACAACTGGT GAAAACGGTC GCCTGGTACG ATAACGAATA TGGCTTCGTC 
ACGCAGCTTA TTCGCACCCT CGAAAAATTC GCTAAACTCT GA

Protein sequence

MSKVGINGFG RIGRLVLRRL LEVKSNIDVV AINDLTSPKI LAYLLKHDSN YGPFPWSVDF 
TEDSLIVDGK SIAVYAEKEA KNIPWKAKGA EIIVECTGFY TSAEKSQAHL DAGAKKVLIS 
APAGEMKTIV YNVNDDTLDG NDTIVSVASC TTNCLAPMAK ALHDSFGIEV GTMTTIHAYT 
GTQSLVDGPR GKDLRASRAA AENIIPHTTG AAKAIGLVIP ELSGKLKGHA QRVPVKTGSV 
TELVSILGKK VTAEEVNNAL KQATTNNESF GYTDEEIVSS DIIGSHFGSV FDATQTEITA 
VGDLQLVKTV AWYDNEYGFV TQLIRTLEKF AKL