Gene B21_02579 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02579
Symbol	ygcS
ID	8113975
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	2727904
End bp	2729241
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	53%
IMG OID	644848777
Product	hypothetical protein
Protein accession	YP_003000350
Protein GI	251786046
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACACTT CACCGGTGCG AATGGATGAT TTACCGCTTA ACCGTTTTCA CTGCCGCATT 
GCTGCGCTCA CTTTCGGCGC ACACCTGACC GACGGTTATG TTCTCGGCGT CATTGGTTAC 
GCCATTATTC AGCTTACGCC CGCCATGCAA CTGACGCCGT TTATGGCGGG AATGATCGGC 
GGCTCGGCGC TCCTTGGTTT GTTCCTTGGC AGCCTGGTTC TTGGGTGGAT CTCCGACCAT 
ATTGGTCGGC AAAAAATCTT CACCTTCAGC TTTTTGCTGA TTACGCTTGC TTCGTTTTTA 
CAATTTTTTG CCACCACGCC AGAGCATCTT ATTGGACTGC GCATTTTGAT TGGCATTGGT 
CTGGGAGGCG ATTATTCAGT AGGTCACACC TTGCTGGCTG AATTTTCCCC GCGCCGCCAT 
CGCGGTATTT TGCTGGGCGC ATTCAGCGTG GTGTGGACCG TAGGCTATGT GCTGGCAAGT 
ATTGCCGGAC ATCACTTTAT TTCCGAAAAC CCGGAGGCCT GGCGCTGGCT ACTGGCATCG 
GCAGCTCTGC CCGCGTTGTT GATTACGTTA TTACGCTGGG GAACGCCAGA ATCACCACGC 
TGGCTACTGC GCCAGGGGCG TTTTGCAGAA GCTCACGCTA TCGTGCATCG CTATTTTGGT 
CCCCATGTTT TACTGGGCGA TGAAGTGGTA ACGGCGACCC ATAAACACAT CAAAACCTTG 
TTCTCTTCGC GTTACTGGCG GCGCACGGCG TTTAACAGCG TCTTCTTTGT CTGCCTCGTA 
ATCCCATGGT TTGTGATTTA TACCTGGCTG CCAACTATCG CCCAGACTAT TGGTCTGGAA 
GATGCGCTGA CTGCCAGCCT GATGCTTAAT GCGTTGTTAA TTGTGGGCGC GCTGCTGGGA 
TTAGTTCTGA CGCACCTGCT GGCACATCGC AAATTTTTGC TGGGAAGTTT TTTGCTGCTG 
GCGGCAACGC TGGTAGTCAT GGCCTGTTTG CCTTCCGGCA GTTCATTAAC GCTGCTGCTT 
TTTGTTCTCT TCAGCACCAC CATTTCGGCA GTCAGTAATC TGGTGGGCAT TTTGCCTGCG 
GAAAGTTTTC CTACTGACAT TCGCTCGCTG GGCGTCGGTT TTGCCACTGC CATGAGTCGA 
CTTGGCGCGG CGGTAAGTAC TGGCCTGCTG CCGTGGGTGC TGGCGCAGTG GGGAATGCAA 
GTCACCTTAT TGCTCCTGGC GACAGTGTTG TTGGTTGGTT TTGTTGTGAC CTGGCTATGG 
GCACCAGAAA CTAAAGCCCT CCCGCTGGTG GCGGCGGGAA ATGTAGGAGG TGCGAATGAA 
CATTCTGTTA GCGTTTAA

Protein sequence

MNTSPVRMDD LPLNRFHCRI AALTFGAHLT DGYVLGVIGY AIIQLTPAMQ LTPFMAGMIG 
GSALLGLFLG SLVLGWISDH IGRQKIFTFS FLLITLASFL QFFATTPEHL IGLRILIGIG 
LGGDYSVGHT LLAEFSPRRH RGILLGAFSV VWTVGYVLAS IAGHHFISEN PEAWRWLLAS 
AALPALLITL LRWGTPESPR WLLRQGRFAE AHAIVHRYFG PHVLLGDEVV TATHKHIKTL 
FSSRYWRRTA FNSVFFVCLV IPWFVIYTWL PTIAQTIGLE DALTASLMLN ALLIVGALLG 
LVLTHLLAHR KFLLGSFLLL AATLVVMACL PSGSSLTLLL FVLFSTTISA VSNLVGILPA 
ESFPTDIRSL GVGFATAMSR LGAAVSTGLL PWVLAQWGMQ VTLLLLATVL LVGFVVTWLW 
APETKALPLV AAGNVGGANE HSVSV