Gene B21_03369 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03369
Symbol	xylF
ID	8114363
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	3591361
End bp	3592353
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	44%
IMG OID	644849543
Product	hypothetical protein
Protein accession	YP_003001116
Protein GI	251786812
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4213] ABC-type xylose transport system, periplasmic component
TIGRFAM ID	[TIGR02634] D-xylose ABC transporter, substrate-binding protein

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATAA AGAACATTCT ACTCACCCTT TGCACCTCAC TCCTGCTTAC CAACGTTGCT 
GCACACGCCA AAGAAGTCAA AATAGGTATG GCGATTGATG ATCTCCGTCT TGAACGCTGG 
CAAAAAGATC GAGATATCTT TGTGAAAAAG GCAGAATCTC TCGGCGCGAA AGTATTTGTA 
CAGTCTGCAA ATGGCAATGA AGAAACACAA ATGTCGCAGA TTGAAAACAT GATAAACCGG 
GGTGTCGATG TTCTTGTCAT TATTCCGTAT AACGGTCAGG TATTAAGTAA CGTTGTAAAA 
GAAGCCAAAC AAGAAGGCAT TAAAGTATTA GCTTACGACC GTATGATTAA CGATGCGGAT 
ATCGATTTTT ATATTTCTTT CGATAACGAA AAAGTCGGTG AACTGCAGGC AAAAGCCCTG 
GTCGATATTG TTCCGCAAGG TAATTACTTC CTGATGGGCG GCTCGCCGGT AGATAACAAC 
GCCAAGCTGT TCCGCGCCGG ACAAATGAAA GTGTTAAAAC CTTACGTTGA TTCCGGAAAA 
ATTAAAGTCG TTGGTGACCA ATGGGTTGAT GGCTGGTTAC CGGAAAACGC ATTGAAAATT 
ATGGAAAACG CGCTAACCGC CAATAATAAC AAAATTGATG CTGTAGTTGC CTCAAACGAT 
GCCACCGCAG GTGGGGCAAT TCAGGCATTA AGCGCGCAAG GTTTATCAGG GAAAGTAGCA 
ATCTCCGGCC AGGATGCGGA TCTCGCAGGT ATTAAACGTA TTGCTGCCGG TACGCAAACT 
ATGACGGTGT ATAAACCTAT TACGTTGTTG GCAAATACTG CCGCAGAAAT TGCCGTTGAA 
TTGGGCAATG GTCAGGAGCC AAAAGCAGAT ACCTCACTGA ATAATGGCCT GAAAGATGTC 
CCCTCCCGCC TCCTGACACC GATCGATGTG AATAAAAACA ACATCAAAGA TACGGTAATT 
AAAGACGGAT TCCACAAAGA GAGCGAGCTG TAA

Protein sequence

MKIKNILLTL CTSLLLTNVA AHAKEVKIGM AIDDLRLERW QKDRDIFVKK AESLGAKVFV 
QSANGNEETQ MSQIENMINR GVDVLVIIPY NGQVLSNVVK EAKQEGIKVL AYDRMINDAD 
IDFYISFDNE KVGELQAKAL VDIVPQGNYF LMGGSPVDNN AKLFRAGQMK VLKPYVDSGK 
IKVVGDQWVD GWLPENALKI MENALTANNN KIDAVVASND ATAGGAIQAL SAQGLSGKVA 
ISGQDADLAG IKRIAAGTQT MTVYKPITLL ANTAAEIAVE LGNGQEPKAD TSLNNGLKDV 
PSRLLTPIDV NKNNIKDTVI KDGFHKESEL