Gene B21_02286 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02286
Symbol	cysP
ID	8113404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	2414224
End bp	2415240
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	54%
IMG OID	644848490
Product	hypothetical protein
Protein accession	YP_003000063
Protein GI	251785759
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4150] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGTTA ACTTACTGAA AAAGAACTCA CTCGCGCTGG TCGCTTCTCT GCTGCTGGCG 
GGCCATGTAC AGGCAACGGA ACTGCTGAAC AGTTCTTATG ACGTCTCCCG CGAGCTGTTT 
GCCGCCCTGA ACCCGCCGTT TGAACAGCAA TGGGCCAAAG ATAACGGCGG CGACAAACTG 
ACGATAAAAC AATCTCATGC CGGGTCATCA AAACAGGCGC TGGCAATTTT GCAGGGCTTA 
AAAGCCGACG TTGTCACTTA TAACCAGGTG ACCGACGTAC AAATTCTGCA CGATAAAGGC 
AAGCTTATCC CGGCGGACTG GCAGTCGCGC CTGCCGAATA ATAGCTCGCC GTTCTACTCC 
ACCATGGGCT TCCTGGTGCG TAAGGGCAAC CCGAAGAATA TCCACGACTG GAACGACCTG 
GTGCGCTCCG ACGTGAAGCT GATTTTCCCG AACCCGAAAA CGTCGGGTAA CGCGCGTTAT 
ACCTATCTGG CGGCATGGGG CGCAGCGGAT AAAGCTGACG GTGGCGACAA AGCCAAAACC 
GAACAGTTTA TGACCCAGTT CCTGAAAAAC GTTGAAGTGT TCGATACTGG CGGTCGTGGC 
GCGACCACCA CTTTTGCCGA GCGCGGCCTG GGCGATGTGC TGATCAGCTT CGAGTCGGAA 
GTGAACAACA TCCGCAAACA GTATGAAGCG CAGGGCTTTG AAGTGGTGAT TCCGAAAACC 
AACATTCTGG CGGAATTCCC GGTGGCGTGG GTCGATAAAA ACGTGCAGGC CAACGGTACG 
GAAAAAGCAG CAAAAGCCTA CCTGAACTGG CTCTACAGCC CGCAGGCGCA GACTATCATC 
ACCGACTATT ACTACCGCGT AAATAACCCG GAAGTCATGG ACAAACTGAA AAACAAATTC 
CCGCAGACCG AGCTGTTCCG CGTGGAAGAC AAATTTGGCT CCTGGCCGGA AGTAATGAAA 
ACACACTTCA CCAGCGGCGG CGAGTTAGAC AAGCTGTTAG CGGCGGGGCG TAATTAA

Protein sequence

MAVNLLKKNS LALVASLLLA GHVQATELLN SSYDVSRELF AALNPPFEQQ WAKDNGGDKL 
TIKQSHAGSS KQALAILQGL KADVVTYNQV TDVQILHDKG KLIPADWQSR LPNNSSPFYS 
TMGFLVRKGN PKNIHDWNDL VRSDVKLIFP NPKTSGNARY TYLAAWGAAD KADGGDKAKT 
EQFMTQFLKN VEVFDTGGRG ATTTFAERGL GDVLISFESE VNNIRKQYEA QGFEVVIPKT 
NILAEFPVAW VDKNVQANGT EKAAKAYLNW LYSPQAQTII TDYYYRVNNP EVMDKLKNKF 
PQTELFRVED KFGSWPEVMK THFTSGGELD KLLAAGRN