Gene B21_03155 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03155
Symbol	yheS
ID	8114052
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	3340100
End bp	3342013
Gene Length	1914 bp
Protein Length	637 aa
Translation table	11
GC content	55%
IMG OID	644849337
Product	hypothetical protein
Protein accession	YP_003000910
Protein GI	251786606
COG category	[R] General function prediction only
COG ID	[COG0488] ATPase components of ABC transporters with duplicated ATPase domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0843095
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTGTTT TCTCCTCGTT ACAAATTCGT CGCGGCGTGC GCGTCCTGCT GGATAATGCC 
ACCGCCACCA TCAACCCCGG GCAGAAAGTC GGCCTGGTGG GTAAAAACGG CTGTGGTAAA 
TCTACCCTGC TGGCATTGCT GAAAAATGAA ATCAGCGCCG ACGGCGGCAG CTACACCTTT 
CCGGGAAGCT GGCAACTGGC GTGGGTGAAT CAGGAAACGC CGGCGTTACC GCAAGCGGCG 
CTGGAATATG TCATTGACGG AGACCGTGAA TATCGTCAAC TGGAAGCGCA GCTACACGAC 
GCCAACGAAC GTAACGACGG GCACGCCATT GCGACCATTC ATGGCAAGCT GGATGCTATT 
GACGCATGGA GTATTCGCTC CCGTGCCGCC AGCCTGCTGC ACGGCCTCGG TTTCAGCAAT 
GAACAACTGG AGCGCCCGGT AAGTGATTTC TCCGGTGGCT GGCGTATGCG TCTTAACCTT 
GCCCAGGCGC TGATTTGCCG TTCAGACTTG CTGCTGCTCG ACGAACCGAC TAACCACCTC 
GATCTCGATG CCGTTATCTG GCTGGAAAAA TGGCTGAAGA GCTATCAGGG CACGCTGATC 
CTGATCTCTC ACGACCGCGA CTTCCTCGAT CCGATCGTCG ATAAAATTAT TCATATCGAA 
CAACAAAGCA TGTTCGAGTA CACCGGCAAC TACAGTTCGT TTGAAGTACA GCGCGCCACC 
CGTCTGGCGC AGCAACAAGC GATGTACGAA AGCCAGCAGG AACGCGTAGC GCATCTGCAA 
AGTTATATCG ACCGTTTCCG TGCCAAAGCC ACCAAAGCGA AGCAGGCCCA GAGCCGCATT 
AAGATGCTCG AGCGTATGGA GCTAATTGCC CCCGCGCACG TCGACAACCC GTTCCGCTTT 
AGCTTCCGCG CGCCGGAAAG CCTGCCAAAT CCGTTACTGA AGATGGAAAA AGTCAGCGCG 
GGCTATGGCG ATCGCATTAT TCTCGACTCG ATTAAACTGA ACCTGGTGCC CGGCTCGCGT 
ATTGGTCTGT TAGGCCGCAA TGGCGCGGGT AAATCGACAT TAATCAAACT GTTAGCCGGT 
GAACTTGCGC CAGTCAGCGG TGAAATTGGT CTGGCGAAAG GGATCAAACT CGGCTACTTC 
GCCCAGCATC AACTTGAATA CCTGCGCGCC GACGAATCAC CTATTCAACA TCTGGCACGT 
TTAGCGCCGC AGGAGCTGGA ACAAAAACTG CGTGACTACC TCGGCGGCTT TGGTTTCCAG 
GGCGATAAAG TAACCGAAGA AACGCGCCGC TTCTCCGGTG GGGAAAAAGC CCGCCTGGTG 
CTGGCATTAA TTGTCTGGCA GCGGCCGAAT CTGCTGCTGC TCGACGAACC GACTAACCAC 
CTTGACCTCG ACATGCGTCA GGCACTCACC GAAGCATTAA TCGAGTTTGA AGGCGCGCTG 
GTTGTCGTTT CGCACGACCG TCATTTGCTG CGTTCCACCA CTGACGATCT CTACCTGGTT 
CACGATCGTA AAGTCGAACC GTTCGACGGC GATCTGGAAG ATTATCAACA GTGGTTGAGC 
GACGTACAAA AGCAGGAAAA CCAGACCGAC GAAGCGCCAA AAGAGAATGC GAACAGCGCC 
CAGGCACGTA AAGATCAGAA GCGTCGGGAA GCTGAGCTGC GTGCGCAAAC CCAGCCACTG 
CGTAAAGAGA TTGCCCGTCT GGAAAAAGAG ATGGAGAAGC TGAACGCGCA ACTGGCGCAG 
GCGGAAGAGA AACTCGGCGA CAGCGAACTG TATGACCAGA GCCGTAAAGC GGAGTTGACC 
GCCTGCCTGC AACAGCAAGC CAGCGCCAAA TCCGGCCTGG AAGAGTGCGA AATGGCATGG 
CTGGAAGCCC AGGAGCAGCT TGAGCAGATG CTGCTGGAAG GCCAAAGCAA CTGA

Protein sequence

MIVFSSLQIR RGVRVLLDNA TATINPGQKV GLVGKNGCGK STLLALLKNE ISADGGSYTF 
PGSWQLAWVN QETPALPQAA LEYVIDGDRE YRQLEAQLHD ANERNDGHAI ATIHGKLDAI 
DAWSIRSRAA SLLHGLGFSN EQLERPVSDF SGGWRMRLNL AQALICRSDL LLLDEPTNHL 
DLDAVIWLEK WLKSYQGTLI LISHDRDFLD PIVDKIIHIE QQSMFEYTGN YSSFEVQRAT 
RLAQQQAMYE SQQERVAHLQ SYIDRFRAKA TKAKQAQSRI KMLERMELIA PAHVDNPFRF 
SFRAPESLPN PLLKMEKVSA GYGDRIILDS IKLNLVPGSR IGLLGRNGAG KSTLIKLLAG 
ELAPVSGEIG LAKGIKLGYF AQHQLEYLRA DESPIQHLAR LAPQELEQKL RDYLGGFGFQ 
GDKVTEETRR FSGGEKARLV LALIVWQRPN LLLLDEPTNH LDLDMRQALT EALIEFEGAL 
VVVSHDRHLL RSTTDDLYLV HDRKVEPFDG DLEDYQQWLS DVQKQENQTD EAPKENANSA 
QARKDQKRRE AELRAQTQPL RKEIARLEKE MEKLNAQLAQ AEEKLGDSEL YDQSRKAELT 
ACLQQQASAK SGLEECEMAW LEAQEQLEQM LLEGQSN