Gene B21_03542 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03542
Symbol	yieG
ID	8114909
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	3782145
End bp	3783482
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	54%
IMG OID	644849711
Product	hypothetical protein
Protein accession	YP_003001284
Protein GI	251786980
COG category	[R] General function prediction only
COG ID	[COG2252] Permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCAAC AACACACAAC CCAGGCTTCT GGCCAGGGGA TGCTGGAACG CGTGTTTAAA 
CTGCGCGAAC ATGGCACGAC GGCACGGACC GAAGTGATCG CCGGTTTTAC CACCTTCCTG 
ACGATGGTTT ACATCGTTTT TGTTAACCCG CAAATTCTTG GCGTTGCTGG CATGGATACC 
AGCGCCGTCT TCGTCACTAC CTGTCTGATC GCTGCATTCG GCAGTATTAT GATGGGACTG 
TTTGCTAACC TGCCAGTTGC ACTGGCACCC GCTATGGGCC TGAATGCGTT CTTCGCTTTT 
GTCGTTGTAC AGGCGATGGG CTTGCCGTGG CAGGTCGGGA TGGGCGCAAT CTTCTGGGGC 
GCGATAGGTC TGCTGTTACT GACGATTTTC CGCGTTCGCT ACTGGATGAT TGCCAACATT 
CCGGTGAGTC TGCGTGTGGG TATTACCAGC GGTATCGGTC TGTTCATTGG CATGATGGGG 
CTGAAAAACG CAGGTGTGAT TGTCGCTAAC CCGGAAACGC TGGTGAGCAT CGGTAATCTG 
ACTTCTCACA GCGTACTTCT GGGTATCCTC GGCTTCTTCA TCATTGCTAT TCTGGCCTCG 
CGCAACATTC ACGCAGCGGT GCTGGTTTCT ATCGTGGTGA CGACGCTGCT GGGCTGGATG 
CTGGGTGATG TGCACTACAA TGGCATCGTT TCTGCGCCGC CGAGCGTAAT GACAGTTGTG 
GGTCATGTAG ATTTAGCCGG GTCGTTTAAC CTCGGGCTGG CAGGGGTGAT TTTCTCTTTC 
ATGTTGGTCA ACTTGTTTGA CTCCTCCGGT ACGCTGATTG GCGTGACCGA TAAAGCAGGT 
CTGGCGGATG AGAAGGGGAA ATTCCCGCGC ATGAAGCAGG CGCTGTATGT CGACAGTATC 
TCTTCCGTGA CCGGTTCGTT TATCGGTACT TCTTCCGTTA CGGCTTATAT TGAGTCCTCT 
TCCGGCGTAT CGGTTGGCGG TCGTACCGGT CTGACGGCAG TGGTTGTTGG TCTGCTGTTC 
CTGCTGGTTA TCTTTCTGTC GCCGCTGGCG GGAATGGTGC CAGGCTACGC TGCAGCTGGC 
GCGTTGATCT ACGTTGGCGT GTTGATGACC TCAAGTCTTG CTCGCGTGAA CTGGCAGGAT 
CTTACTGAAT CTGTTCCGGC GTTTATTACC GCCGTGATGA TGCCGTTCAG CTTTTCGATT 
ACCGAAGGTA TTGCGCTGGG CTTTATCTCC TACTGCGTGA TGAAGATTGG TACCGGGCGT 
CTGCGTGACC TTAGCCCGTG CGTAATCATC GTTGCGCTGC TGTTTATCCT GAAGATTGTA 
TTTATCGACG CTCATTAA

Protein sequence

MSQQHTTQAS GQGMLERVFK LREHGTTART EVIAGFTTFL TMVYIVFVNP QILGVAGMDT 
SAVFVTTCLI AAFGSIMMGL FANLPVALAP AMGLNAFFAF VVVQAMGLPW QVGMGAIFWG 
AIGLLLLTIF RVRYWMIANI PVSLRVGITS GIGLFIGMMG LKNAGVIVAN PETLVSIGNL 
TSHSVLLGIL GFFIIAILAS RNIHAAVLVS IVVTTLLGWM LGDVHYNGIV SAPPSVMTVV 
GHVDLAGSFN LGLAGVIFSF MLVNLFDSSG TLIGVTDKAG LADEKGKFPR MKQALYVDSI 
SSVTGSFIGT SSVTAYIESS SGVSVGGRTG LTAVVVGLLF LLVIFLSPLA GMVPGYAAAG 
ALIYVGVLMT SSLARVNWQD LTESVPAFIT AVMMPFSFSI TEGIALGFIS YCVMKIGTGR 
LRDLSPCVII VALLFILKIV FIDAH