Gene B21_01094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_01094
Symbol	plsX
ID	8115235
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	1149597
End bp	1150667
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	52%
IMG OID	644847351
Product	hypothetical protein
Protein accession	YP_002998924
Protein GI	251784620
COG category	[I] Lipid transport and metabolism
COG ID	[COG0416] Fatty acid/phospholipid biosynthesis enzyme
TIGRFAM ID	[TIGR00182] fatty acid/phospholipid synthesis protein PlsX

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000594515
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGACACGTC TAACCCTGGC GTTAGATGTC ATGGGAGGGG ATTTTGGCCC TTCCGTGACA 
GTGCCTGCAG CATTGCAGGC ACTGAATTCT AATTCGCAAC TCACTCTTCT TTTAGTCGGC 
AATCCCGACG CCATCACGCC ATTACTTGCT AAAGCTGACT TTGAACAACG TTCGCGTCTG 
CAGATTATTC CTGCGCAGTC AGTTATCGCC AGTGATGCCC GGCCTTCGCA AGCTATCCGC 
GCCAGTCGTG GGAGTTCAAT GCGCGTGGCC CTGGAGCTGG TGAAAGAAGG TCGAGCGCAA 
GCCTGTGTCA GTGCCGGTAA TACCGGGGCA CTGATGGGGC TGGCAAAATT ATTACTCAAG 
CCCCTGGAGG GGATTGAGCG TCCGGCGCTG GTGACGGTAT TACCACATCA GCAAAAGGGC 
AAAACGGTGG TCCTTGACTT AGGGGCCAAC GTCGATTGTG ACAGTACAAT GTTGGTGCAA 
TTTGCCATTA TGGGCTCAGT TCTGGCTGAA GAGGTGGTGG AAATTCCCAA TCCTCGCGTG 
GCGTTGCTCA ATATTGGTGA AGAAGAAGTA AAGGGTCTCG ACAGTATTCG GGATGCCTCA 
GCGGTGCTTA AAACAATCCC TTCTATCAAT TATATCGGCT ATCTTGAAGC CAATGAGTTG 
TTAACTGGCA AGACAGATGT GCTGGTTTGT GACGGCTTTA CAGGAAATGT CACATTAAAG 
ACGATGGAAG GTGTTGTCAG GATGTTCCTT TCTCTGCTGA AATCTCAGGG TGAAGGGAAA 
AAACGGTCGT GGTGGCTACT GTTATTAAAG CGTTGGCTAC AAAAGAGCCT GACGAGGCGA 
TTCAGTCACC TCAACCCCGA CCAGTATAAC GGCGCCTGTC TGTTAGGATT GCGCGGCACG 
GTGATAAAAA GTCATGGTGC AGCCAATCAG CGAGCTTTTG CGGTCGCGAT TGAACAGGCA 
GTGCAGGCGG TGCAGCGACA AGTTCCTCAG CGAATTGCCG CTCGCCTGGA ATCTGTATAC 
CCAGCTGGTT TTGAGCTGCT GGACGGTGGC AAAAGCGGAA CTCTGCGGTA G

Protein sequence

MTRLTLALDV MGGDFGPSVT VPAALQALNS NSQLTLLLVG NPDAITPLLA KADFEQRSRL 
QIIPAQSVIA SDARPSQAIR ASRGSSMRVA LELVKEGRAQ ACVSAGNTGA LMGLAKLLLK 
PLEGIERPAL VTVLPHQQKG KTVVLDLGAN VDCDSTMLVQ FAIMGSVLAE EVVEIPNPRV 
ALLNIGEEEV KGLDSIRDAS AVLKTIPSIN YIGYLEANEL LTGKTDVLVC DGFTGNVTLK 
TMEGVVRMFL SLLKSQGEGK KRSWWLLLLK RWLQKSLTRR FSHLNPDQYN GACLLGLRGT 
VIKSHGAANQ RAFAVAIEQA VQAVQRQVPQ RIAARLESVY PAGFELLDGG KSGTLR