Gene B21_03231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03231
Symbol	ybl143
ID	8116242
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	3423844
End bp	3424836
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	47%
IMG OID	644849408
Product	hypothetical protein
Protein accession	YP_003000981
Protein GI	251786677
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0226] ABC-type phosphate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.862274
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAAT TCACCGGTGT TTTACTATTA GGCACGGCGT TACTGGCGGG ATGTGTCGAC 
CGGGAAGGGT ACTATAACAG CGTTAGGGAA GAAGAGAGCC ATGGACTGAC GTCTCTGCGG 
GGGCAACCTG CATTACGTTA CAGCGATGAT TGGTCAAGAT GGCCGAGAGT GTACGGCGCT 
ACAGCCTTAT ACCCGCTGTA TGCCTCCGCG TATTATAAAT TAGTACCCGA GCCAAAAGAT 
AAGGATCGAA CCTCGCTGGC CTGGCAGGCG TATGGTTTGC AGCAAACCCG AACAGCTGAA 
GCCTACGATA GTCTGATTAA AGGTTCCGCG ACGGTTATTT TTGTTGCACA ACCGTCGGAA 
GGACAGAAAA AACGTGCAGA AGAAGCGGGT GTTAAACTGA AATATACCGC TTTCGCCCGC 
GAAGCCTTTG TCTTTATCGT TGATATTAAT AACCCGGTAA ATTCTCTCTC TGAGCACCAG 
GTTAAAGATA TTTTTAGCGG CAAAACTAGC CGCTGGAATA AAGTAGGTGG TAGTGACGAA 
CATATAAAAG TCTGGCAGCG CCCTGAAGAT TCTGGAAGCC AAACGATTAT GAAGGGGTTG 
GTTATGCAAG ACACCCCAAT GCTGCCAGCT AAAAAATCCA CTGTGATTGA TCTTATGGGC 
GGTTTAATTA CTGAAGTTGC CGACTATCAA AACACGCCAT CTTCCATTGG GTACACCTTC 
CACTATTACG TCACTCGTAT GAATGACAAT ATGCTCAAAA TGCGCAAGCA GATTAAACTT 
TTGGCTATAA ATGGCGTTGC GCCTACCGAG GAAAATATCC GCAACGGCAC TTATCCATAC 
ATTGTGGATG CCTATATGGT GACGCGTGAA AATCCCACGC CGGAAACGCA GAAATTTGTT 
GACTGGTTTA TAAGTCAGCA GGGGCAACAG TTGGTAGAGG ATGTGGGGTA TGTGCCGCTG 
TATGAAGCAT CCCCCGAATC ATCAGGACAA TAA

Protein sequence

MNKFTGVLLL GTALLAGCVD REGYYNSVRE EESHGLTSLR GQPALRYSDD WSRWPRVYGA 
TALYPLYASA YYKLVPEPKD KDRTSLAWQA YGLQQTRTAE AYDSLIKGSA TVIFVAQPSE 
GQKKRAEEAG VKLKYTAFAR EAFVFIVDIN NPVNSLSEHQ VKDIFSGKTS RWNKVGGSDE 
HIKVWQRPED SGSQTIMKGL VMQDTPMLPA KKSTVIDLMG GLITEVADYQ NTPSSIGYTF 
HYYVTRMNDN MLKMRKQIKL LAINGVAPTE ENIRNGTYPY IVDAYMVTRE NPTPETQKFV 
DWFISQQGQQ LVEDVGYVPL YEASPESSGQ