Gene B21_03232 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03232
Symbol	ybl144
ID	8116243
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	3424862
End bp	3426367
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	48%
IMG OID	644849409
Product	hypothetical protein
Protein accession	YP_003000982
Protein GI	251786678
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0226] ABC-type phosphate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAACA GAAAATGGAT TTTGACCTCG CTGGTAATGA CTTTTTTCGG CATCCCCATT 
CTGGCGCAGT TTTTGGCGGC GGTTATTGCC ATGCTGGGTG TCGGACTTGC CGGTATTATT 
GAAGTTTGTA ATATCTTTAT CACGCCAACA ATTTACCTTC TGCTCAACAT TTTTATGCTG 
GCGCTGGGCG CATTAATGCT ATTTTTCTCG GGGCGAGTGT GGGCGGACGA TAGTGCACCA 
GAAAAAAGAG AAATAGCCGT CTGGCGACAA TGTCTTTTTT TAGTACCCGC ATTATTAACC 
CTGGGGGTCT GGATAATCGC GCTGCATCTG GCAGATTATC AATTTCGCCA GATGGGAGCG 
GGTTGGTTGG CTGATCTTAT GCTCCCCTGG CTGGGCGTTT TGTTAGCCTC ATTAGTCGGT 
GGTGAGTACT GGTGGTTAGT CATTATACCT GTTGGCGCGC ATATCAGTTT TTCGCTGGGG 
TACGGCTGGC CGACCAGATA TCCTTTAACG GGCACGTCCG GGTTACGTTG CCGTAATTCT 
CTCTTGTTTA TCCTTCTCAT GCTTGGTTTT GTCGCCGGTT ACCAGGCTTA TTTATATAAA 
CAGCTTAATC CCGGCGTCGG TGTGCGTGAA AATATTGATA CCTGGGCCTG GCGACCCGAT 
AAACTCAATA ATCAACTGAC ACCACTGCGT GGTAAACCGC AAATTCAGTT CACGCAAAAC 
TGGCCGCGAC TTGATGGCGC AACGGCGGCG TACCCCATTT ATGCCTCTGC CTTTTATGCA 
CTAAGCGTTT TGCCGGAAGA TTTTCACGAA TGGGAATATC TGGCGAACTC TCGTACTCCC 
GAAGCATATA ACAAGATTGT TAAAGGTAAT GCCGATATTA TCTTTGTGGC TCAACCTTCC 
GGTGGGCAGA AAAAACGCGC GGAGGAATCG GGCGTCACTT TGATTTACAC GCCTTTTGCC 
CGTGAAGCGT TTGTTTTCAT CGTCAATGCA GATAACCCGG TTAATTCCCT GACCGAACAA 
CAAGTGCGTG ACATCTTCAG TGGTGCAATT ACCAACTGGC GCACGGTTGG CGGTAACGAT 
CAGGAGATCC AGACCTGGCA GCGCCCGGAA GACTCTGGCA GCCAGACAGT GATGCAATCA 
CAGGTCATGA AAAATGTCCG CATGATCTCG CCGCAGGAAA CGAAAGTGGC AAGCGTGATG 
GAGGGAATGA TTAAAGTCGT TGCCGAATAC CGTAATACAA ACAACGCAAT AGGCTATACC 
TTCCGCTATT ACGCGACGCA AATGAATGCT GATAAAAATA TAAAATTGCT AGCGATTAAC 
GGTATTACAC CGACGGCGGA AAACATTCGC AACGGCAAAT ATGCGTACAT CGTCGATGCA 
TTTATGGTGA CGAGAGAAAA TACAACGTCA GAAACACAAA AACTGGTCGA ATGGTTTTTA 
ACGCCGCAGG GGCAGAGTCT GGTAGAAGAT GTGGGATATG TGCCGCTGTA TCCAACAATG 
GAATAA

Protein sequence

MQNRKWILTS LVMTFFGIPI LAQFLAAVIA MLGVGLAGII EVCNIFITPT IYLLLNIFML 
ALGALMLFFS GRVWADDSAP EKREIAVWRQ CLFLVPALLT LGVWIIALHL ADYQFRQMGA 
GWLADLMLPW LGVLLASLVG GEYWWLVIIP VGAHISFSLG YGWPTRYPLT GTSGLRCRNS 
LLFILLMLGF VAGYQAYLYK QLNPGVGVRE NIDTWAWRPD KLNNQLTPLR GKPQIQFTQN 
WPRLDGATAA YPIYASAFYA LSVLPEDFHE WEYLANSRTP EAYNKIVKGN ADIIFVAQPS 
GGQKKRAEES GVTLIYTPFA REAFVFIVNA DNPVNSLTEQ QVRDIFSGAI TNWRTVGGND 
QEIQTWQRPE DSGSQTVMQS QVMKNVRMIS PQETKVASVM EGMIKVVAEY RNTNNAIGYT 
FRYYATQMNA DKNIKLLAIN GITPTAENIR NGKYAYIVDA FMVTRENTTS ETQKLVEWFL 
TPQGQSLVED VGYVPLYPTM E