Gene B21_03659 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03659
Symbol	ybl183
ID	8116286
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	3907327
End bp	3908550
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	51%
IMG OID	644849820
Product	hypothetical protein
Protein accession	YP_003001393
Protein GI	251787089
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1457] Purine-cytosine permease and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTAAAA AAGAAGAGAA TCTGAATACG GCATCAGGAT TGCGTATTGC CATGATTTTG 
CTGGGTATTG CCGTCACACC TGTGCTGTTG TCATCTTCAA GCCTCGGCAA TCAACTTTCC 
AGCAGCAGTT TAATTAGCGT CGTATTGTTA GGCGGCGTCA TTCTGACCTT ACTTTCAGCC 
ATCACCATTA GCGTGGGAGA AAAAGCCCGC CTGCCAACGT ATGGCATTGT GAAATATTCG 
TTTGGCGAAA AAGGGGCCAT CGCCATTAAC ATTTTGATGG CGATAAGTCT GTTCGGCTGG 
ATTGCCGTTA CCGCCAATAT GTTTGGTCAT TCGGTACATG ACTTACTGGC TCAACATGGA 
CTGGAAGTTC CACTGGCACT GTTAGTGGCG GCTGGCTGTG TCATTTTTGT CGCCTCTACG 
GCATTTGGCT TTACCGTTCT GGGAAAAATT GCCCAGGTTG CCGTGCCGGT TATCGCGCTG 
GTGCTGTGTT ACATCCTCTA TGTGGCAACC CATACCGAAG TGGCAGTACC AGCGGCGATT 
GTGGAGATGA ATACAGGTGT CGCCGTTTCC ACCGTTGTTG GCACCATTAT TGTGCTGGTT 
GCCACACTGC CTGATTTCGG TAGTTTTGTG CATAACCGCA AACATGCGCT GATTGCCGCA 
GGCGTGACGT TTCTGGTTGC CTACCCTCTG CTCTACTGGG CGGGTGCAAC GCCGAGCGCC 
ATTAGTGGTC AGGGATCTTT ACTGGGTGCG ATGGCGGTAT TCGGTGCGGT TCTGCCTGCG 
GCGCTGTTGT TGATTTTCGC CTGCGTCACC GGTAACGCGG GCAATATGTT CCAGGGCACG 
CTGGTGGTTT CCACACTGCT TACCCGCTTT CCCAAATGGC AGATTACCGT GGCGCTGGGT 
ATCCTTTCCG CCATCGTAGG CAGTATGGAT ATTATGGCGT GGTTTATTCC GTTTCTGCTG 
TTCCTGGGTA TCGCCACGCC ACCCGTTGCC GGAATTTATA TCGCTGACTT TTTCCTTTAT 
CGCCGTAATG GCTATCAAGA GTCAGTGTTA GCCCAGGAGT CACAGATTAA AGTGCTGACA 
TTCGCAGCAT GGATCATAGG CGCAGCGGTT GGCTTTATGA CCGTAAAAGG CTTATTCACC 
CTGACGACGA TCCCTTCGGT AGACTCGATT CTGGTGGCAT GTATCGCGTA TGCGATTCTC 
AGTCGGGCAA GTCAACACCG CTAA

Protein sequence

MRKKEENLNT ASGLRIAMIL LGIAVTPVLL SSSSLGNQLS SSSLISVVLL GGVILTLLSA 
ITISVGEKAR LPTYGIVKYS FGEKGAIAIN ILMAISLFGW IAVTANMFGH SVHDLLAQHG 
LEVPLALLVA AGCVIFVAST AFGFTVLGKI AQVAVPVIAL VLCYILYVAT HTEVAVPAAI 
VEMNTGVAVS TVVGTIIVLV ATLPDFGSFV HNRKHALIAA GVTFLVAYPL LYWAGATPSA 
ISGQGSLLGA MAVFGAVLPA ALLLIFACVT GNAGNMFQGT LVVSTLLTRF PKWQITVALG 
ILSAIVGSMD IMAWFIPFLL FLGIATPPVA GIYIADFFLY RRNGYQESVL AQESQIKVLT 
FAAWIIGAAV GFMTVKGLFT LTTIPSVDSI LVACIAYAIL SRASQHR