Gene B21_03661 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03661
Symbol	ybl185
ID	8116288
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	3908982
End bp	3910082
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	55%
IMG OID	644849822
Product	hypothetical protein
Protein accession	YP_003001395
Protein GI	251787091
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0549] Carbamate kinase
TIGRFAM ID	[TIGR00746] carbamate kinase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GCATTTTACC GGTCATCAAT ACGGGTATCG CCCACAAACA AGCGGGGGTC GGGCAAATTG 
GTGCCGGGAT CACCACTGCG CCGATGGCCT GTTTTGTCGC CGCTGTACGT GCACTGGCGG 
AGATCGTCGC AAAGGAGAAC CATCATGGTT AAGCCACTGG CTGTCGTCGC GGTTGGCGGC 
AATGCGCTCA TTCAGGACGA GCAACGCAAT AGTATTCCCG ATCAATATGT TGCAGTGATG 
GAAAGCGTGC AACATATCGT TGATATGGTT GAAGCCGGAT GGGACCTGGT ACTAACCCAC 
GGTAATGGCC CGCAGGTGGG CTTTATTCTG CGCCGCTCTG AACTCGCCAG TAACGAAGTT 
TCTCCGGTTC CACTTGATTA CGCCGTGGGT GATACACAAG GTGCAATTGG CTACATGTTC 
CAGAAAGCGC TGCATAACGA ATTGGCTCGC CGTGGCATAA ACAAACCGGT AATTGCCCTG 
GTGACACAAA CGCGAGTCAG CCCACATGAC GATGCTTTCG CCAGCCCCAG TAAACCAATT 
GGCGCGTTTC TCGATGAAGC AACAGCCCAA CAACGCCAAC AACAACTCGG CTGGACGCTG 
ATGGAGGACG CCGGGCGTGG TTGGCGGCGT ACAGTTCCCT CTCCTGCACC ACTGGAAATT 
ATTGAGCACG ACACCATCGC TCACCTGGTG CGCCAGGGAT ATCTGGTTAT TGCCTGCGGC 
GGCGGCGGTA TTCCGGTGGT GCGAGACGGG CAACAACTGA AAGGTGTGGA AGCCGTGATC 
GATAAAGATC TGGCCTCCGC GCTGCTCGCC AGTCAGTTAG GCGCAGATCT GCTGGTGATC 
CCCACCGGTG TAGAAAAAGT AGCGATTAAC TTTGGTACAC CACAACAACA GTGGCTCGAC 
GCTATCAGCG TTGCCGAAGC GCAAACGCTG TTGCGGGAAG GTCAGTTTGG TGTCGGCAGT 
ATGCAACCCA AAGTGGAAGC CATTGTTGAT TTCATCAATG CCAGCCAGCA ACAAGGCAAA 
CAGGCCAGCG GCCTGATTAC TTCACCGCAA ACCATAAAAG CAGCCCTGGC GCATCAGAGC 
GGCACATGGA TAACCCTTTA A

Protein sequence

AFYRSSIRVS PTNKRGSGKL VPGSPLRRWP VLSPLYVHWR RSSQRRTIMV KPLAVVAVGG 
NALIQDEQRN SIPDQYVAVM ESVQHIVDMV EAGWDLVLTH GNGPQVGFIL RRSELASNEV 
SPVPLDYAVG DTQGAIGYMF QKALHNELAR RGINKPVIAL VTQTRVSPHD DAFASPSKPI 
GAFLDEATAQ QRQQQLGWTL MEDAGRGWRR TVPSPAPLEI IEHDTIAHLV RQGYLVIACG 
GGGIPVVRDG QQLKGVEAVI DKDLASALLA SQLGADLLVI PTGVEKVAIN FGTPQQQWLD 
AISVAEAQTL LREGQFGVGS MQPKVEAIVD FINASQQQGK QASGLITSPQ TIKAALAHQS 
GTWITL