Gene B21_00471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_00471
Symbol	allC
ID	8115035
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	513001
End bp	514236
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	51%
IMG OID	644846753
Product	hypothetical protein
Protein accession	YP_002998326
Protein GI	251784022
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR01879] amidase, hydantoinase/carbamoylase family [TIGR03176] allantoate amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTACAC ATTTTCGTCA AGCCATAGAA GAAACGCTGC CCTGGCTTTC CTCTTTTGGC 
GCTGACCCAA CGGGTGGTAT GACCCGTTTA CTTTATTCGC CGGAATGGCT GGAAACTCAG 
CAGCAATTTA AAAAAAGAAT GGCAGCAAGC GGGCTGGAAA CACGTTTCGA TGAAGTGGGG 
AATTTATATG GTCGCCTGAG TGGCACCGAA TATCCACAAG AAGTGGTTCT GAGCGGTTCG 
CATATCGATA CCGTGGTTAA CGGCGGTAAC CTCGACGGGC AATTCGGCGC GCTGGCGGCG 
TGGCTGGCAA TTGACTGGCT GAAAACGCAA TACGGCGCGC CGCTACGTAC GGTCGAAGTG 
GTGGCGATGG CAGAAGAAGA AGGCAGCCGC TTCCCGTATG TCTTCTGGGG CAGTAAAAAT 
ATCTTTGGGC TGGCGAATCC TGACGACGTG CGGAATATCT GTGATGCCAA AGGAAATAGT 
TTTGTCGATG CGATGAAGGC TTGCGGATTT ACTCTTCCGA ACGCCCCACT AACTCCGCGT 
CAGGATATTA AAGCCTTTGT TGAACTGCAT ATTGAACAGG GCTGTGTGCT GGAAAGTAAT 
GGGCAATCAA TTGGCGTGGT GAATGCAATT GTCGGGCAGC GTCGTTATAC GGTAACGCTG 
AACGGCGAAT CAAACCATGC AGGCACCACG CCGATGGGTT ATCGTCGTGA TACAGTTTAC 
GCTTTCAGTC GCATTTGCCA TCAGTCGGTC GAAAAAGCGA AAAGGATGGG CGATCCGCTG 
GTTCTGACCT TTGGCAAAGT AGAGCCGCGC CCGAATACGG TAAATGTGGT GCCGGGTAAA 
ACCACGTTCA CCATTGATTG TCGTCATACC GACGCTGCCG TGCTGCGCGA TTTCACCCAA 
CAGTTAGAAA ACGACATGCG GGCGATTTGC GATGAAATGG ACATTGGTAT TGATATCGAT 
TTATGGATGG ACGAAGAACC CGTGCCGATG AATAAGGAGC TGGTCGCCAC CCTGACAGAA 
TTGTGTGAAA GAGAAAAACT GAATTACCGG GTGATGCACA GTGGTGCCGG GCACGACGCG 
CAAATTTTCG CGCCTCGCGT ACCAACCTGC ATGATTTTCA TTCCCAGCAT CAACGGGATC 
AGCCATAACC CGGCGGAACG CACCAATATT ACCGACCTTG CCGAAGGGGT CAAAACGTTG 
GCACTCATGC TTTATCAACT TGCCTGGCAG AAATAA

Protein sequence

MITHFRQAIE ETLPWLSSFG ADPTGGMTRL LYSPEWLETQ QQFKKRMAAS GLETRFDEVG 
NLYGRLSGTE YPQEVVLSGS HIDTVVNGGN LDGQFGALAA WLAIDWLKTQ YGAPLRTVEV 
VAMAEEEGSR FPYVFWGSKN IFGLANPDDV RNICDAKGNS FVDAMKACGF TLPNAPLTPR 
QDIKAFVELH IEQGCVLESN GQSIGVVNAI VGQRRYTVTL NGESNHAGTT PMGYRRDTVY 
AFSRICHQSV EKAKRMGDPL VLTFGKVEPR PNTVNVVPGK TTFTIDCRHT DAAVLRDFTQ 
QLENDMRAIC DEMDIGIDID LWMDEEPVPM NKELVATLTE LCEREKLNYR VMHSGAGHDA 
QIFAPRVPTC MIFIPSINGI SHNPAERTNI TDLAEGVKTL ALMLYQLAWQ K