Gene ECH74115_5438 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5438
Symbol	birA
ID	6967399
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	5085212
End bp	5086177
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	49%
IMG OID	643389088
Product	biotin--protein ligase
Protein accession	YP_002273493
Protein GI	209399876
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0340] Biotin-(acetyl-CoA carboxylase) ligase
TIGRFAM ID	[TIGR00121] birA, biotin-[acetyl-CoA-carboxylase] ligase region [TIGR00122] BirA biotin operon repressor domain

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0000183056
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.00134266
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGGATA ACACCGTGCC ACTGAAATTA ATCGCGCTGT TAGCGAATGG CGAATTTCAC 
TCAGGTGAGC AGTTGGGTGA AACGTTAGGA ATGAGCCGGG CGGCTATTAA TAAACACATT 
CAGACACTGC GTGACTGGGG CGTTGATGTC TTTACCGTTC CGGGTAAAGG ATACAGCCTG 
CCTGAGCCTA TCCAGTTACT TAATGCTGAA CAGATATTGG GTCAGCTGGA TGGCGGTAGT 
GTAACTGTGC TGCCAGTGAT TGACTCCACG AATCAGTACC TTCTTGATCG TATCGGAGAG 
CTTAAATCGG GCGATGCCTG CGTTGCAGAA TACCAGCAGG CTGGCCGTGG TCGCCGGGGT 
CGGAAATGGT TTTCGCCTTT TGGCGCAAAC TTATATTTGT CGATGTTCTG GCGTCTGGAA 
CAAGGCCCGG CGGCGGCGAT TGGTTTAAGT CTGGTTATCG GTATCGTGAT GGCGGAAGTA 
TTACGCAAGC TGGGAGCAGA TAAAGTTCGT GTCAAATGGC CTAATGACCT CTATCTGCAG 
GATCGCAAGC TGGCAGGCAT TCTTGTGGAG CTGACTGGCA AAACCGGCGA TGCGGCGCAA 
ATAGTCATTG GAGCCGGGAT CAACATGGCA ATGCGTCGTG TTGAAGAGAG TGTCGTTAAT 
CAGGGGTGGA TCACGCTGCA GGAAGCGGGG ATCAATCTCG ATCGTAATAC GTTGGCGGCC 
ATGCTAATAC GTGAATTACG CGCGGCGCTG GAACTCTTCG AACAAGAAGG ATTGGCACCT 
TATCTTTCGC GCTGGGAAAA GCTGGATAAT TTTATTAATC GCCCAGTGAA ACTTATCATT 
GGTGATAAAG AAATATTTGG CATTTCACGC GGAATAGACA AACAAGGCGC TTTATTGCTT 
GAGCAGGATG GAATAATAAA ACCCTGGATG GGCGGTGAAA TATCCCTGCG TAGTGCAGAA 
AAATAA

Protein sequence

MKDNTVPLKL IALLANGEFH SGEQLGETLG MSRAAINKHI QTLRDWGVDV FTVPGKGYSL 
PEPIQLLNAE QILGQLDGGS VTVLPVIDST NQYLLDRIGE LKSGDACVAE YQQAGRGRRG 
RKWFSPFGAN LYLSMFWRLE QGPAAAIGLS LVIGIVMAEV LRKLGADKVR VKWPNDLYLQ 
DRKLAGILVE LTGKTGDAAQ IVIGAGINMA MRRVEESVVN QGWITLQEAG INLDRNTLAA 
MLIRELRAAL ELFEQEGLAP YLSRWEKLDN FINRPVKLII GDKEIFGISR GIDKQGALLL 
EQDGIIKPWM GGEISLRSAE K