Gene EcHS_A4207 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4207
Symbol	birA
ID	5593140
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	4202664
End bp	4203629
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	50%
IMG OID	640923310
Product	biotin--protein ligase
Protein accession	YP_001460764
Protein GI	157163446
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0340] Biotin-(acetyl-CoA carboxylase) ligase
TIGRFAM ID	[TIGR00121] birA, biotin-[acetyl-CoA-carboxylase] ligase region [TIGR00122] BirA biotin operon repressor domain

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000000000000658318
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGATA ACACCGTGCC ACTGAAATTG ATTGCCCTGT TAGCGAACGG TGAATTTCAC 
TCTGGCGAGC AGTTGGGTGA AACGCTGGGA ATGAGCCGGG CGGCTATTAA TAAACACATT 
CAGACACTGC GTGACTGGGG CGTTGATGTC TTTACCGTTC CGGGTAAAGG ATACAGCCTG 
CCTGAGCCCA TCCAGTTACT TAATGCTGAA CAGATATTGG GTCAGCTGGA TGGCGGTAGT 
GTAGCCGTGC TGCCAGTTAT TGACTCCACG AATCAGTACC TTCTTGATCG TATCGGAGAG 
CTTAAATCGG GCGATGCCTG TGTTGCAGAA TACCAGCAGG CTGGCCGTGG TCGCCGGGGG 
CGGAAATGGT TTTCGCCTTT TGGCGCAAAC TTATATTTGT CGATGTTCTG GCGTCTGGAA 
CAAGGCCCGG CGGCGGCGAT TGGTTTAAGT CTGGTTATCG GTATCGTGAT GGCGGAAGTA 
TTACGCAAGC TGGGAGCAGA TAAAGTTCGT GTCAAATGGC CTAATGACCT CTATCTGCAG 
GATCGCAAGC TGGCAGGCAT TCTTGTGGAG CTGACTGGCA AAACTGGCGA TGCGGCGCAA 
ATAGTCATTG GAGCCGGGAT CAACATGGCA ATGCGCCGTG TTGAAGAGAG TGTCGTTAAT 
CAGGGGTGGA TCACGCTGCA GGAAGCGGGG ATCAATCTCG ATCGTAATAC GTTGGCGGCC 
ATGCTAATAC GTGAATTACG TGCTGCGTTG GAACTCTTCG AACAAGAAGG ATTGGCACCT 
TATCTGTCGC GCTGGGAAAA GCTGGATAAT TTTATTAATC GCCCAGTGAA ACTTATCATT 
GGTGATAAAG AAATATTTGG CATTTCACGC GGAATAGACA AACAGGGGGC TTTATTACTT 
GAGCAGGATG GAATAATAAA ACCCTGGATG GGCGGTGAAA TATCCCTGCG TAGTGCAGAA 
AAATAA

Protein sequence

MKDNTVPLKL IALLANGEFH SGEQLGETLG MSRAAINKHI QTLRDWGVDV FTVPGKGYSL 
PEPIQLLNAE QILGQLDGGS VAVLPVIDST NQYLLDRIGE LKSGDACVAE YQQAGRGRRG 
RKWFSPFGAN LYLSMFWRLE QGPAAAIGLS LVIGIVMAEV LRKLGADKVR VKWPNDLYLQ 
DRKLAGILVE LTGKTGDAAQ IVIGAGINMA MRRVEESVVN QGWITLQEAG INLDRNTLAA 
MLIRELRAAL ELFEQEGLAP YLSRWEKLDN FINRPVKLII GDKEIFGISR GIDKQGALLL 
EQDGIIKPWM GGEISLRSAE K