Gene EcE24377A_0838 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_0838
Symbol	bioB
ID	5590024
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	857521
End bp	858561
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	55%
IMG OID	640924548
Product	biotin synthase
Protein accession	YP_001461963
Protein GI	157157967
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID	[TIGR00433] biotin synthetase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0000158311
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTCACC GCCCACGCTG GACATTGTCG CAAGTCACAG AATTATTTGA AAAACCGTTG 
CTGGATCTGC TGTTTGAAGC GCAGCAGGTG CATCGTCAGC ATTTCGATCC TCGTCAGGTA 
CAGGTCAGCA CGTTGCTGTC GATTAAAACC GGAGCTTGTC CGGAAGATTG CAAATACTGC 
CCGCAAAGCT CGCGCTACAA AACCGGGCTG GAAGCCGAGC GGTTGATGGA AGTTGAACAG 
GTGCTGGAGT CGGCGCGCAA AGCGAAAGCG GCAGGATCGA CGCGCTTCTG TATGGGCGCG 
GCGTGGAAGA ATCCCCACGA ACGCGATATG CCGTACCTGG AACAAATGGT GCAGGGGGTA 
AAAGCGATGG GGCTGGAGGC GTGTATGACG CTGGGCACGT TGAGTGAATC TCAGGCGCAG 
CGCCTCGCGA ACGCCGGGCT GGATTACTAC AACCACAACC TGGACACCTC GCCGGAGTTT 
TACGGCAATA TCATCACCAC CCGCACTTAT CAGGAACGCC TCGATACGCT GGAAAAAGTG 
CGCGATGCCG GGATCAAAGT CTGTTCTGGC GGCATTGTGG GCTTAGGCGA AACGGTAAAA 
GATCGCGCCG GATTATTGCT GCAACTGGCA AACCTGCCGA CGCCGCCGGA AAGCGTACCA 
ATCAACATGC TGGTGAAGGT GAAAGGCACG CCGCTTGCCG ATAACGATGA TGTCGATGCC 
TTTGATTTTA TTCGCACCAT TGCGGTCGCG CGGATCATGA TGCCAACCTC TTACGTGCGC 
CTTTCTGCCG GACGCGAGCA GATGAACGAA CAGACTCAGG CGATGTGCTT TATGGCAGGC 
GCAAACTCGA TTTTCTACGG TTGCAAACTG CTAACCACGC CGAATCCGGA AGAAGATAAA 
GACCTGCAAC TGTTTCGCAA ACTGGGGCTA AATCCGCAGC AAACTGCCGT GCTGGCAGGG 
GATAACGAAC AACAGCAGCG TCTGGAGCAG GCACTGATGA CCCCGGACAC TGACGAATAT 
TACAACGCGG CAGCACTATG A

Protein sequence

MAHRPRWTLS QVTELFEKPL LDLLFEAQQV HRQHFDPRQV QVSTLLSIKT GACPEDCKYC 
PQSSRYKTGL EAERLMEVEQ VLESARKAKA AGSTRFCMGA AWKNPHERDM PYLEQMVQGV 
KAMGLEACMT LGTLSESQAQ RLANAGLDYY NHNLDTSPEF YGNIITTRTY QERLDTLEKV 
RDAGIKVCSG GIVGLGETVK DRAGLLLQLA NLPTPPESVP INMLVKVKGT PLADNDDVDA 
FDFIRTIAVA RIMMPTSYVR LSAGREQMNE QTQAMCFMAG ANSIFYGCKL LTTPNPEEDK 
DLQLFRKLGL NPQQTAVLAG DNEQQQRLEQ ALMTPDTDEY YNAAAL