Gene EcHS_A0828 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0828
Symbol	bioB
ID	5595408
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	835947
End bp	836987
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	55%
IMG OID	640920001
Product	biotin synthase
Protein accession	YP_001457568
Protein GI	157160250
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID	[TIGR00433] biotin synthetase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.000000258207
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTCACC GCCCACGCTG GACATTGTCG CAAGTCACAG AATTATTTGA AAAACCGTTG 
CTGGATCTGC TGTTTGAAGC GCAGCAGGTA CATCGACAGC ATTTCGATCC TCGTCAGGTG 
CAGGTCAGCA CTTTGCTGTC GATTAAGACC GGAGCTTGTC CGGAAGATTG CAAATACTGC 
CCGCAAAGCT CGCGCTACAA AACCGGGCTG GAAGCCGAGC GGTTGATGGA AGTTGAACAG 
GTGCTGGAGT CGGCGCGCAA AGCGAAAGCG GCAGGATCGA CGCGCTTCTG TATGGGCGCG 
GCGTGGAAGA ATCCCCACGA ACGCGATATG CCGTACCTGG AACAAATGGT GCAGGGGGTA 
AAAGCGATGG GGCTGGAGGC GTGTATGACG CTGGGCACGT TGAGTGAATC TCAGGCGCAG 
CGCCTCGCGA ACGCCGGGCT GGATTACTAC AACCACAACC TGGACACCTC GCCGGAGTTT 
TACGGCAATA TCATCACCAC ACGCACTTAT CAGGAACGCC TCGATACGCT GGAAAAAGTG 
CGCGATGCCG GGATCAAAGT CTGTTCTGGC GGCATTGTGG GCTTAGGCGA AACGGTAAAA 
GATCGCGCCG GATTATTGCT GCAACTGGCA AACCTGCCGA CGCCGCCGGA AAGCGTGCCA 
ATCAACATGC TGGTGAAGGT GAAAGGCACG CCGCTTGCCG ATAACGATGA TGTCGATGCC 
TTTGATTTTA TTCGCACCAT TGCGGTCGCG CGGATCATGA TGCCAACCTC TTACGTGCGC 
CTTTCTGCCG GACGCGAGCA GATGAACGAA CAGACTCAGG CGATGTGCTT TATGGCAGGC 
GCAAACTCGA TTTTCTACGG TTGCAAACTG CTGACCACGC CGAATCCGGA AGAAGATAAA 
GACCTGCAAC TGTTCCGCAA ACTGGGGCTA AATCCGCAGC AAACTGCCGT GCTGGCGGGC 
GATAACGAAC AACAGCAGCG TCTGGAACAG GCACTGATGA CCCCGGACAC TGACGAATAT 
TACAACGCGG CAGCACTATG A

Protein sequence

MAHRPRWTLS QVTELFEKPL LDLLFEAQQV HRQHFDPRQV QVSTLLSIKT GACPEDCKYC 
PQSSRYKTGL EAERLMEVEQ VLESARKAKA AGSTRFCMGA AWKNPHERDM PYLEQMVQGV 
KAMGLEACMT LGTLSESQAQ RLANAGLDYY NHNLDTSPEF YGNIITTRTY QERLDTLEKV 
RDAGIKVCSG GIVGLGETVK DRAGLLLQLA NLPTPPESVP INMLVKVKGT PLADNDDVDA 
FDFIRTIAVA RIMMPTSYVR LSAGREQMNE QTQAMCFMAG ANSIFYGCKL LTTPNPEEDK 
DLQLFRKLGL NPQQTAVLAG DNEQQQRLEQ ALMTPDTDEY YNAAAL