Gene ECH74115_4573 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4573
Symbol	accC
ID	6971173
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	4242644
End bp	4243993
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	53%
IMG OID	643388283
Product	acetyl-CoA carboxylase biotin carboxylase subunit
Protein accession	YP_002272718
Protein GI	209396842
COG category	[I] Lipid transport and metabolism
COG ID	[COG0439] Biotin carboxylase
TIGRFAM ID	[TIGR00514] acetyl-CoA carboxylase, biotin carboxylase subunit

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0000555054
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.216792
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGATA AAATTGTTAT TGCCAACCGC GGCGAGATTG CATTGCGTAT TCTTCGTGCC 
TGTAAAGAAC TGGGCATCAA GACTGTCGCT GTGCACTCCA GCGCGGATCG CGATCTAAAA 
CACGTATTAC TGGCAGATGA AACGGTCTGT ATTGGCCCTG CTCCGTCAGT AAAAAGTTAT 
CTGAACATCC CGGCAATCAT CAGCGCCGCT GAAATCACCG GCGCAGTAGC AATCCATCCG 
GGTTACGGCT TCCTCTCCGA GAACGCCAAC TTTGCCGAGC AGGTTGAACG CTCCGGCTTT 
ATCTTCATTG GCCCGAAAGC AGAAACCATT CGCCTGATGG GCGACAAAGT ATCCGCAATC 
GCGGCGATGA AAAAAGCGGG CGTCCCTTGC GTACCGGGTT CTGACGGCCC GCTGGGCGAC 
GATATGGATA AAAACCGTGC CATTGCTAAA CGCATTGGTT ATCCGGTGAT TATCAAAGCC 
TCCGGCGGCG GCGGTGGTCG CGGTATGCGC GTAGTGCGCG GCGACGCTGA ACTGGCACAA 
TCCATCTCCA TGACCCGTGC GGAAGCGAAA GCTGCTTTCA GCAACGATAT GGTTTACATG 
GAGAAATACC TGGAAAATCC TCGCCACGTC GAGATTCAGG TACTGGCTGA CGGTCAGGGC 
AACTCTATCT ATCTGGCGGA ACGTGACTGC TCCATGCAGC GCCGCCACCA GAAAGTGGTC 
GAAGAAGCAC CAGCACCGGG CATTACCCCG GAACTGCGTC GCTACATCGG CGAACGTTGC 
GCTAAAGCGT GTGTTGATAT CGGCTATCGC GGTGCAGGTA CTTTCGAGTT CCTGTTCGAA 
AACGGCGAGT TCTATTTCAT CGAAATGAAC ACCCGTATTC AGGTAGAACA CCCGGTTACA 
GAAATGATCA CCGGCGTTGA CCTGATCAAA GAACAGCTGC GTATCGCTGC CGGTCAACCG 
CTGTCGATCA AGCAAGAAGA AGTTCACGTT CGCGGCCATG CGGTGGAATG TCGTATCAAC 
GCCGAAGATC CGAACACCTT CCTGCCAAGT CCGGGCAAAA TCACCCGTTT CCACGCACCT 
GGCGGTTTTG GCGTACGTTG GGAGTCTCAT ATCTACGCGG GCTACACCGT ACCGCCGTAC 
TATGACTCAA TGATCGGTAA GCTGATTTGC TACGGTGAAA ACCGTGACGT GGCGATTGCC 
CGCATGAAGA ATGCGCTGCA GGAGCTGATC ATCGACGGTA TCAAAACCAA CGTTGATCTG 
CAGATCCGCA TCATGAATGA CGAGAACTTC CAGCATGGTG GCACTAACAT CCACTATCTG 
GAGAAAAAAC TCGGTCTTCA GGAAAAATAA

Protein sequence

MLDKIVIANR GEIALRILRA CKELGIKTVA VHSSADRDLK HVLLADETVC IGPAPSVKSY 
LNIPAIISAA EITGAVAIHP GYGFLSENAN FAEQVERSGF IFIGPKAETI RLMGDKVSAI 
AAMKKAGVPC VPGSDGPLGD DMDKNRAIAK RIGYPVIIKA SGGGGGRGMR VVRGDAELAQ 
SISMTRAEAK AAFSNDMVYM EKYLENPRHV EIQVLADGQG NSIYLAERDC SMQRRHQKVV 
EEAPAPGITP ELRRYIGERC AKACVDIGYR GAGTFEFLFE NGEFYFIEMN TRIQVEHPVT 
EMITGVDLIK EQLRIAAGQP LSIKQEEVHV RGHAVECRIN AEDPNTFLPS PGKITRFHAP 
GGFGVRWESH IYAGYTVPPY YDSMIGKLIC YGENRDVAIA RMKNALQELI IDGIKTNVDL 
QIRIMNDENF QHGGTNIHYL EKKLGLQEK