Gene ECH74115_0042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0042
Symbol	caiB
ID	6971682
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	42305
End bp	43522
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	52%
IMG OID	643384123
Product	crotonobetainyl-CoA:carnitine CoA-transferase
Protein accession	YP_002268646
Protein GI	209397439
COG category	[C] Energy production and conversion
COG ID	[COG1804] Predicted acyl-CoA transferases/carnitine dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	70
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCATC TACCCATGCC GAAATTCGGG CCGTTGGCCG GATTGCGCGT TGTCTTCTCC 
GGTATCGAAA TTGCCGGGCC GTTCGCCGGG CAAATGTTCG CAGAATGGGG TGCGGAAGTT 
ATCTGGATCG AGAACGTCGC CTGGGCCGAC ACCATTCGCG TTCAACCGAA CTACCCGCAA 
CTCTCCCGCC GCAATTTGCA CGCGCTGTCG TTAAATATTT TCAAAGATGA AGGCCGCGAA 
GCGTTTCTGA AATTAATGGA AACCACCGAT ATCTTCATCG AAGCCAGTAA AGGTCCGGCC 
TTTGCCCGTC GTGGCATTAC CGATGAAGTA CTGTGGCAAC ACAACCCGAA ACTGGTTATC 
GCTCACCTGT CCGGTTTTGG TCAGTACGGC ACCGAGGAGT ACACCAATCT TCCGGCCTAT 
AACACCATCG CCCAGGCCTT CAGTGGTTAC CTGATTCAGA ACGGTGATGT TGACCAGCCA 
ATGCCTGCCT TCCCGTATAC CGCCGATTAC TTTTCTGGCC TGACCGCCAC CACGGCGGCG 
CTGGCAGCAC TGCATAAAGC GCGTGAAACC GGTAAAGGCG AAAGTATCGA CATCGCCATG 
TATGAAGTGA TGCTGCGTAT GGGCCAGTAC TTCATGATGG ATTACTTCAA CGGCGGCGAA 
ATGTGCCCGC GCATGAGCAA AGGTAAAGAT CCCTACTATG CCGGTTGCGG TCTGTATAAA 
TGTGCCGACG GCTACATCGT GATGGAACTG GTGGGCATTA CCCAAATTGA AGAGTGCTTT 
AAAGATATTG GCCTCGCACA TCTACTCGGT ACGCCGGAAA TCCCGGAAGG CACTCAGCTT 
ATCCACCGTA TCGAATGCCC TTACGGCCCA CTGGTAGAAG AAAAACTCGA TGCCTGGCTG 
GCGGCACATA CCATCGCAGA AGTTAAAGAA CGCTTTGCCG AACTGAATAT CGCCTGTGCC 
AAAGTACTGA CCGTACCGGA ACTGGAAAGC AATCCACAGT ATGTTGCCCG TGAATCAATC 
ACTCAGTGGC AAACGATGGA TGGTCGCACC TGCAAAGGGC CGAACATCAT GCCGAAATTC 
AAAAATAACC CCGGACAAAT CTGGCGCGGA ATGCCCTCAC ATGGCATGGA CACGGCTGCC 
ATTTTGAAAA ATATCGGCTA CAGCGAAAAC GACATTCAGG AGTTGGTCAG CAAAGGTCTG 
GCCAAAGTTG AGGACTAA

Protein sequence

MDHLPMPKFG PLAGLRVVFS GIEIAGPFAG QMFAEWGAEV IWIENVAWAD TIRVQPNYPQ 
LSRRNLHALS LNIFKDEGRE AFLKLMETTD IFIEASKGPA FARRGITDEV LWQHNPKLVI 
AHLSGFGQYG TEEYTNLPAY NTIAQAFSGY LIQNGDVDQP MPAFPYTADY FSGLTATTAA 
LAALHKARET GKGESIDIAM YEVMLRMGQY FMMDYFNGGE MCPRMSKGKD PYYAGCGLYK 
CADGYIVMEL VGITQIEECF KDIGLAHLLG TPEIPEGTQL IHRIECPYGP LVEEKLDAWL 
AAHTIAEVKE RFAELNIACA KVLTVPELES NPQYVARESI TQWQTMDGRT CKGPNIMPKF 
KNNPGQIWRG MPSHGMDTAA ILKNIGYSEN DIQELVSKGL AKVED