Gene EcHS_A0042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0042
Symbol	caiB
ID	5591852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	41156
End bp	42373
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	52%
IMG OID	640919230
Product	crotonobetainyl-CoA:carnitine CoA-transferase
Protein accession	YP_001456825
Protein GI	157159507
COG category	[C] Energy production and conversion
COG ID	[COG1804] Predicted acyl-CoA transferases/carnitine dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	64
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCATC TACCCATGCC GAAATTCGGG CCGTTGGCCG GATTGCGCGT TGTCTTCTCC 
GGTATCGAAA TCGCCGGACC GTTTGCCGGG CAAATGTTCG CAGAATGGGG CGCGGAAGTT 
ATCTGGATCG AGAACGTCGC CTGGGCCGAC ACCATTCGCG TTCAACCGAA CTACCCGCAA 
CTCTCCCGCC GCAATTTGCA CGCGCTGTCG TTAAATATTT TCAAAGATGA AGGCCGCGAA 
GCGTTTCTGA AATTAATGGA AACCACCGAT ATCTTCATCG AAGCCAGTAA AGGTCCGGCC 
TTTGCCCGTC GTGGCATTAC CGATGAAGTA CTGTGGCAGC ACAACCCGAA ACTGGTTATC 
GCTCACCTGT CCGGTTTTGG TCAGTACGGC ACCGAGGAGT ACACCAATCT TCCGGCCTAT 
AACACTATCG CCCAGGCCTT TAGTGGTTAC CTGATTCAGA ACGGTGATGT TGACCAGCCA 
ATGCCTGCCT TCCCGTATAC CGCCGATTAC TTTTCTGGCC TGACCGCCAC CACGGCGGCG 
CTGGCAGCAC TGCATAAAGT GCGTGAAACC GGTAAAGGCG AAAGTATCGA CATCGCCATG 
TATGAAGTGA TGCTGCGTAT GGGCCAGTAC TTCATGATGG ATTACTTCAA CGGCGGCGAA 
ATGTGCCCGC GCATGAGCAA AGGTAAAGAT CCCTACTACG CCGGTTGCGG TCTGTATAAA 
TGCGCCGACG GCTACATCGT GATGGAACTG GTGGGCATTA CCCAAATTGA AGAGTGCTTT 
AAAGATATTG GCCTCGCACA TCTACTCGGT ACGCCGGAAA TCCCGGAAGG CACTCAGCTT 
ATCCACCGTA TCGAATGCCC TTACGGCCCA CTGGTAGAAG AAAAACTCGA TGCCTGGCTG 
GCGGCACATA CCATCGCAGA AGTTAAAGAA CGCTTTGCCG AACTGAATAT CGCCTGTGCC 
AAAGTACTGA CCGTACCGGA ACTGGAAAGC AATCCACAGT ATGTTGCCCG TGAATCAATC 
ACTCAGTGGC AAACGATGGA TGGTCGCACC TGCAAAGGGC CGAACATCAT GCCGAAATTC 
AAAAATAACC CCGGACAAAT CTGGCGCGGA ATGCCCTCAC ATGGCATGGA CACGGCTGCC 
ATTTTGAAAA ATATCGGCTA CAGCGAAAAC GACATTCAGG AGTTGGTCAG CAAAGGTCTG 
GCCAAAGTTG AGGACTAA

Protein sequence

MDHLPMPKFG PLAGLRVVFS GIEIAGPFAG QMFAEWGAEV IWIENVAWAD TIRVQPNYPQ 
LSRRNLHALS LNIFKDEGRE AFLKLMETTD IFIEASKGPA FARRGITDEV LWQHNPKLVI 
AHLSGFGQYG TEEYTNLPAY NTIAQAFSGY LIQNGDVDQP MPAFPYTADY FSGLTATTAA 
LAALHKVRET GKGESIDIAM YEVMLRMGQY FMMDYFNGGE MCPRMSKGKD PYYAGCGLYK 
CADGYIVMEL VGITQIEECF KDIGLAHLLG TPEIPEGTQL IHRIECPYGP LVEEKLDAWL 
AAHTIAEVKE RFAELNIACA KVLTVPELES NPQYVARESI TQWQTMDGRT CKGPNIMPKF 
KNNPGQIWRG MPSHGMDTAA ILKNIGYSEN DIQELVSKGL AKVED