Gene TM1040_0389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0389
Symbol
ID	4078622
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	396997
End bp	398121
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	61%
IMG OID	638005684
Product	L-carnitine dehydratase/bile acid-inducible protein F
Protein accession	YP_612384
Protein GI	99080230
COG category	[C] Energy production and conversion
COG ID	[COG1804] Predicted acyl-CoA transferases/carnitine dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACCGC TTCATGGCCT CAAGGTTGTT GAACTCGCCC GCATTCTGGC TGGTCCCTGG 
ATTGGTCAGG CGCTCGCGGA TCTGGGCGCC GAAGTGGTCA AGGTCGAAAG CCCCGAGGGT 
GATGACACCC GCCGCTGGGG GCCGCCCTTT GTGGAGCGGG AGGGTGACAA AACGGCCGCC 
TACTATTATG CCGCCAACCG GGGCAAGACC TGTGTCACGG CTGATTTTCG CACATCAGAG 
GGGCAGGCCC AGGTGCGCGA TCTGGTCCGC GATGCCGACA TTCTGATCGA GAATTTCAAA 
GTGGGCGGGC TGAAGAAATA TGGCCTGGAT TTCGAGAGCC TCTCCGCTCT CAATCCGCGT 
CTGATCTATT GCTCTGTCAC CGGATTTGGT CAGGATGGTC CCTATGCGAC GCGCGCGGGG 
TATGACTTCT TGCTGCAGGG CATGTCGGGG CTGATGTCGA TCACCGGGGC CGCCGATGGG 
GAGCCGCAAA AGGTTGGCGT GGCGATCACG GATGTGGTGA CGGGGCTTTA TGGCAGCATC 
GGTATTCTGG CAGCGGTGGA GCAGCGGCAC CGCACCGGGC GGGGGCAGCA TATCGATATG 
TCCTTGCTCG ATTGCGCCAC AGCGATGTTG GCCAATCAGA ACATGAACTA TCTGGTAACC 
GGGGAAAGCC CCACCCGAAT GGGCAATGAA CATCCCAATA TCGCACCCTA TCAGGTGATG 
GCGGTGCGCG ATGGTCATGT CATTCTTGCG GTTGGCAATG ATGGTCAGTT CACCCGACTG 
TGCGATGTGC TTAACCTTGC AGGGCTCAAG GATGATCCGC GCTTTTCCAC CAACCAGCTG 
CGGGTGGCGC ACCGTGCAGA TTTGACGCCG CTGCTGGCGG CGGCGCTTGC ACAGTGGAGC 
CAGTCGGATT TGCTGGCTGC GCTTGAGGCC GCGACCGTTC CGGCTGGGCC GATCAACACC 
ATCGGGCAGG CTTTTGAGGA TGCGCAGATC AAACATCGTC AGATGCAGAT TGCGCCCGAG 
GGCGTGCCAG GCGTGCGGGG GCCTTGGGTA TTTTCTGACG CGGACCTGGC GCTTGACCGC 
TCGGCCCCCG TCCTGCCGCG CGACACGAAG CCCGAGAAAG ATTAA

Protein sequence

MTPLHGLKVV ELARILAGPW IGQALADLGA EVVKVESPEG DDTRRWGPPF VEREGDKTAA 
YYYAANRGKT CVTADFRTSE GQAQVRDLVR DADILIENFK VGGLKKYGLD FESLSALNPR 
LIYCSVTGFG QDGPYATRAG YDFLLQGMSG LMSITGAADG EPQKVGVAIT DVVTGLYGSI 
GILAAVEQRH RTGRGQHIDM SLLDCATAML ANQNMNYLVT GESPTRMGNE HPNIAPYQVM 
AVRDGHVILA VGNDGQFTRL CDVLNLAGLK DDPRFSTNQL RVAHRADLTP LLAAALAQWS 
QSDLLAALEA ATVPAGPINT IGQAFEDAQI KHRQMQIAPE GVPGVRGPWV FSDADLALDR 
SAPVLPRDTK PEKD