Gene TM1040_3686 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3686
Symbol
ID	4075655
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	+
Start bp	744740
End bp	746095
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	67%
IMG OID	638005206
Product	L-carnitine dehydratase/bile acid-inducible protein F
Protein accession	YP_611915
Protein GI	99078657
COG category	[C] Energy production and conversion
COG ID	[COG1804] Predicted acyl-CoA transferases/carnitine dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.355974
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.187253
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTATGT TTGACGCCCT GCCCCCTCTG GACGCCTATC ACGTCGTAGG CGAGGGTCAG 
CGTCCAAGCG TCTATGCGGT CTCGGAGCTT GCCAACGACT GCCTCGGCGC GGTTGGACTG 
GAAATGGCAA AGCTGATCGA GGTACTGGGG TTGGCCCCCG GCGCGCCCGA CGTCACGGTG 
GACCAGCGCC TTGCCTCGCT CTGGTTTGGC TATTCCTTTC GCCCCGTGGG TTGGGAGATG 
CCTTCGCTTT GGGATCCGAT CGCGGGGGAT TATCCCTGCG CAGATGGCTG GATCCGCCTG 
CACACCAACC TGCCACATCA CCGCGCGGCG GCCCTGTCGG TGCTCGGCTG TAATGCGGAT 
CGCGAAGGCG TCGCCAAGGC GGTGCTGACC TGGCAGGGCG ACGCGCTGGA GGCAGCGGTT 
GTGGGCGCAG GTGGTGTCGC GGCCGCGATG CGCAGCCGTG AAGAATGGCT GGCGCATCCA 
CAGGGCGCGG CGGTCTGCCA AGAGCCTCTG GTGGATTGGA TCAAGCCGCG CCGCGTGGTG 
CTGCGCGCGC GCCCGGAGGC CAGCGCAGCG CGACCTCTGA TGGGGGTGCG GGTGCTCGAT 
CTGACGCGCG TGTTGGCCGG ACCGGTCAGC ACCCGCACGC TGGCCGGGTT CGGGGCCGAG 
GTGCTGCGGA TCGACCCGCC CGATTGGGAC GAGCCGGGCG TGTTGCAGGA CATCTCGCTG 
GGCAAACGCA TGGCAAGGCT CAATCTGCGC ACAGAGGCCG GCCGCGCCCA CCTGCGCGCA 
CTTCTGGCCG AGGCAGATGT GTTGGTGCAT GGCTTCAGAC CAGGCGCGCT CGACAATCTG 
GGGCTGGATT TGGCTACACG CGACGCGATT GCGCCCAACC GGATCGAGGT CACACTCAAC 
GCCTATGGCT GGACTGGCCC CTGGGCAAAT CGGCGCGGGT TTGACAGCCT TGTTCAGATG 
AGCGCCGGGA TCGCTGATGC GGGGCGGGAC TGGGCGGGCG CACAAAAGCC GACCCCCTTG 
CCGGTGCAGG CCCTCGATCA CGCAACCGGC TACCTGATGG CCGCGGCGGT TTTGTCTGCG 
CTCTCGGCGG CAGCACGGCA AGAGCCGGTC GGGGTTGCAC GCTTGTCGCT TGCCCGCACG 
GCAGAAGCGC TGGTCGCGAT CCCGAAACGG CTATCAGGGC CGGAGATTTC AACTGCCGAG 
CCCTGCGACT TTGCCACGTG TGAGGAGGCG AGCGGCTGGG GGGCTGGGTT GCGTCTGAGC 
CCGGCGGTGA AGATCAACGG CTGCGAGATG GGTTGGGATA TGCCGGCACA GCCAAGCGGC 
ACGCATCCTC CGCAATGGAA CGAGCCGCAA ACCTGA

Protein sequence

MSMFDALPPL DAYHVVGEGQ RPSVYAVSEL ANDCLGAVGL EMAKLIEVLG LAPGAPDVTV 
DQRLASLWFG YSFRPVGWEM PSLWDPIAGD YPCADGWIRL HTNLPHHRAA ALSVLGCNAD 
REGVAKAVLT WQGDALEAAV VGAGGVAAAM RSREEWLAHP QGAAVCQEPL VDWIKPRRVV 
LRARPEASAA RPLMGVRVLD LTRVLAGPVS TRTLAGFGAE VLRIDPPDWD EPGVLQDISL 
GKRMARLNLR TEAGRAHLRA LLAEADVLVH GFRPGALDNL GLDLATRDAI APNRIEVTLN 
AYGWTGPWAN RRGFDSLVQM SAGIADAGRD WAGAQKPTPL PVQALDHATG YLMAAAVLSA 
LSAAARQEPV GVARLSLART AEALVAIPKR LSGPEISTAE PCDFATCEEA SGWGAGLRLS 
PAVKINGCEM GWDMPAQPSG THPPQWNEPQ T