Gene Saro_2045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2045
Symbol
ID	3917692
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2183030
End bp	2184097
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	67%
IMG OID	640444797
Product	L-carnitine dehydratase/bile acid-inducible protein F
Protein accession	YP_497318
Protein GI	87200061
COG category	[C] Energy production and conversion
COG ID	[COG1804] Predicted acyl-CoA transferases/carnitine dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGGGCG CACTCGATGG GCTGACCGTA CTCGAATTCG CGGGCATCGG CCCGGGGCCG 
TTCGCGTGCA TGATGCTGGC CGACCATGGC GCCCGCGTCA TCCGCATAGA CCGGCCCTCC 
AAGGGCGACC GCGTCGGCGA CAGCGGCAAC CGTGACATTC TCAACCGTAA TCGCGAGCGG 
CTGGAACTGG ACCTCAAGGA CCCGGCTTCG ATCGCGCGCA TCCGCGAACT GGTGAAGCAG 
GCCGACGCCA TCGTCGAGGG GTATCGCCCC GGGGTGATGG AACGGCTGGG CCTTGGCCCC 
GACGTTCTGC TCGCCGACAA TCCCGGGCTG GTCTACGGGC GCATGACCGG CTGGGGACAG 
GAGGGGCCGA TGGCGCCGCT CGCCGGACAC GACATCAACT ACATTGCACT GGCGGGCGCG 
CTCCACAGCT TCGGGCAAGC GGGCGGAAAG CCACAGTTCC CGGTCAATCT TGTCGGCGAT 
TTCGGCGGCG GCGGCATGTT GATGGCGTTC GGCGTGATGG CGGCGGTCTT CTCGGCGCAA 
CGCACGGGCA AGGGACAGGT CGTCGATTGC GCGATGGTCG ATGGCGCGGC GATTCTTTCC 
GCAATGACCT ACACGTTCCT CGGCAATGGC CGCTGGAAGG ACGAGCGCGG CGTGAACCTG 
CTCGACGGCG GGGCCCATTT CTACGACACC TACGAGACGA GCGACGGCAA GTGGATATCG 
ATCGGCTCGA TTGAACCCCA GTTCTATGCC CTGCTTCTGG AAAAGACCGG GCTGACAGAC 
GATCCCGAAT TCGCGCCGCA GATGGACCCG CGCGTCTGGC CCAGGCTCAA GGACCGGCTT 
GCGGCGCTTT TCCTGACCCG CACCCGCGAT GAATGGTGCG CCATCATGGA CGGCACCGAC 
ATCTGTTTCG CCCCGGTACT CAGTCTGCGC GAGGCGCCCC GCCATCCGCA CAACGTCGCA 
CGGGGGACCT TCGTCGAGGA CGGCGGCATG GTCATGCCCG CGCCCGCGCC CCGCTTTCTC 
GGAACGCCGG CGCCGCAGCC CTCGCTGGCC GCGCGCGAGG GCGGCTGA

Protein sequence

MPGALDGLTV LEFAGIGPGP FACMMLADHG ARVIRIDRPS KGDRVGDSGN RDILNRNRER 
LELDLKDPAS IARIRELVKQ ADAIVEGYRP GVMERLGLGP DVLLADNPGL VYGRMTGWGQ 
EGPMAPLAGH DINYIALAGA LHSFGQAGGK PQFPVNLVGD FGGGGMLMAF GVMAAVFSAQ 
RTGKGQVVDC AMVDGAAILS AMTYTFLGNG RWKDERGVNL LDGGAHFYDT YETSDGKWIS 
IGSIEPQFYA LLLEKTGLTD DPEFAPQMDP RVWPRLKDRL AALFLTRTRD EWCAIMDGTD 
ICFAPVLSLR EAPRHPHNVA RGTFVEDGGM VMPAPAPRFL GTPAPQPSLA AREGG