Gene Saro_2501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2501
Symbol
ID	3916822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2702379
End bp	2703551
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	65%
IMG OID	640445258
Product	L-carnitine dehydratase/bile acid-inducible protein F
Protein accession	YP_497771
Protein GI	87200514
COG category	[C] Energy production and conversion
COG ID	[COG1804] Predicted acyl-CoA transferases/carnitine dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGACA AGCCCGTAAT GCTCGAGGGC ATCCGCGTGG TGGACCTGAC CACGGTCGTT 
TTCGGCCCCT ATGCGACGCA GATCCTGGCG GATCTCGGCG CGGATGTGAT CAAGGTGGAA 
TCGCCCGGGA TCGGCGATGC CTTCCGCTGG TCGGCAAAGC CTGCCGTCAC GCCAGGCATG 
GCGCCAGCGT GGATGGCGCT CAACCGTGGC AAGAAGTCGG CGGCGCTCGA TCTCAAGGCT 
GAAGCGGACC GTTCGGTCAT GCTTGACCTG CTGCGCGAGG CGGACGTTTT CGTCGTTAAC 
GTCCGGGGCA AGGCGCTCGA GCGGATCGGG CTCGATTACG ACAGCCTCAA GGCCATCAAT 
CCTTCGCTGA TCTACGTTCA CTGTGTCGGC TTCGGGCAGG ATGGGCCCTA TGCCGATCTC 
CAGGCCTATG ATGACGTGAT CCAGGCGGCG ACCGGCACGA CCACGCTCCT GCCGCGCGTC 
GACGGCAATC CGCACCCGCG CTATCTGCCC TCGCTCATCG CTGACAAGGT GGCGGGCCTG 
CATGCGACCT ACGCGGCCTT GGCGGCGATC GTCCACAAGC AGCGAACGGG CGAGGGGCAA 
CTGGTGGAAG TGCCGATGTT CGAGGCCTTC TCCAGCTTCA TGCTGCTCGA ACACCTCGGC 
GGCCTGACTT TCGACCCGCC GAACGCGCCC GAAGGCTATT TCCGCCAGAT CGATCCGGAT 
CGCCAGCCGT TCCCGACCGC TGACGGCTAC GTAAGCATCG TCGCCTATAC CGACGATGCC 
TGGCAACGCA TCTTCACCCT GCTGGACCAG CCCGACTTCC TGAAGCAGGA CCACCTTGCC 
ACGCCGCAGC AGCGATATGT TGCACAGGCC GAACTCTATC AGGCGATAGC GCGGTTCACG 
CCGTTGCTTA CCACGTCGGA GATCGTCAGC CGATGCCATG CAGTGCAGAT ACCGGCCCAG 
GCGGTGCGCG ACCTTGCCGA TGTGATGAAG GACCCGCACC TGCAGGCGGT CAACTTCTTC 
AGGCGGCGTG TCCACCCGGT CGAGGGCGCC TACTTCGAGC AGGCCGCGCC AGTGAAATTC 
GGCGCCGCCG AAGACGGGGA ACGCCTGTCC CCACCACTGG GCGGCGAACA TACCGAGGAA 
CTGCGCGCAC GCGGCTGGAA CGCGTTCGGA TGA

Protein sequence

MSDKPVMLEG IRVVDLTTVV FGPYATQILA DLGADVIKVE SPGIGDAFRW SAKPAVTPGM 
APAWMALNRG KKSAALDLKA EADRSVMLDL LREADVFVVN VRGKALERIG LDYDSLKAIN 
PSLIYVHCVG FGQDGPYADL QAYDDVIQAA TGTTTLLPRV DGNPHPRYLP SLIADKVAGL 
HATYAALAAI VHKQRTGEGQ LVEVPMFEAF SSFMLLEHLG GLTFDPPNAP EGYFRQIDPD 
RQPFPTADGY VSIVAYTDDA WQRIFTLLDQ PDFLKQDHLA TPQQRYVAQA ELYQAIARFT 
PLLTTSEIVS RCHAVQIPAQ AVRDLADVMK DPHLQAVNFF RRRVHPVEGA YFEQAAPVKF 
GAAEDGERLS PPLGGEHTEE LRARGWNAFG