Gene Ndas_1193 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1193
Symbol
ID	9245044
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1449592
End bp	1450767
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	73%
IMG OID
Product	L-carnitine dehydratase/bile acid-inducible protein F
Protein accession	YP_003679140
Protein GI	297560166
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.120907
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.40116
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCCGC TTCGCGGTGT AACCGTCGTG TCCCTGGAGC AGGCCATCGC CGCTCCCTAC 
GCCAGCCGCC ACCTGGCCGA CATGGGCGCC CGCGTCATCA AGGTCGAGCG CCCCGGCACG 
GGCGACTTCG CCCGCGGCTA CGACTCCCGC GTCAACGGCA TGAGCTCGCA CTTCGTGTGG 
GTCAACCGCA ACAAGGAGTC CCTGACGCTG GACATCAAGG ACCCGCGCGG CAACGAGGTG 
CTGCGCCGGC TGCTGGCCCG CGCCGACGTC TTCATCCAGA ACCTGGCGCC AGGGGCCGCG 
GCCCGCGCCG GGCTGGGCGC CGCCGAGCTG CACGCGCGGC ACCCCGGGCT CATCGTCTGC 
GACATCTCCG GCTACGGTTC CCCCGGCCCC TACGAGACGA TGAAGGCCTA CGACCTGCTG 
GTGCAGAGTG AGTCGGGGCT GCTGTCGGTG ACGGGCAGCG GCGAGGAGAT GGCCAAGGTC 
GGCATCTCGG TCTCCGACAT CGCCGCGGGC ATGTACGCCT ACAGTTCGAT CCTGGGCGCG 
CTGCTCGAAC GCGCGCGCAC CGGGAAGGGC GCCCACCTGG ACGTGTCGAT GCTGGAGGCC 
ACCGCCGAGT GGATGGGCTT CCCGCTCTAC TACACCTACG ACGGCCAGGA GCCGCCGGCG 
CGCGCCGGCG CGGCGCACGC CACGATCTAC CCCTACGGCC CCTTCGTCGC GCGCGATGAG 
CAGGTGGTCC TGATGGCGAT CCAGAACGAG CGCGAATGGC GCGCGTTCTG CGAGCGCTTC 
CTGGAGCGCC CCGCGTTCGC CGAGGACCCC GCCTACGCCA CCAACGCCGC CCGCAGCGCC 
AACCGCGACA CGCTCAAGGC CGTCATCGAC CGGCGCTTCG CCGAGCTGGA CGGCGACGAG 
GCCACCTCCC TGCTCGCCGA CGTCCCGGTC GCCTACGCCC GGGTGAACAG CCTCGCCGAC 
GTGTGGAACC ACCCGCAGCT CGCCGCGCGC GGGCGCTGGC ACGAGGTGGA CACGCCGACG 
GGTCGGGTCC CGGCGCTCGC GCCGCCCGGC CCGCGCGACC CGGCCCCCCG CATGGACCCG 
GTCCCCGACC TCGGCGAGCA CACCGACGCC ATCCTCGGCG AACTGGGGAT GACGGCCGAG 
GAGACCGGCG AGCTGCGGTC GGGCGGGGTG GTCTGA

Protein sequence

MQPLRGVTVV SLEQAIAAPY ASRHLADMGA RVIKVERPGT GDFARGYDSR VNGMSSHFVW 
VNRNKESLTL DIKDPRGNEV LRRLLARADV FIQNLAPGAA ARAGLGAAEL HARHPGLIVC 
DISGYGSPGP YETMKAYDLL VQSESGLLSV TGSGEEMAKV GISVSDIAAG MYAYSSILGA 
LLERARTGKG AHLDVSMLEA TAEWMGFPLY YTYDGQEPPA RAGAAHATIY PYGPFVARDE 
QVVLMAIQNE REWRAFCERF LERPAFAEDP AYATNAARSA NRDTLKAVID RRFAELDGDE 
ATSLLADVPV AYARVNSLAD VWNHPQLAAR GRWHEVDTPT GRVPALAPPG PRDPAPRMDP 
VPDLGEHTDA ILGELGMTAE ETGELRSGGV V