Gene Ndas_5227 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5227
Symbol
ID	9249120
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	-
Start bp	379845
End bp	380939
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	76%
IMG OID
Product	L-carnitine dehydratase/bile acid-inducible protein F
Protein accession	YP_003683113
Protein GI	297564140
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.012301
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGACCCC TGAACGGAAT CCGCGTCGTC GAGTTCACCG GGATCGGCCC GGCTCCGATG 
GCCGGGATGC TCCTCGCCGA CCTGGGCGCC AGCGTCATCC GCCTCGACCG CCCCGCGGCC 
GCCGACGCGA TGAACTCCGG AGCGGGCGGA CCCCACCTGA GCGAGGGGCG CACCGTCCTG 
CCCGCCGACC TCAAGTCCGA GGAGGGCCTC GCGCTCGCCC GCGACCTGGC CTCCCGCGCC 
GACGTGCTCC TGGAGGGCTT CCGCCCCGGG GTCATGGAGC GCCTGGGCCT GGGCCCCGAG 
GTCTGCCTGG AGGCCAACCC GCGCCTGGTC TACGCGCGGG TCACCGGCTG GGGCCAGGAC 
GGGCCGCTCG CCCGCGCCGC CGGGCACGAC ATGAACTACA TCTCCGTGAA CGGCGCCCTG 
CACGCCATCG GGCGCGCGGG GGGCCCGCCG GTCCCCCCGG TCAACCTCCT GGGCGACTTC 
GCCGGGGGCA CCATGTTCGC GGTCACCGGC GTCCTCGGCG CGCTGGTCGA GCGCCAGTCC 
TCCGGTCGCG GCCAGGTCGT GGACGCCGCG ATGGTGGACG GCAGCGCGCT GCTGATGTCG 
ATGCTGCACG AGGACCGCGC GCGCGGTTCC TGGAGCGACG AGCGCGGCAC CAACTACCTG 
GACACCGGCG CCCCCTGGTA CGACGTCTAC GAGTGCGCCG ACGGCCGGTA CGTGTCGGTC 
GGCTGCATCG AGCCCCAGTT CTACGCCGCG TTCCTGGAGG GCACCGGCCT GGCCGGGGAG 
GACCTGCCCG ACCAGTGGGA CCGGTCGGGC TGGCCCCGGC TGCGGGAGCG GTTCGCCGAG 
GTCCTGCGCA CCCGTACCCG CGACGCGTGG GGCGAGGTGT TCGAGGGCGC CGACGCCTGC 
GTGATGCCCG TCCTGTCCCT GGAGGAGGCC CCCGACCACC CGCACGTGCG CGCCCGCGGC 
TCACTCGTGC GCGACGGCGA CCGGATCCTG TCGGGCCCGG CCCCGCGCTT CGACCGCACC 
CCGGGCGGGG TCACCCGGGG CGCCGAGCAG CCCGACACCG CGCGGACCCT CCGGGAGTGG 
GGCCTCACCC CCTGA

Protein sequence

MGPLNGIRVV EFTGIGPAPM AGMLLADLGA SVIRLDRPAA ADAMNSGAGG PHLSEGRTVL 
PADLKSEEGL ALARDLASRA DVLLEGFRPG VMERLGLGPE VCLEANPRLV YARVTGWGQD 
GPLARAAGHD MNYISVNGAL HAIGRAGGPP VPPVNLLGDF AGGTMFAVTG VLGALVERQS 
SGRGQVVDAA MVDGSALLMS MLHEDRARGS WSDERGTNYL DTGAPWYDVY ECADGRYVSV 
GCIEPQFYAA FLEGTGLAGE DLPDQWDRSG WPRLRERFAE VLRTRTRDAW GEVFEGADAC 
VMPVLSLEEA PDHPHVRARG SLVRDGDRIL SGPAPRFDRT PGGVTRGAEQ PDTARTLREW 
GLTP