Gene Nmag_3333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_3333
Symbol
ID	8826198
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	-
Start bp	3464092
End bp	3465279
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	65%
IMG OID
Product	L-carnitine dehydratase/bile acid-inducible protein F
Protein accession	YP_003481445
Protein GI	289582979
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCGCAC TTTCGAATCT GCGCGTGCTG GATCTGACGC AGGTCCTCGC GGGCCCGTAC 
TGTACGATGT TACTCGCGGA CATGGGCGCT GACGTGGTCA AAATCGAACG ACCTGGCGGC 
GACCTCATCC GCTCGAATCC GCCGTTCGTC GACGACCCCG AGAAGGAAGC CTACGGCGGC 
TACTTCCAGA GCGTCAACCG CGGCAAGCGC AGCATCGAAC TCGACTTCAA CGACGACGAG 
GACCGCGCGG ACTTCCTCTC GCTGGTCGAG GAAGCCGACA TCGTCGTCGA GAACTACCGC 
GCGGGCACGA TGGAGAAGTA CGACCTGGGC TACGAAACGC TCACCGAGTA CAACCCACAG 
CTGATCTACT CCTCGATCCG TGGCTTCGGC GATCCGCGCA CGGGCGAGAC GGACCGACAG 
GGCCAGCCCT CCTTCGACCT CATCGCACAG GCGCTCGGCG GCGTCATGGA GACCACCGGC 
CAGGAGGACG GCCCGCCGAC GAAGGTCGGC CCCGGTATCG GCGACCTCTT CACGGCCACG 
CTGAACTGTA TCGGCATCCT CGCCGCCGTC AACCACCGCG AGCAGACCGG CGAGGGCCAG 
TACGTCGACA CCGGGATGTA CGACTCCATG CTCAGCCTGA CCGAGCGCGC CATCTACCAG 
CAGTCTTACA CCGGCGAGGC ACCCTCCAGA CGGGGTAACT CCCACCCGAC GCTGTTCCCC 
TACGACGCGT TCGAAACCGC GGACGGTCAT ACCGTCATCG CCGCCTTCGG AACGAATCAC 
TGGAACGAAG TCTGTGACGC GATGGGCCGC GAGGACCTCG CCGAGGAGTA CCCCACCGCT 
GCGGAGCGCC TCGAAAACCG AGAGTCGCTG CGCGAGGAAA TCGCCGACTG GGCCAGCGGA 
CTGACCAACG ACGAACTCGT GGGGACACTC GAGGGCCGGG TCCCTGTCGC ACCGGTCCAG 
ACCACCGAGG AGATTTTCGA GGACCCGCAC GTCGAAACGC GAGAGATGCT CGTGCCGGTG 
GAACAGCCTG GAACGGACGA GGAAGTCGAG ATCGCGGGCT CGCCGATCAA GATGACCGAG 
ACGCCGCCGC AGCCACGTGG TCGCGCGCCG TTGCTCGACG AGCACCGGGA GGAGGTGCTC 
GGCTCGGATA AGGAAACGAC TGATGTGGAA CAGGCGGCTG ACGACTAG

Protein sequence

MGALSNLRVL DLTQVLAGPY CTMLLADMGA DVVKIERPGG DLIRSNPPFV DDPEKEAYGG 
YFQSVNRGKR SIELDFNDDE DRADFLSLVE EADIVVENYR AGTMEKYDLG YETLTEYNPQ 
LIYSSIRGFG DPRTGETDRQ GQPSFDLIAQ ALGGVMETTG QEDGPPTKVG PGIGDLFTAT 
LNCIGILAAV NHREQTGEGQ YVDTGMYDSM LSLTERAIYQ QSYTGEAPSR RGNSHPTLFP 
YDAFETADGH TVIAAFGTNH WNEVCDAMGR EDLAEEYPTA AERLENRESL REEIADWASG 
LTNDELVGTL EGRVPVAPVQ TTEEIFEDPH VETREMLVPV EQPGTDEEVE IAGSPIKMTE 
TPPQPRGRAP LLDEHREEVL GSDKETTDVE QAADD