Gene Noca_2097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2097
Symbol
ID	4595542
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	2240408
End bp	2241820
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	72%
IMG OID	639776700
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_923293
Protein GI	119716328
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00213522
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGAGC GCTACGACGT GATCGTGGTC GGGGCCGGGA CCTCGGGCCT CAACCTGGCC 
CGCGAGCTGG CGGCCGGCGG CCTGCACTGC CTGGTCCTGG AGGCGGGTGG CCGCTACGAC 
CGGCACACCT ACCCCCGCAC CGAGGTCGAC GGCTCGGCCC AGCTGTTCTG GGGCGGCGGC 
CTGGAGCTCA ACGCCGATGC GTCGCTGGCG ATCCTGCGCC CGAAGGTGGT CGGGGGCGGC 
TCGATCGTGA ACCAGGCGCT GATGGACCGG TTCGACGACG TCGCGCTCGA CGACTTCCGG 
GCGGCGAGCG GCGTCGACCT GTTCACCGAG ACCGCGATGG CGCCGTACTA CGACCGTGCC 
GAGGCCACCA TCTGCCTGCA GACGGTGCCC GAGCGGCACC GCAACGGCAA CGCGACGATC 
TTCGCCGAGG GCTTCAGCCG CAACGGCTAC CGGCACGCGC CGCTGCGGCG CGCCCAGTCC 
GACTGCCGCT TCGAGGACGG CAACTCCTGC ATCGAGTGCC TCTCGGGCTG CCGGATCGAC 
TCCAAGCAGT CCACCGCGAT CACGGCCCTG CCCGCGGCCG AGCGGCACGG CGCCGTGCTG 
CTCGCCGACG TCGAGGTGAC CCGGGTCGCC GAGCGTCCCG ACCGGGTGAG CGTGACCGGC 
CTGGTCGGCA AGCCCGGCAG CACGCGCACC GAGCAGACCT GGACGGCCGC CCGGCTGGTG 
CTGGCCGCCG GGGCGATCGG GAACTCGCGG CTGCTGCTGT CCTCCGGGTT CGGCGCGGAG 
CTGCCCGCGC TGGGGCGGAA CTTCTTCACC CACCCGCAGT ACATGAACTT CGGCGTCTTC 
GACGAGCCGG TCCGGGCGCA CTCGGGACCG CTGCAGAACT ACAAGTCCGC CGATCCAGGG 
TTCCGCCGAC AGGGGTTCAA GCTCGAGAAC GTGTTCGCCG GGCCGTCGTC CATCGCGATG 
CTGATGCCGG GGTTCGGCGC GGCGCACCTG GCGCTGATGC GCCGCTACGA CCACCTGGGG 
TGCATCGAGG TGTGCGTGCG CGACACCACC CCGGGCCGGA TCCGGCTCAA CCGCAAGGGC 
GCCGTGGTGA TCGAGAAGCG GCTCGGCGCC GAGGACCTGC GTCGCCGCGA CGCCGGCGCC 
GCGGCGATCC GGAACATCTT CTTGTCCATG GGTGCGCGCC GGCTGGTCGA GGGCGACCTG 
GGGATCGGGC TGCACCTGAT GGGCGGCTGC GCGATCGGGA CCGATCCTGC CCGCTCGGTC 
GTCGACCCCG ACTTCACCCT GCACGGCAGC CGGCGCATCC ACGCCGCCGA CTCGAGCGTG 
TTCCCGAACG CACCGGGGAT CAACCCGGCG CTGACCATCG CCGCGCTCTC GATCCGGGCC 
GGCGAGTCGA TCCTGGCCGC GGCGCGGAGA TGA

Protein sequence

MTERYDVIVV GAGTSGLNLA RELAAGGLHC LVLEAGGRYD RHTYPRTEVD GSAQLFWGGG 
LELNADASLA ILRPKVVGGG SIVNQALMDR FDDVALDDFR AASGVDLFTE TAMAPYYDRA 
EATICLQTVP ERHRNGNATI FAEGFSRNGY RHAPLRRAQS DCRFEDGNSC IECLSGCRID 
SKQSTAITAL PAAERHGAVL LADVEVTRVA ERPDRVSVTG LVGKPGSTRT EQTWTAARLV 
LAAGAIGNSR LLLSSGFGAE LPALGRNFFT HPQYMNFGVF DEPVRAHSGP LQNYKSADPG 
FRRQGFKLEN VFAGPSSIAM LMPGFGAAHL ALMRRYDHLG CIEVCVRDTT PGRIRLNRKG 
AVVIEKRLGA EDLRRRDAGA AAIRNIFLSM GARRLVEGDL GIGLHLMGGC AIGTDPARSV 
VDPDFTLHGS RRIHAADSSV FPNAPGINPA LTIAALSIRA GESILAAARR