Gene Francci3_3360 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3360
Symbol
ID	3905942
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	3988032
End bp	3989669
Gene Length	1638 bp
Protein Length	545 aa
Translation table	11
GC content	74%
IMG OID	637880683
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_482444
Protein GI	86742044
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0587927
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCCCAC CGGGCTACGG ACCGGCTCCC ACCCCGCAGG AGCTGGCGGA CGAGTACGAC 
ATCTGCGTGG TGGGCAGCGG GGCGGCGGGT TCGGTCGTCG CCTGGCTGCT CGCCCGGGCC 
GGGCTGTCGG TGGCCGTGGT GGAGCAGGGT GGGTTCGTCA CGGACGAGGA CAGCTACGAC 
GACGTGCTGG CCGCGGGGGA GTCCGCCTGG GTGCGGCAGG AGAACGGCAC CTGGGCCAAG 
GTGGGCTCAC CCTGGACGAC CTGCAACGTG GGTGGCGGCA CGCTGTTCTT CGGGGGGGTC 
CTGTTCCGCC ACCGCCCGCT CGACTTCGAC CCGGAGACCG TTCTGGGCCG GGCCGACCTG 
CCGCTGCGCT GGCCGCTTGA GCCGGCGGAG CTGACGGACT ACTACGACGC CGTCGAGGAT 
CTGATCGGCG TCGCGGGTGT CGCGGACGGC GACCCCAGCC TGCCGGTCCG GTCCAGGCCG 
TATCCGCTGC CCCCGGTGGC CACCACGGCG GAGGGGCGGC GGCTGACGGA GGCCGCGAGG 
TCCATGGGCT GGGCACCGTT TCCCACCCCC CTGGGCGTCA ACAGCATCGA GTACCGCGGT 
CGCCCGGTGT GCGCCGCGGA TGCCCCCTGC ATCTCACGGC GCTGCCCGAT CCACGCCAAG 
GGGGACGCGC TGGACCGCTT CCTGCGGCCG GCGATGGCCG CGGGCGCACG CCTGTTCACC 
GGGCTGAAGG CGGAGGCCCT GCTCGGGGAC GCGCGTCGCG ACGCCACCGC GTTGCGGTGC 
GTCCGGATGC CGGACGGCGA GCGCGTCGTC CTGCGGGCCC GGCACTTCGT GCTGTGCGCG 
AACGCCGTGC AGACTGCCGC GCTGCTGCTG CGTTCGACCA CCGTGCGGCA TCCGGCCGGG 
CTGGGCAACT CACACGACAT GGTCGGCCGG GGGCTCTGCT TCAAGATCGG TGAATATCTG 
GTCGGGTACT GCCACGAGCC GACCTCGGCG CCCGCCCGCA GCCGGCTGAT GGGCCTGGGA 
CCCATCTCCA CCTGCTGCGT GACCGACCTC TACCAGGACC CGGCGGCGCC GGGCGGGCTG 
GGTGGCCTGC TCTACGAGAA CCGGCCCGAG CGGACCTACC GGTTACGGGA CACCGAACAC 
CTGCTGCGGA TCGAGGCGCT GGTACCGGAC GAACCCCAAC CGGGCAACCG GGTCCGGCTG 
GGGCCGGGGA CCGACGCCCA CGGCGTGCCC GACGTCCTGA TGGACTACCA GGCCCATCCG 
CGCGACCTCG CCCGCTCCGA GTACATGCTC GGGCAGGGCG AGGCGCTGCT GCGGGCCGCC 
GGCTGCGACG TCATCGTGCG GGAGGCGTCC GGGTGGGCGC TCGGCAGCGG GCACCTGCAC 
GGCACCTGCC GCATGGGTGA GGACCCGGCC ACCAGCGTGA CCGGGCCCGA CGGCCGCCTG 
CACGACGCGG ACAACGTCTT CGTAGCCGAC GGCGGCCTGT TGCCGTTCCC CGGCGGGGTC 
AATCCGACGC TGACCATCCA GGCGCTCGCG CTACGGGTGG CCCATCGGCT CCTCGCGGAG 
CGCTACGCCA CCGGTCGCGT CCCGATCGGG GAACTGGTCG GGCCGAGCGT GACCGCGGCG 
AACCGGTCGC CGAGGTAG

Protein sequence

MVPPGYGPAP TPQELADEYD ICVVGSGAAG SVVAWLLARA GLSVAVVEQG GFVTDEDSYD 
DVLAAGESAW VRQENGTWAK VGSPWTTCNV GGGTLFFGGV LFRHRPLDFD PETVLGRADL 
PLRWPLEPAE LTDYYDAVED LIGVAGVADG DPSLPVRSRP YPLPPVATTA EGRRLTEAAR 
SMGWAPFPTP LGVNSIEYRG RPVCAADAPC ISRRCPIHAK GDALDRFLRP AMAAGARLFT 
GLKAEALLGD ARRDATALRC VRMPDGERVV LRARHFVLCA NAVQTAALLL RSTTVRHPAG 
LGNSHDMVGR GLCFKIGEYL VGYCHEPTSA PARSRLMGLG PISTCCVTDL YQDPAAPGGL 
GGLLYENRPE RTYRLRDTEH LLRIEALVPD EPQPGNRVRL GPGTDAHGVP DVLMDYQAHP 
RDLARSEYML GQGEALLRAA GCDVIVREAS GWALGSGHLH GTCRMGEDPA TSVTGPDGRL 
HDADNVFVAD GGLLPFPGGV NPTLTIQALA LRVAHRLLAE RYATGRVPIG ELVGPSVTAA 
NRSPR