Gene Francci3_1647 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1647
Symbol
ID	3905926
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1980051
End bp	1981583
Gene Length	1533 bp
Protein Length	510 aa
Translation table	11
GC content	70%
IMG OID	637878985
Product	glucose-6-phosphate 1-dehydrogenase
Protein accession	YP_480752
Protein GI	86740352
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0364] Glucose-6-phosphate 1-dehydrogenase
TIGRFAM ID	[TIGR00871] glucose-6-phosphate 1-dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.336303
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCGCCCA CGGTGAGTAC CAACCCGCTG CGGGACCCAC GTGACCGCAG ACTGCCGCGC 
CTGCCGGACG CGAGCGCCCT GGTGGTGTTC GGCGCTACCG GCGACCTGGC CCGCAAGAAG 
CTGATCCCCG CCGTCTACGA CCTGGCCCAC CGCGGCCTGC TGCCGCCGGG TTTCGTCCTG 
CTCGGGTTCG CCCGCCGGGA CTGGCCCGAC GAGGACTTCG CCGAGTTCGC CCGGCAGGCC 
GCCGAGAAGG GCGCCCGCAC CCCCTTCCGT GCAGAGGTCT GGGACCGGCT GGCGGGCTCC 
GTGCGGTTCC TGCCAGGGTC CTTCGACGAC GACGCCGCGT TCGACCGGCT CGCCCGCACG 
CTGGAGAGCC TGGAGCACTC CCACGGTATC CGTGGCAACG CGGCGTTCTA CCTGTCGATC 
CCGCCGTCGG CCTTCCCGGT CGTGCTCAAG CAGATGCAGC GCACCGGGCT CTCCTCGGCC 
GCGGGTTCGG GCGGCTGGCG CCGGGTCGTC GTCGAGAAAC CGTTCGGTCA CGACCTGGAG 
TCGGCCCGGC AGCTCAACGC GCTCGTCGAC GACGTCTTCA CCCCGTCCGG GGTGTTCCGC 
ATCGACCACT ACCTGGGCAA GGAGACGGTC CAGAACCTCT TCGCGCTGCG CTTCGCCAAC 
ACGCTGTTCG AACCGATCTG GAACTCCCAG TTCGTCGATT CGGTGCAGAT CACCATGGCC 
GAGGACGTCG GGATCGGCAC CCGGGCCGGC TTCTACGACG AGACGGGCGC CGCTCGGGAC 
GTGCTCCAGA ACCACCTGTT GCAGCTGCTC GCCCTGACCG CGATGGAGGA GCCGGTCAGC 
TTCGGCGCGG AGACCATCCG CACCGAGAAG CTGAAGGTGC TCCGCGCGGT GTCGCTGCCC 
ATGGACCTCA CTCGCTACGC GGTAAGGGGG CAGTACGAGC AGGGCTGGCT CGCCGGGGAG 
CGGGTCCCGG GCTACCTCGA CGAACAGGAC ATCCCTGCGC AGTCGCGGAC GGAGACCTTC 
TCGGCGGTGC GCCTCGGCAT CGAGACGCGC CGGTGGGCCG GGGTGCCGTT CTACCTGCGG 
ACCGGCAAGC GGCTGCCACG GCGGGTCACC GAGGTCGCCA TCTTCTTCAA GAAGGCGCCG 
CACCTGCCAT TCGACGAGAC CGCCACCACC GAGCTCGGCA ACAACCAGCT GGTCATCCGG 
GTGCAGCCCG ACGAGGGGGT CACGCTCAAG TTCGGCTCCA AGGTCCCCGG CTCGGCGATG 
GAGGTCCGGG ACGTCGCGAT GGACTTCCTG TTCGGTGAGG CGTTCACCGA GGCGCTGCCG 
GAGGCCTACG AACGGCTGAT CCTCGACGTG CTGCTCGGCG ACGCGACGCT GTTCCCGAAC 
AACGCGGAGG TCGAGGAGTC CTGGCGGATC GTCGATCCGC TGGAGCGGCA CTGGGCGGGC 
ACCACCCCGC ACCGCTACCG GGCCGGCACC TGGGGTCCGG CTGCCGCCGA CGAGATGCTC 
GCCCACGACG GTCGCCGGTG GCGGCGGCCA TGA

Protein sequence

MAPTVSTNPL RDPRDRRLPR LPDASALVVF GATGDLARKK LIPAVYDLAH RGLLPPGFVL 
LGFARRDWPD EDFAEFARQA AEKGARTPFR AEVWDRLAGS VRFLPGSFDD DAAFDRLART 
LESLEHSHGI RGNAAFYLSI PPSAFPVVLK QMQRTGLSSA AGSGGWRRVV VEKPFGHDLE 
SARQLNALVD DVFTPSGVFR IDHYLGKETV QNLFALRFAN TLFEPIWNSQ FVDSVQITMA 
EDVGIGTRAG FYDETGAARD VLQNHLLQLL ALTAMEEPVS FGAETIRTEK LKVLRAVSLP 
MDLTRYAVRG QYEQGWLAGE RVPGYLDEQD IPAQSRTETF SAVRLGIETR RWAGVPFYLR 
TGKRLPRRVT EVAIFFKKAP HLPFDETATT ELGNNQLVIR VQPDEGVTLK FGSKVPGSAM 
EVRDVAMDFL FGEAFTEALP EAYERLILDV LLGDATLFPN NAEVEESWRI VDPLERHWAG 
TTPHRYRAGT WGPAAADEML AHDGRRWRRP