Gene Francci3_0637 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0637
Symbol
ID	3903315
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	720954
End bp	722084
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	72%
IMG OID	637877970
Product	inosine 5-monophosphate dehydrogenase
Protein accession	YP_479750
Protein GI	86739350
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0516] IMP dehydrogenase/GMP reductase
TIGRFAM ID	[TIGR01304] IMP dehydrogenase family protein

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCAGAGG TCGAGATCGG CATCGGCAAG AGCGCGCGGA TCGCGTATGG TCTCGACGCC 
GTCGGCATCA TTCCGTCCCG TCGGACCCGT GACCCGGCGG ACGTCTCGCT CGCCTGGGAG 
ATCGACGCCT ACCGGTTCGA CCTGCCGCTC GTGGCCGCTC CGGCCGACGC GGTGACCTCA 
CCCGCGTCGG TGATCGCGCT CGGCCGGCTC GGTGGTCTCG GTGTTCTGCA CATCGAGGGG 
CTGTGGACCC GGTACGAGGA GCCGGAGAAC CACATCGCCG AGCTCAGCAA GATCGGGGCC 
GCCCAGGGCC CGGACGCGGC GACCGAGCGG CTGCGCGCGT TGTACTCCGC GCCGGTCCAG 
CCGGGGCTGA TCGCGCAGCG TCTCACCGAG CTTCGGGACG CGGGGGTGGT CGTGGCCGCG 
GCGCTGCGTC CGCAGAAGGT CAAGGCCCTG TGCCCGCACG TGCTGGCCGC CGGGATCGAT 
CTGCTCGTCA TCCACGGTAC GGCGGTCTCG GCGGAGCATC AGTCCCGCCG CAGCGAGCCG 
CTCAACCTCA AACGGTTCAT CGGCCAGCTG GACATCCCGG TGCTGGTTGG CGGGTGCGCG 
TCGTTCTCCA CCGCACTGCA CCTCATGCGC ACCGGGGCGG CCGGTGTCAT CGTGGGCGTC 
GGGTCCGGCT TCGGTGACCG CACCCGGGAC GAGCTCGGGG TCGGCGTGCC GCTTGCCACC 
GCGATCGCGG ATGCGGCCGG TGCGCGCATG CGTTATCTCG ACGAGTCGGG CGGCCGCTAC 
GTCCACGTCG TCGTGCATGG TGATCTTCGG ACTGGCGGCG ACGTCGCGAA GGCGGTGGCC 
TGCGGCGCGG ACGCGGTCAT GGTGGACGCG GCGCTCGCGG CCGCACGGGA GGCCCCGGGC 
CAGGGCGGGG CCTGGCCGAT GGACGTGCTG CACTCCGACC TGCCGCGGGG ACGCTGGTCG 
CCGGTGACCC CGACCGGGAC GCTCGCGCAG ATCGTGACCG GTCCGGGCAC GGCGACCAGA 
ACCGGTGTCC TCAACCTGGC CGGCGGTCTG CGCACGGCAA TGGCGACGAC GGGATACGCA 
ACTTTGAAGG AGTTCCAGAA GGCGGAGATC ATGGTGACCG CCGGTCCGTG A

Protein sequence

MAEVEIGIGK SARIAYGLDA VGIIPSRRTR DPADVSLAWE IDAYRFDLPL VAAPADAVTS 
PASVIALGRL GGLGVLHIEG LWTRYEEPEN HIAELSKIGA AQGPDAATER LRALYSAPVQ 
PGLIAQRLTE LRDAGVVVAA ALRPQKVKAL CPHVLAAGID LLVIHGTAVS AEHQSRRSEP 
LNLKRFIGQL DIPVLVGGCA SFSTALHLMR TGAAGVIVGV GSGFGDRTRD ELGVGVPLAT 
AIADAAGARM RYLDESGGRY VHVVVHGDLR TGGDVAKAVA CGADAVMVDA ALAAAREAPG 
QGGAWPMDVL HSDLPRGRWS PVTPTGTLAQ IVTGPGTATR TGVLNLAGGL RTAMATTGYA 
TLKEFQKAEI MVTAGP