Gene Franean1_0197 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0197
Symbol
ID	5668622
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	242234
End bp	243262
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	77%
IMG OID	641239126
Product	nicotinate-nucleotide pyrophosphorylase
Protein accession	YP_001504570
Protein GI	158312062
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0157] Nicotinate-nucleotide pyrophosphorylase
TIGRFAM ID	[TIGR00078] nicotinate-nucleotide pyrophosphorylase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.702249
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTGGCG GGCGGCCGGG GCCGCCGCTC GGCCCCGACC AGCTTTCGGC CGCCGTCCTC 
GCGGGGCTGA AGTCCGCGGG GCTGGAGGCG GCGGCGGTCC TCGACGTGAT CGGTCGGGCC 
CTCGCCGAGG ATCTTCCCGT GGCCACGTCC CCGCAGGTCA GCGGGGCGCC CCGGCCGGTG 
GATGAGGCAG CCCCGCCAGG TGGTGAGGCG GCCCCGCAGG TGGGCGAGCC GGCCTGGGCG 
GTCGATGCGA CGTCCGCGGC GACCGTGGAC GCGGCGCTGA CCAGTACCGG TTCCGTGGTC 
TCCCGGGCGG ACGGCGTGGT GGCGGGCGTG CCGGTCGCCG CGGCCGTGTT CGAGGTGCTG 
CTCGGCGCCG CGGTCACCGT GACGCCGACG CTCGCCGACG GGGACCGGGT CGTTCCGGGC 
ACGGAGGTGC TCCGGGTGCG TGGTCCCGTT CGTGGGCTTC TCACCGCCGA GCGGACCGCG 
CTCAACCTGC TCTGCCACCT CTCCGGGGTG GCCAGTGTGA CCCGGCTGTG GGCCGACGCG 
GTCGCCGGCA CCGGCGCGGC CGTCCGCGAC ACCCGCAAGA CCCTGCCCGG GCTGCGCGCG 
CTGGAGAAGT ACGCGGTGCG CTGCGGCGGC GGGCGCAACC ACCGGATGTC GCTGGCCGAC 
GCCGCTCTGG TCAAGGACAA CCACGTGATC GCGGCCGGCG GCGTGGCGGC GGCGTTCACC 
GCGGTGCGCG CCCGGTACCC GGACCTGCCC GTCGAGGTCG AGTGCGACAC CGTCGAGCAG 
GTCGTCGAGG CGGTCGGCGC CGGAGCCGAC CTGATCCTCT GTGACAACAT GTCCCTGGAC 
GAGCTGCGCG CGTCGGTCGC CGTCGCCCGG CCGGCCGGGG TCCTGTTGGA GGCGAGCGGC 
GGGCTCACCC TCGACGTGGC CGCCGCGGTG GCCGCCACCG GGGTCGACTT CCTCGCCGTC 
GGCGGGCTCA CCCACTCGGC GCCCGCGCTG GACCTCGGCT TCGACCTCGC GGTGCCGGCT 
CCCCGCTGA

Protein sequence

MSGGRPGPPL GPDQLSAAVL AGLKSAGLEA AAVLDVIGRA LAEDLPVATS PQVSGAPRPV 
DEAAPPGGEA APQVGEPAWA VDATSAATVD AALTSTGSVV SRADGVVAGV PVAAAVFEVL 
LGAAVTVTPT LADGDRVVPG TEVLRVRGPV RGLLTAERTA LNLLCHLSGV ASVTRLWADA 
VAGTGAAVRD TRKTLPGLRA LEKYAVRCGG GRNHRMSLAD AALVKDNHVI AAGGVAAAFT 
AVRARYPDLP VEVECDTVEQ VVEAVGAGAD LILCDNMSLD ELRASVAVAR PAGVLLEASG 
GLTLDVAAAV AATGVDFLAV GGLTHSAPAL DLGFDLAVPA PR