Gene Franean1_0202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0202
Symbol
ID	5668627
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	249519
End bp	250583
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	71%
IMG OID	641239131
Product	phosphoribosylaminoimidazole-succinocarboxamide synthase
Protein accession	YP_001504575
Protein GI	158312067
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0152] Phosphoribosylaminoimidazolesuccinocarboxamide (SAICAR) synthase
TIGRFAM ID	[TIGR00081] phosphoribosylaminoimidazole-succinocarboxamide synthase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.160911
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.75146
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCCGG CGGCCGCCGG CATCCGCATC CCGACCAGGA CCCCGGGCCG GTCGCCCCGG 
CCCGGGTCCG CCGCCGGGCA ACCGAGCGGG GGCATCACGA AGAGGCACGT TGAGCGGGCG 
TCCCGGGCAG GAGGCTACCG GTACGGTCGG ACCATGCCGC TGACACATGA GGAGTTCGCC 
GGGCTGACGC ATCTCGGCTC GGGGAAGGTG CGTGAGCTGT TCGCGATCGG GGATGACGCG 
GTGCTGCTCG TGGCGAGCGA CCGGATCTCG GCCTTCGACG TCGTGCTGCC CACGGAGATC 
CCAGACAAGG GCGCGGTGCT CACCGGGCTC AGCCTGTGGT GGTTCGACCA GCTTGGTGAT 
CTCGTCCCGA GCCATGTGAT CAGTTCGAGT GTGGACGAGT ATCCGGCGGA ACTCGCGCCC 
TACGCCGAGC AGCTGCGCGG GCGCTCGATG CTGTGCCGCC GGCTCGACAT GGTCCAGATC 
GAGTGCGTCG CCCGCGGTTA CCTGACCGGC AGCGGTCTGA AGGACTACCG GCGCTCCGGC 
ACCGTCAGCG GCCATCCGCT CCCCGCCGGC CTGGAGGATG GCAGCAGGCT GCCGAACCCG 
ATCTACACGC CGTCGACGAA GGCACCGATC GGGGAGCATG ACGAGAACAT CAGCCGGGAC 
GACGCGGCCG GCCGGGTCGG CGCGGAGCTG GCGGCCGAGC TCGAGCGGCT CACCCTGCAG 
ATCTTCGGGC GGGCCAGCGA CCTGGCCGCC GAGCGCGGGA TCCTGCTCGC CGACACCAAG 
TTCGAGTTCG GCCACGACGC GGACGGCGTG CTGCGGCTCG CCGACGAGGT ACTCACCCCG 
GACTCGTCCC GGTTCTGGCC GGCGGACGCC TGGACGCCGG GCGGCACGCA GCCGTCCTAT 
GACAAGCAGT TCATCCGCGA CTACCTGGTC AGCACGGGGT GGGACCGCAA CCCGCCGGCA 
CCGGAGCTGC CCGACGACAT CGTCGAGTCG ACGCGCGCCC GCTATGTCGA GGCCTACGAG 
CGGCTGACCG GGATCTCGTT CAAGGATTAC CTGTCCACCG CGTGA

Protein sequence

MLPAAAGIRI PTRTPGRSPR PGSAAGQPSG GITKRHVERA SRAGGYRYGR TMPLTHEEFA 
GLTHLGSGKV RELFAIGDDA VLLVASDRIS AFDVVLPTEI PDKGAVLTGL SLWWFDQLGD 
LVPSHVISSS VDEYPAELAP YAEQLRGRSM LCRRLDMVQI ECVARGYLTG SGLKDYRRSG 
TVSGHPLPAG LEDGSRLPNP IYTPSTKAPI GEHDENISRD DAAGRVGAEL AAELERLTLQ 
IFGRASDLAA ERGILLADTK FEFGHDADGV LRLADEVLTP DSSRFWPADA WTPGGTQPSY 
DKQFIRDYLV STGWDRNPPA PELPDDIVES TRARYVEAYE RLTGISFKDY LSTA