Gene Francci3_3023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3023
Symbol
ID	3904376
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	3589046
End bp	3589804
Gene Length	759 bp
Protein Length	252 aa
Translation table	11
GC content	73%
IMG OID	637880343
Product	phosphoribosyl isomerase A
Protein accession	YP_482109
Protein GI	86741709
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0106] Phosphoribosylformimino-5-aminoimidazole carboxamide ribonucleotide (ProFAR) isomerase
TIGRFAM ID	[TIGR00007] phosphoribosylformimino-5-aminoimidazole carboxamide ribotide isomerase [TIGR01919] 1-(5-phosphoribosyl)-5-[(5-phosphoribosylamino)methylideneamino] imidazole-4-carboxamide isomerase/N-(5'phosphoribosyl)anthranilate isomerase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.139685
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGCTTA CTCTGCTGCC CGCCGTGGAC GTGGCCGACG GCAGGGCCGT CCGACTCGTC 
CAGGGCGAGG CCGGTTCCGA GACCTCGTAC GGCGACCCGC GGGAGGCGGC GCTGACCTGG 
CAGCGCGACG GCGCCGAGTG GATCCACCTG GTCGATCTCG ACGCTGCCTT CGGCCGGGGG 
TCGAATCGGG AGCTCATCGC CGAGGTGGTA CGCGCGGTGG ACGTGGCCGT CGAGCTCTCC 
GGCGGCATCC GCGACGACGC ATCGCTCGAC GCGGCGCTGG CCACCGGCGC GGCCCGGGTC 
AACATCGGCA CGGCTGCGCT CGAGGATCCC GACTGGGTCC GCCGGGCCAT CGACCGGGTC 
GGTGACCGTA TCGCGGTCGG TCTCGACGTC CGGGGGACCA CGCTGTCGGC CCGGGGCTGG 
ACGCGGGACG GTGGCGAGCT GTTCGATGTG CTCGCCCGCC TCGACGCCGA CGGCTGCGCC 
CGGTACGTGG TGACGGATGT GCGCCGAGAC GGCACGCTCA CCGGGCCGAA CGTCGAGCTC 
CTGCGCTCCG TGACCGCGGC CACCAGCCGG CCGGTGGTCG CCAGCGGCGG CGTGGCCACG 
CTCGACGACC TCACCGCGAT CGCCGTGGTG CCCGGAGTGG AGGGCGCGAT CATCGGCAAG 
GCGCTCTACG CCGGCGCCTT CACGCTGCCC GAGGCCCTGG CCGTTGCCGG GAATATCGGG 
AATATCGGAA ACGGATGTGC GGGTGCGGTG GGTCGATGA

Protein sequence

MTLTLLPAVD VADGRAVRLV QGEAGSETSY GDPREAALTW QRDGAEWIHL VDLDAAFGRG 
SNRELIAEVV RAVDVAVELS GGIRDDASLD AALATGAARV NIGTAALEDP DWVRRAIDRV 
GDRIAVGLDV RGTTLSARGW TRDGGELFDV LARLDADGCA RYVVTDVRRD GTLTGPNVEL 
LRSVTAATSR PVVASGGVAT LDDLTAIAVV PGVEGAIIGK ALYAGAFTLP EALAVAGNIG 
NIGNGCAGAV GR