Gene Francci3_0095 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0095
Symbol
ID	3902928
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	117015
End bp	118124
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	72%
IMG OID	637877425
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_479218
Protein GI	86738818
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.605031
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGTG GATTGAACTC GTACCGGGCG GCCGGGGTCA ACGTGGCCGC GGGCGAGCGT 
GCCGTCGAGC TGATGCGCGG TCACGTCGCG CGCGCGATCC GGCCCGAGGT CGTCGGTTCG 
CTCGGCGGAT TCGCCGGCCT GTTCGCGCTG GATACGGCGC GGTACCGTCG GCCGCTGCTC 
GCCTCGTCGA CCGACGGTGT GGGCACCAAG ATTGCCGTTG CCCGGGCCCT GGACACGCAC 
GACACCGTGG GCATTGATCT GGTCGCCATG GTTGTCGACG ACCTCGTGGT GTGCGGCGCG 
GAGCCGCTGT TCCTGCTCGA CTACATCGCG TGCGGCTCCC TGGTCCCCGC GCGCGTGGCC 
GAGATCGTCT CCGGCATCGC AACCGGCTGC GAGCAGGCGG GGGCGGCGCT GGTCGGCGGG 
GAGACCGCCG AGCACCCCGG GCTCATGGGT AGCGACGACT ACGACCTGGC CGCGACGGGG 
GTCGGGGTCG TGGAGGCCGA CGACGTGCTC GGGCCGGAGC GAGTCCGGCC CGGGGACGTG 
GTGGTCGCGA TGGCATCATC CGGCATCCAC TCCAACGGCT TCTCGCTCGT ACGGCATATC 
TTGTTCGGTC CTGTCGATTC TGGCCAGCCC GGTGGGATTC CCGAGACCGC GCGGGAGGAT 
CTGGAGGCAT ACGTCCCGTC CCTGGGGGGC ACGCTGGGCA CGTCCCTGCT GGTTCCGACC 
CGCATCTATG CTCGGGACTG CCTGGCGCTG GCCGCGGCTG TCGAGGTGCA CACCTTCGCC 
CACATCACCG GCGGCGGTCT CGCGGCGAAC CTCGCCCGGG TCATCCCGCC GGGCCTGCTG 
GCCACGGTGG ACCGGGCGTC GTGGTCAGTG CCCCCGATCT TCGGTCTGCT CGCCGAGCGC 
GGCGAGGTGA CCCAGGCGGA CATGGAAGCC ACCTTCAACC AGGGAGTCGG CATGGTGGCG 
GTCTTGCCGG CCACCGCGGT CGCCGACGCT CTCGCGCTGC TCGCCGCGCG GGACGTGCCG 
GCCTGGGTGG CAGGGGAGGT CGGCACGGCG GACGCTCCGG AGCCAGCCGG CGTGGCCAGG 
GCCCGGCTCG CCGGCCGGCA TCCACGCTGA

Protein sequence

MSGGLNSYRA AGVNVAAGER AVELMRGHVA RAIRPEVVGS LGGFAGLFAL DTARYRRPLL 
ASSTDGVGTK IAVARALDTH DTVGIDLVAM VVDDLVVCGA EPLFLLDYIA CGSLVPARVA 
EIVSGIATGC EQAGAALVGG ETAEHPGLMG SDDYDLAATG VGVVEADDVL GPERVRPGDV 
VVAMASSGIH SNGFSLVRHI LFGPVDSGQP GGIPETARED LEAYVPSLGG TLGTSLLVPT 
RIYARDCLAL AAAVEVHTFA HITGGGLAAN LARVIPPGLL ATVDRASWSV PPIFGLLAER 
GEVTQADMEA TFNQGVGMVA VLPATAVADA LALLAARDVP AWVAGEVGTA DAPEPAGVAR 
ARLAGRHPR