Gene Francci3_3490 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3490
Symbol
ID	3905224
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4160937
End bp	4162076
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	77%
IMG OID	637880812
Product	molybdopterin-guanine dinucleotide biosynthesis protein A-like
Protein accession	YP_482572
Protein GI	86742172
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0746] Molybdopterin-guanine dinucleotide biosynthesis protein A
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.5944
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTGGCCG GGGGTGGGGC GCGCCGGCTC GGCGGCCGGG ACAAGCCGGC GGTGATGGTC 
GGCGGTTCCA CCCTGCTCGA GCGGGTGCTG TCCGCGGTGT TGGACGCCGA ACGGGTGGTC 
ATCGTCGGTC CCCGGCGCGA CCTGGCCGTC GATCCGATTC CGCCTGGTCG GGTGCGCTGG 
TGTCGGGAGG ATCCGCCCGG CGGGGGACCG GTCGCGGCGA TCGCCGCCGG CCTTGTCGAG 
ATCACCACAC CGTTCGTCGC CGTCCTCGCC GCCGACCTGC CGTTCCTGAC CGGCCGGGAG 
ATCGCGCTGC TGCGCCGCGG GGTCGCGGAC CCCGCGGCGC AGGCCGCGCT GCTGGTCGAC 
CCGGACGGCC GCCGGCAGTT TCTGGCCGCG GTGTGGCGGA CGGCCTCGCT GTGGGCGGCG 
CTACCCGCCG ATCCGATCGG GCGCCCGGTG CGCGGCCTGT TCGCAGACCG TCCGGTGACC 
GCGGTCCGGG CGCACGCCCG GACCTGCCTC GACTGCGACG AACCGGCGGA TGTGGCGCGG 
GCCCGCAGCT GGGCCGCGGT GGGCGAGCGT GGCCCGGCCC GGCACGATAG GCCTATGACC 
TCCGCCGATG ACCAGCAGCC TGATCACCAG TCGTGGTCCG ATCATCGGGC TTCGGCGGAT 
CCGCCGCCCC CGGAGGCCGG ACGTCATCGC CCGCCGCCCC CGGAGGCCGG ACGTCATCGC 
CCGCCGCCCG CCGCGGCCGT CGGCTCGGGT GCCGGCAACG TTCGGGACAA GAACGTTCGG 
GACAAGAACC TCCTGGAGCG GGACGTCCTG GCGCAGTGGG TGTCGGACGT CTGCGCCGAG 
CTCGGCCTCG ACGCGGCACG GATCGACGTG GGCGCCGTCC TCGATCTCGC GCGCGACGTC 
GCCCACGGGG TCGCGCGTCC CGCGGCGCCA CTCACCGCGT TCCTGGTTGG TCTGGCCGCC 
GGCCGGAACG CGGGCGGTGC CCACGGTGAG GAGGGCGGAG GCGAGGGGGG TACGGATGGT 
GAGCGGGAGG CCGCGGCTGC GCGCGCGGCG ACGTCGGCCG TGCTCGGCCT CCTGGCGCGG 
GCGCGGGCGG GGACCGGACC CGCTCAGCCC ATCCGGCCCG GACCCGCCTC GTCGAGGTAG

Protein sequence

MLAGGGARRL GGRDKPAVMV GGSTLLERVL SAVLDAERVV IVGPRRDLAV DPIPPGRVRW 
CREDPPGGGP VAAIAAGLVE ITTPFVAVLA ADLPFLTGRE IALLRRGVAD PAAQAALLVD 
PDGRRQFLAA VWRTASLWAA LPADPIGRPV RGLFADRPVT AVRAHARTCL DCDEPADVAR 
ARSWAAVGER GPARHDRPMT SADDQQPDHQ SWSDHRASAD PPPPEAGRHR PPPPEAGRHR 
PPPAAAVGSG AGNVRDKNVR DKNLLERDVL AQWVSDVCAE LGLDAARIDV GAVLDLARDV 
AHGVARPAAP LTAFLVGLAA GRNAGGAHGE EGGGEGGTDG EREAAAARAA TSAVLGLLAR 
ARAGTGPAQP IRPGPASSR