Gene Francci3_3471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3471
Symbol
ID	3905205
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4137224
End bp	4139152
Gene Length	1929 bp
Protein Length	642 aa
Translation table	11
GC content	72%
IMG OID	637880793
Product	hypothetical protein
Protein accession	YP_482553
Protein GI	86742153
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.515969
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.494925
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGTGGGC GGGACGTGGG TGGGCGGGAC GTGGGTGGGC GGGACGTGGG TGGAGGTGCT 
GAGGCCAGGG CGGGGCAGCA CCGCGTCGGC CGTGGTCGCC GGCGTCACCG TGGTCGCCGA 
GCCCGGTACC GCCGGCTGGC CGCCGGGGTC GCGACGGCCC TCGTTGTGCT GGTGGCGATG 
ACCGCCTGGG TGGTCGTGCG CGGAGTGCTG GCCAAGTCCC GTCTCGACGA GGCCAGGCAG 
CGGATCGCCG TCCTGCAGCG GCAGGTTCTG AGCGGAGACT TTCCCCGCGA GGCCGAGCTG 
CGATCGCAGA TCGAGCAGAT CCGGCGGCGG GCCACCGCTG CGCGGGCCCT GACCTCGGAT 
CCGGTGTGGT CGGCGTTCGG GCGGCTGCCC GTCGCTGGCT GCCCGATGCG CTCGGCGGCG 
ACGCTGATCC GAGAGGTGGA CGCGGCCGCC GGCACCAGCC TGCCGGCCGT GGCCGACCTG 
GGTCCCTCCC TCGATCCGCG GGTGCTGCGC CAGCGTATGA CGATCAATGT CCGGGCGCTC 
GCCGCGGTCC GCCGCCCGGC CGAGCGATCC TTCAACGCCC TCTCCGCGTT GCGGGCGGCG 
GCGGAGAACG TACCGGACTG CGGATGGGCC GGGCGGGTCA GCGGCATCGC CGACGCCCGC 
GCCGAGATGA TCGATCGGAG CCGGCGCCTG GCCGGTGCGC TGGACACCGT TGTTCTGGCC 
GCCCGGGTCG GTCCCGAGAT GCTCGGCGGG GGCGGTGTCC GTCGCTACCT GCTGATCGTC 
CAGAACCCGG CCGAGTCCCG CGCCAACGGG GGGATCATCG GTGGGTTCGG CCTGCTGACC 
GCGGAGCACG GGCGGCTGTC CATCGACGGC ATCTCGGGCA ACGGTGCTCT GCCGGGAGGC 
CCCACCCAGC AGCGACCGGC GACGGGGCTG CCGGTCCCGT TCGCGGCCCG TTACGGCGCC 
TTCTGGCCCG ACCGTATCTG GGCGAATATC AACCTGACCC CCGACTATCC GATGGCCGGC 
AGGCTCTACA GCGCGTTCTA CCGGGCCGGC ACGGGCCTCG ACGTCGACGG CACGATCAGC 
CTCGACCCCA CGACGTTGTC GTATCTTCTC GCCGCGAGCC GGCCCGCGGT GCTCCCCGAC 
GGCACGTCGG TGGCCGCGGG GCACCTGGTC GATCTCGTCG AGTCGCGCGT CTATGGCGAG 
ATCATGGACG CGGCCGCCCG CGACCGCTTC TTCGCCCAGG TCGGTCAGGC CGTCTATGCG 
GCCGTGGAGT CGGGAGCCGG CGACACGACG AAGCTGGTGA CCGCGCTGGG ACGGGCCGCT 
CGCGAGGGTC GGCTGGAAAT ATCCAGCAAC CACGCCGAGG AGCAGCGGAT TCTTTCGTCC 
ACGGCGCTGG GTGGTGCGCT GCCGGACGCG CCTGGGCCGT TTCTCGGGGT CGTCACCCAG 
AACGCGACGG CGAGCAAGCT GGACTACTGG CTACGGCGGC AGACCACCTA CCGCATGCAG 
CGGCAGCCGA ACGGCGCCGG CCTGGCGACG ATCACGATCC GGCTCACCAA CGCCGCCCCC 
GGCGGGCTGC CGGCCTATGT GCGCCACCGG CAGGATCTCA AGGATGCCGC TGGGAATCTC 
CGGGCGCAGA ACAATCTCTG GCTCTCGGTG TACACGGGCC GAGGCAGCTG GCTCGTCGCT 
GCCCGGCTCG ACGGTGTGCC CATCGGCCTC GCCGGCGGTT CCGAGTCCGG GCATCCCGTG 
CTCTCCACCT ATCTCACCGT CGATCGCGGC CAGACCCGGA CCCTGGAAAT CAAGGTCCGG 
GAGCCGGTAG GCGGCCCGGC ACTCACCGTG CGTCCACAGC CGTTGCCCGT CGCGGAGCGC 
CTGGAGGTGC AGGGGCTACC GGTCGTCCCT CCCTGGTCAT CCCAAGGGTC GTCCCAAACC 
CAGAACTGA

Protein sequence

MGGRDVGGRD VGGRDVGGGA EARAGQHRVG RGRRRHRGRR ARYRRLAAGV ATALVVLVAM 
TAWVVVRGVL AKSRLDEARQ RIAVLQRQVL SGDFPREAEL RSQIEQIRRR ATAARALTSD 
PVWSAFGRLP VAGCPMRSAA TLIREVDAAA GTSLPAVADL GPSLDPRVLR QRMTINVRAL 
AAVRRPAERS FNALSALRAA AENVPDCGWA GRVSGIADAR AEMIDRSRRL AGALDTVVLA 
ARVGPEMLGG GGVRRYLLIV QNPAESRANG GIIGGFGLLT AEHGRLSIDG ISGNGALPGG 
PTQQRPATGL PVPFAARYGA FWPDRIWANI NLTPDYPMAG RLYSAFYRAG TGLDVDGTIS 
LDPTTLSYLL AASRPAVLPD GTSVAAGHLV DLVESRVYGE IMDAAARDRF FAQVGQAVYA 
AVESGAGDTT KLVTALGRAA REGRLEISSN HAEEQRILSS TALGGALPDA PGPFLGVVTQ 
NATASKLDYW LRRQTTYRMQ RQPNGAGLAT ITIRLTNAAP GGLPAYVRHR QDLKDAAGNL 
RAQNNLWLSV YTGRGSWLVA ARLDGVPIGL AGGSESGHPV LSTYLTVDRG QTRTLEIKVR 
EPVGGPALTV RPQPLPVAER LEVQGLPVVP PWSSQGSSQT QN