Gene Francci3_3007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3007
Symbol
ID	3905504
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	3567506
End bp	3568780
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	72%
IMG OID	637880327
Product	hypothetical protein
Protein accession	YP_482093
Protein GI	86741693
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.153123
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.294126
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTCTC GGTCCATGAC GTTTTCCGCT TCGGCCTCGT CCCCGCCGAC CCGTCCCGTG 
CGCTATCCCG GTTTCGACCC CGCGGTCCGC ATCGCCGGTC GCCAGGGGGG TGCGATCACC 
TACCGGCAGG CGATGGCCGC TGGGTTGACC CGCGGCCAGC TGCGCCAGCT CGTCCACTCT 
GGCCAGTGGA GCCATCCGGT GCGCGGTGTC TTCGTCGTAC CTCTCGGCCC GACGGAGCTC 
CCCGGCTCCG TCAACGACGT CCCGCGGCCG GGGGACCGGC GGCGCGCCGA GCATTCTGAA 
ATCCGGGAGA AGGAATCCGC CGGACTTGTC CGGAACGACG TCGCGCGCCG ACGAAGAAAG 
CGCCATGGTG CCATCACCGC GGGCCCCGGA CACGCGGCGT CGGTCGTCGG CGGTGAAAAT 
ACAACGCCGA TTCTCCCGGT CTTCTTCTCG CCATTTTCGG CACGGGTAAG GGCCGCGCTC 
ATCGGGCGTC CCCGAGCCGT CGTCTGCGGG ATCACCGCCG CCCGGCTCCA CGGTTTTCCG 
CTCGAGGTTC CGGAAAGCTC CGCCGAACCC GTGCACCTTC TTCTTCCGGC TCGGCAGACC 
CGGGCCCAGC CGCGCGGGAT CCGGCTGCAC TTCAGCGATC TCGACGTCGA CCAGCGCGTC 
GAGTTGGGTG GGATCCCACT CACCTCGCCG GAGCGGACGC TGGCGGATCT CGTGCTGGCC 
GCCCAGTCGC GTGAGGTGGC GGTCGCCCAC CTGGACGCAG CCCTGCACCG CGGCCTGGTG 
CCGAGCCTGG CGGGGGCACG GGCGGCCGCC GAGGGGCGGC GCGGTTTCCG GCAGACGACC 
GACTGGTGGT CGCTGGCCGA CGGCCGGGCC GAGACCCCCC TGGAGACCCG GCTGCGGCTG 
CTGTTGGCCG ACAACGGGCT CGCGCCCGTG GAATTGCAGT GGCCGGTCAT GGACGGGACC 
GGTCAGATCA TCACCCGGCT GGATCTCGCC TGGCCGGCGC AGCGACTCGA CGTGGAGGCG 
GACACCTTCT CGGCCACCAG CCCGCCGGCG ATGATCTACC AGGACCGTCA TCGCGGCAAC 
ATCCTCGCCG CGTTGCGCTG GACGGTGCTG CGCTTCAGCG TGGCCGACGT GACCTGGTAT 
CCGGAGCGGG TCGTCTCGGC GGTGACCCGG GTCCTGGCGG CGCGGGCGGC CGAGCGGGCC 
GAGGCGTCCA GAGCGGTCGC TGAGGCGTCC GCCGCCGGCA CAGCCGCGGT GGCTGAGCGG 
CTGTGGGCAT CGTGA

Protein sequence

MDSRSMTFSA SASSPPTRPV RYPGFDPAVR IAGRQGGAIT YRQAMAAGLT RGQLRQLVHS 
GQWSHPVRGV FVVPLGPTEL PGSVNDVPRP GDRRRAEHSE IREKESAGLV RNDVARRRRK 
RHGAITAGPG HAASVVGGEN TTPILPVFFS PFSARVRAAL IGRPRAVVCG ITAARLHGFP 
LEVPESSAEP VHLLLPARQT RAQPRGIRLH FSDLDVDQRV ELGGIPLTSP ERTLADLVLA 
AQSREVAVAH LDAALHRGLV PSLAGARAAA EGRRGFRQTT DWWSLADGRA ETPLETRLRL 
LLADNGLAPV ELQWPVMDGT GQIITRLDLA WPAQRLDVEA DTFSATSPPA MIYQDRHRGN 
ILAALRWTVL RFSVADVTWY PERVVSAVTR VLAARAAERA EASRAVAEAS AAGTAAVAER 
LWAS