Gene Francci3_0496 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0496
Symbol
ID	3903016
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	580535
End bp	582106
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	72%
IMG OID	637877826
Product	integrase
Protein accession	YP_479610
Protein GI	86739210
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.772953
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGATACGG CGCGGGGCGT GCTCGCCGAG TTCAGCCACG CGAGCACGCC GACTCAGGAC 
TTGGTTCTCG CGGCGATCGA GGCTCGGCTT GAGCAGGAGC ACGGCCCGGG GGTGGTGCGC 
CTGCCGGGTC GGACCCGGGC GCGGGCCCTG CTGCGGGAGC TGAGCCGCGG CACCAGCGCG 
TTCGGTGGAG CCAAGGGCCG GCGGGAGATC GCGGGCCGCC CGGTGGCGCC TTACGGGAAG 
CTGCGGGCGC ACCGGCCGGG TGAGTACCTG CTGGTGGACA CGACCAGGTT GGACGTGTTC 
GCGATGGAGC GGGTGACGCT GCGCTGGGTG CAGGCGGAGC TGACGGTCGC GATGGACCGC 
TACGACCGGT GCATCACCGG GCTGCGGCTG ACCCCGGTGT CGACGAAGGC GGTCGACGCC 
GCGGCGGTGC TGTTCGAGTC GATCCGTCCG TTGCCGGAGC CGGCGGCGGG CTGGGTGGAT 
GTCCGCCCGC CCTATCACGG TGTTCCTGGG CGGGTGGTGG TCGATGTCGA GCGGCTCGTC 
GACGCCGGCG GCGTCCCGCT GTTGCCGTCG GTGGCGGCGG AGACCCTGGT GGTCGATCAT 
GGCCGGATCT ATCTGTCGGA GCATCTGCTG TCGGTCTGCC AGCGGCTGGG GATCTCGGTG 
CAGCCGGCGC GGGTCGCCCA GGCCACCGAC AAGGCAGCGG TCGAACGCTT TTTCCGCACG 
CTGCGCGAGC AGCTACTCGT CGCGCTTCCC GGCTACAAGG GCCCGGACGT CCACCACCGG 
GGCGCCGATG TCGAGGAGCA GGCGTTCTAC TTCCTCGACG AGCTCGAAGA ACTCATCCGC 
CAGTGGGTCG CGGACTGCTA CCACCGTCAG CCCCATGGCG GCCTCGTGGT CCCGGAGGTG 
CCGGGGCTGG CGGTGTCGCC GTTGGAGATG TTCGCCCACG GGGTGGCGCG GGCCGGTCAT 
CTCCAGGTGC CCGCGCGGGC GGACCTGGTC TTCGACTTCC TGGCGGTCGA ATGGCGCACG 
ATCCAGCACT ACGGGGTGGA GATCGGCGGG CTGCGCTACG ACGGGCCCGC CCTGTCGCCC 
TACCGCAACC GGACCAGCCC GCACACTGGC GTCCACGCGG GCAAGTGGCC GATCCGCGTC 
GACGCCGATG ACGTCAGCCG GGTCTACTTC CAGGACCCGG CCGACCAACG CTGGCATGTG 
CTGCGCTGGG AGCACGCCGA CGCCCTGGGC GGCCCGTTCA GCGCGGACGC GCTGGCCTAC 
GCCCGCCAGC TCGCCACCGC GACCGACCGG TTCCCCGACA CCCGCCGAGC ACTGGCCCGG 
CTGTTGGAAC GCTGGGACGC GGGCCTGGCC GGCAACCGGG CCGAGCGGCG CATGGCGGTG 
CGTCTGTCCG AACGGCGGCT GCGTCTCGTC GGCGACACGG CCGTCCCGGA CGAACCCGCC 
CCGGCGGTCG CCTCGCCCGA CCAGGACCGT TCGGCCGAGG AGACGGCGGG CGATGACGAC 
CGCGACGACG AGCTTGGCGC CCCGTTCCCT GGCGAAGACG ACTTCTACGC CGACGCGATG 
GAGATCGTGT GA

Protein sequence

MDTARGVLAE FSHASTPTQD LVLAAIEARL EQEHGPGVVR LPGRTRARAL LRELSRGTSA 
FGGAKGRREI AGRPVAPYGK LRAHRPGEYL LVDTTRLDVF AMERVTLRWV QAELTVAMDR 
YDRCITGLRL TPVSTKAVDA AAVLFESIRP LPEPAAGWVD VRPPYHGVPG RVVVDVERLV 
DAGGVPLLPS VAAETLVVDH GRIYLSEHLL SVCQRLGISV QPARVAQATD KAAVERFFRT 
LREQLLVALP GYKGPDVHHR GADVEEQAFY FLDELEELIR QWVADCYHRQ PHGGLVVPEV 
PGLAVSPLEM FAHGVARAGH LQVPARADLV FDFLAVEWRT IQHYGVEIGG LRYDGPALSP 
YRNRTSPHTG VHAGKWPIRV DADDVSRVYF QDPADQRWHV LRWEHADALG GPFSADALAY 
ARQLATATDR FPDTRRALAR LLERWDAGLA GNRAERRMAV RLSERRLRLV GDTAVPDEPA 
PAVASPDQDR SAEETAGDDD RDDELGAPFP GEDDFYADAM EIV