Gene Francci3_3973 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3973
Symbol
ID	3906933
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	4754237
End bp	4755577
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	73%
IMG OID	637881301
Product	FHA domain-containing protein
Protein accession	YP_483052
Protein GI	86742652
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.825925
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGGAC TGGACCGTTT CCGGGTGGTC GTGGAATCCG GGCGCGGAGA TCGGACGGGA 
GTGGTCGTCC GGCTGCCCGG CGCACTCATC GTCGCCTGTG CCGGCCGGGC GGAGACGGCC 
GAGACGACCA CCAGGCTGCT GGCGCTGTGC GCCGAGGTCG CTGCCGAGGT GGGCGCCACC 
GCGTCGACCA TGGGTCGCCG GCTGGTGCGT CGGGTCGCGG GGCTGCTGGC CGATGCCGAT 
CCGGATCGGG TGCCCGACTT CAGCCTGCTG ACCACGGTCA ATGACCGGGT CGCCGCGCTG 
GTCCACGGGG CGATGGACGT CGTCGCGACG GGCAGCTGCG GAGTGACGCT CTCCGGCGTC 
GACTCGGCCA CGTGGGTCGA CCGGCTACTG CCCACCGAGA TCAGCCGGAT CGACGTCGGC 
CCCACCGGCC TGGTCGGGCC GACGGGTTTC CCCGGCGGGC TCGGCGATCT CGGTTTCCCG 
CTTGACCTGC GCATCGGGGC CGTGCCCGGG ATCGGGGTGA GTCTGCTGCT CAGCGACACG 
CCGTCGCTGC CCGCGCCGAA GGCCTCCGCC GAGCAGCTGC TCGCCGGATT CGATCCGGTC 
CGGGAGCCGA TGACCGGCGC CGCGCCCATC CCCACGCCGG GAACCCGCGC CCCCGATCCG 
ATGCCGACCA CCCCGCCGGC GCTCGCCCCC CTGCTCAGCA AGGAGGAGGA GGCCCATCGA 
CGCCGCGCCG CCGCCGAACC GACGCAGGCG GCCGACCTCG ACGAGCTCGA CGAGCTCGAC 
GCCCTGACCC AGCTCCCGGG CCAGAGCTTC ACCGTCTCCG ACCTCATCGA GGACGACGAG 
GCACCGACGA TGCTGCCGAG CAGCGGCGAG CCTCAGGTCG AGGGTGTGCT GTGCGCCAAC 
GGCCACTTCA ACCACCCGCA GGCGCCGTAC TGCTCCGAGT GCGGCCTGTC GCTCGCCCAG 
CAGAACACCC GCACGGTCTG GGGTCCCCGG CCGCCCGTCG GCGTCCTCGT CTTCGACGAC 
GGCCAGACCA TGAACGTCGA CATGGACCTG GTGATCGGCC GCCAGCCGGA CCGCGACGAT 
GCGGTCCGGG CCGGGAAGGC ACGGGCGCTG CCGGTCGAGG ACGGTGAGAG CGCCGTCTCC 
CGGGTGCATG CCGTCATCAC CCTCAACGGT TGGGACGCGG TCATCACCGA CCAGGGTTCG 
GCGAACGGCA CCTACATCGC CCCGCCGGAG GCGACCGTGT GGACGCCGCT GAGCCCGCAC 
CAGCCGGCTC CCCTGATCCC CGGCACCCGC GTGCAGGTGG GCAAGCGGAC GTTCGTCTTC 
AACTCCCACC TGCACGTTTG A

Protein sequence

MAGLDRFRVV VESGRGDRTG VVVRLPGALI VACAGRAETA ETTTRLLALC AEVAAEVGAT 
ASTMGRRLVR RVAGLLADAD PDRVPDFSLL TTVNDRVAAL VHGAMDVVAT GSCGVTLSGV 
DSATWVDRLL PTEISRIDVG PTGLVGPTGF PGGLGDLGFP LDLRIGAVPG IGVSLLLSDT 
PSLPAPKASA EQLLAGFDPV REPMTGAAPI PTPGTRAPDP MPTTPPALAP LLSKEEEAHR 
RRAAAEPTQA ADLDELDELD ALTQLPGQSF TVSDLIEDDE APTMLPSSGE PQVEGVLCAN 
GHFNHPQAPY CSECGLSLAQ QNTRTVWGPR PPVGVLVFDD GQTMNVDMDL VIGRQPDRDD 
AVRAGKARAL PVEDGESAVS RVHAVITLNG WDAVITDQGS ANGTYIAPPE ATVWTPLSPH 
QPAPLIPGTR VQVGKRTFVF NSHLHV