Gene Francci3_1073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1073
Symbol
ID	3906416
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1278220
End bp	1279308
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	76%
IMG OID	637878407
Product	NHL repeat-containing protein
Protein accession	YP_480184
Protein GI	86739784
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0871328
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTGGATCG GCGCCCCGGC GCCCGGCGGG CTGGCCCTGC CGTCGGCGCG GCCGTCGGCG 
TCCCGGCTGT ACGCGCCGCG CGGGGTGTGG CTCGGCGACG ACCTGCTCGT GGTGGCGGAC 
TCGGGTAACC ACCGGGTGCT GATCTGGCAT GGTCTGCCGG CCGTCGACGG CGCCCCCGCC 
GACGTCGTGC TCGGCCAGGC CGACGCGACG AGCGAAGGGC CGGCGGCCGC GGGGCGCGGG 
CCCGAACGCG GCCTGCACCT GCCGACCGGC GTGCTCGTCA CGGATGGCCG GCTCGTGGTC 
GCCGATGCCT GGCACCACCG GGTGCTGGTC TGGAACGAGG TCCCGACGGT CACCGACACC 
GCCCCCGACC TCGTGCTCGG GCAGCCGGAC GCCGACGCCG TCCGCGAGAA CCGGGGCGGC 
CCGTGCGGAC CAGACACCTT CTACTGGCCC TTCGGGGTGG CCGTGGTGGG TGGGCGCTTC 
TACGTCGCCG ACACCGGTAA CCGGCGGATC CTGGGCTGGT CGAATGGCCT GCCGTCCTCG 
CCCGGCCGGC TACCCGACCT GGTGCTGGGG CAGCCCGATC CCACCCGCCG GGACGAGAAC 
CGTGGCGGCG CGGCCGGTCC GGCGAGCTTC CGGTGGCCGC ACGACCTCGC CGGCACCGCC 
GACCGGCTGC TGGTCGCGGA CGCCGGCAAC CACCGGCTGC TCGGCTGGGC CCCCCATCCC 
GACGCCGACG GCGACGCCGA TCTGGTGCTC GGCCAGCCCG ATCTCGCATG CTCCGGGGAG 
TTCCCCTACG CGCCCGGCCG GGCCGACGTC CTGCGCTTCC CCTACGCCGT CGACAGCTAC 
GGGCACCTGC TGGCCGTCGC GGACACCGCC AACAACCGCG TCCTGCTGTG GGAGGAGCTG 
CCGCGGCGCA GTTCCACGCC CGCGACCGGT GTGCTCGGCC AGCCGTCGTT CGCCGAGACC 
GGGGAGAACC GGTGGACCCG CGTCGAGGCC GACACCTTCT GCTGGCCGTA CGGCCTCTCG 
GTGCGCGGCG ACCGGCTCGC GGTGGCGGAC TCGGGCAACA ACCGGGTCAT GATCTGGCGG 
CGGGTATGA

Protein sequence

MWIGAPAPGG LALPSARPSA SRLYAPRGVW LGDDLLVVAD SGNHRVLIWH GLPAVDGAPA 
DVVLGQADAT SEGPAAAGRG PERGLHLPTG VLVTDGRLVV ADAWHHRVLV WNEVPTVTDT 
APDLVLGQPD ADAVRENRGG PCGPDTFYWP FGVAVVGGRF YVADTGNRRI LGWSNGLPSS 
PGRLPDLVLG QPDPTRRDEN RGGAAGPASF RWPHDLAGTA DRLLVADAGN HRLLGWAPHP 
DADGDADLVL GQPDLACSGE FPYAPGRADV LRFPYAVDSY GHLLAVADTA NNRVLLWEEL 
PRRSSTPATG VLGQPSFAET GENRWTRVEA DTFCWPYGLS VRGDRLAVAD SGNNRVMIWR 
RV