Gene Francci3_4259 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_4259
Symbol
ID	3907226
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	5081099
End bp	5082178
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	69%
IMG OID	637881585
Product	DNA integrity scanning protein DisA
Protein accession	YP_483334
Protein GI	86742934
COG category	[R] General function prediction only
COG ID	[COG1623] Predicted nucleic-acid-binding protein (contains the HHH domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.321081
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGGAC CACCCGGAGA CGACATCTTC CGGGCGACAC TGGCCGCGGT CGCGCCCGGA 
ACCCCCTTTC GCGACGGCCT GGAACGCATC CTGCGCGGGC ACACCGGCGC ACTGATCGTC 
CTCGGCCACG ACAAGGTCGT CGAGGGTCTG TGCACCGGCG GCTTCGAGCT CGACGTGGAG 
TTCTCGGCGA CCCGGCTACG CGAGCTGGCC AAGATGGACG GCGCGATCGT GCTGTCGTCC 
GACCTGCAGC GCATCGTCCG CGCGGCGGTG CATCTGGTGC CGGATCCGAC GGTGCCGACA 
GAGGAGTCCG GCACGCGGCA CCGAACCGCC GAGCGGGTCG CCAAGCAGGC CGAGTTCCCC 
GTCATCTCGG TCAGCCAGTC GATGCACATC ATCGCGCTGT ACGTCGCCGG GCGGCGGTAC 
GTGCTGGACG GCTCGGCCGC CATCCTGTCC CGGGCGAACC AGGCCCTGGC TACCCTCGAG 
CGTTACAAGC TGCGGCTAGA CGAGGTCGCG GGCACCCTGT CCGCGCTGGA GATCGAGGAC 
CTCGTCACGG TCCGCGACGC GATCTCGGTG AGCCAGCGGC TGGAGATGGT GCGCCGCATA 
GCCGACGAGA TCGAAGGCTA CGTCGTCGAA CTCGGCACCG ACGGCCGGCT GCTGTCCCTG 
CAGCTCGAGG AGCTGATGGC CGGGGTCGAG ACCGAGCGTG AACTCACCGT CCGCGACTAT 
CTGCCGATCG GGTCGAAGGC GGGGACGCCC GCGCAGGTCC TGGGTGAGCT GTCCGCGATG 
TCTCCGACCG ACCTGCTCGA TCTCACCGTC CTCGCCCGGG TGATCGGATT CTCCGGCGGG 
GCGGACATCC TGGACCGGCA GATCAGTCCA CGCGGCTACC GCATGCTGGC GAAGGTGCCC 
CGGCTGCCAC GGATGGTGGT CGACCGGCTC GTCGACCATT TCGGCACCCT GCAGAAACTG 
CTCGCCGCCG GGGTCGACGA TCTGCAGGCC GTTGACGGCG TCGGGGAGAC CCGCGCCCGA 
GCGGTCCGCG AGGGCCTCTC CCGGCTCGCC GAGTCAAGCA TTCTCGAACG CTACGTATAG

Protein sequence

MAGPPGDDIF RATLAAVAPG TPFRDGLERI LRGHTGALIV LGHDKVVEGL CTGGFELDVE 
FSATRLRELA KMDGAIVLSS DLQRIVRAAV HLVPDPTVPT EESGTRHRTA ERVAKQAEFP 
VISVSQSMHI IALYVAGRRY VLDGSAAILS RANQALATLE RYKLRLDEVA GTLSALEIED 
LVTVRDAISV SQRLEMVRRI ADEIEGYVVE LGTDGRLLSL QLEELMAGVE TERELTVRDY 
LPIGSKAGTP AQVLGELSAM SPTDLLDLTV LARVIGFSGG ADILDRQISP RGYRMLAKVP 
RLPRMVVDRL VDHFGTLQKL LAAGVDDLQA VDGVGETRAR AVREGLSRLA ESSILERYV