Gene Francci3_2288 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2288
Symbol
ID	3904822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2668112
End bp	2669722
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	73%
IMG OID	637879619
Product	Fis family transcriptional regulator
Protein accession	YP_481385
Protein GI	86740985
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3829] Transcriptional regulator containing PAS, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00288923
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.000159352
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCCCAAA CTGAGACACG CGCGGCCGTG CCAGGGACGA GGCTGGCGCC TACGCTTATG 
ACCTGGATCA CAGCGGGGCT TTCAGGGAGT GTCATGCCCG ACGACGTCAT CCCGGCACGT 
GCCCGCGGGT TCGCGGCCGA GGCGCGCGCG GGGCGCGACC ACACCCGGTC GGACGTCTCC 
TGCCGGCTGA TGGCCTCCTG GCAGCGCAGC GAGGAGTACG GCGTCTCCCT CGACGACGTC 
GACCCGGTCT TCTCCGGCAC GATCGACCAG AGCTCGCTGT TCTACGACAG CGGCCGCGAG 
GTGCTGGCCA GCCTCCACCG GACGCTGGCC GCGGAGCCCG TCAGCCTGAT GTTGACCGAC 
GCGGACGGCT TGGTGCTCAA CCGTCTCAGC GGGGACACCA GCCTCCTGCG CGCGCTGGAC 
CGGGTCCACC TCGCGCCGGG CTTCTCCTAC GCCGAGCGGG TGGTGGGTAC GACGGGACTC 
GGGCTCGCGC TGGCGGACCG CGCCCCGTCC CTGGTGCGGG CCGAGGAGCA CTACGCCGTC 
GGGCTGTGCT GCTACACCTG CGCCGCGGCG CCGGTGCTCC ACCCAGGGAC CGGACGCCTC 
GAGGGCTCGG TCAACCTGAC GACCTGGTCG GAGTCGTCGA GCAACCTGCT GCTCGCGCTG 
GCTGAGTCCG CCGCGCAGCA CACGACGGAC CTGATGCGGT TGCGGTCCGG GGGCGTCACG 
GGTGGCCGCC CGCGCCCACG CGGCGAGGTG TTCCGGGTGG AAAGCCCGCG CGCGGAGCCC 
GGGGCCGGCA GTCTGCACGA CCTCTCCGGC TCCTGGCGCC GTGCGGTGTC ACTGGCAGAG 
GCGGGCCTGC GCGACGGGCG GGTCGTGGCC TGTGTCGGCG AGCCGGGCAG TGGCCGTACG 
ACGGCGCTCG CGCAGGCCCT GCGCCGGGCC TTTCCGCGCT ACCGCATCCT GGCCGCGAGC 
AACCCGGCAG CGGCGGACGT CGAGCCGTGG CTGTCCCTGT GGACCCCGGA GCTGACGAAG 
GCGAGCACGG CGGTCATCGT GCGCGACGTC GACCTGCTCC CCCTGTGGGT GGCCGAACAG 
GTGCGGGACC GGGTGCTCAG GGCCCGGGTC GAGGCGCGAT CGGGCGCAGC CGACCCGGCG 
GGCTGCCTAC CCTTCGTGAT CACGGTAGAG CGGTTCGAGG ATATCCCGGC CGCACTGCGC 
GCGATCGTTG ACGGGATCGT CCCGGTCGCA CCGCTGCGCC AACGGCCCGA GGACATCGGG 
CCGTTGGCGC GGGTGGCGGC CCTGCGGGCA CGGGGCCGCG AGGTGGATCT GACCCCGGCG 
GCCGAACGCG CCCTGTCCGA CCATCGTTGG CCGGGCAACG TCGAGCAGCT GATGCAGGTC 
GTCAAGAAAC TGGCTCGCCG CCACGACCCG ATCGACGTCG GACACCTCCC GGCCGAGGTG 
CTCTCGCACG GCCGCCACCG GCTGACGCGA CTGGAGACGT TCGAGCGGGA CGAGATCGTG 
CGGGCTCTGA ACGACCCGTC CCTCACCATG GCCGAGGCAG CCGAGCGGGT CGGCCTGAGC 
CGGTCCACGC TCTACCGGCG GATCGCCCAG TACGGCATCC GGGTCAGGTA G

Protein sequence

MSQTETRAAV PGTRLAPTLM TWITAGLSGS VMPDDVIPAR ARGFAAEARA GRDHTRSDVS 
CRLMASWQRS EEYGVSLDDV DPVFSGTIDQ SSLFYDSGRE VLASLHRTLA AEPVSLMLTD 
ADGLVLNRLS GDTSLLRALD RVHLAPGFSY AERVVGTTGL GLALADRAPS LVRAEEHYAV 
GLCCYTCAAA PVLHPGTGRL EGSVNLTTWS ESSSNLLLAL AESAAQHTTD LMRLRSGGVT 
GGRPRPRGEV FRVESPRAEP GAGSLHDLSG SWRRAVSLAE AGLRDGRVVA CVGEPGSGRT 
TALAQALRRA FPRYRILAAS NPAAADVEPW LSLWTPELTK ASTAVIVRDV DLLPLWVAEQ 
VRDRVLRARV EARSGAADPA GCLPFVITVE RFEDIPAALR AIVDGIVPVA PLRQRPEDIG 
PLARVAALRA RGREVDLTPA AERALSDHRW PGNVEQLMQV VKKLARRHDP IDVGHLPAEV 
LSHGRHRLTR LETFERDEIV RALNDPSLTM AEAAERVGLS RSTLYRRIAQ YGIRVR