Gene Francci3_1195 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1195
Symbol
ID	3903469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1427235
End bp	1428560
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	61%
IMG OID	637878526
Product	putative transcriptional regulator
Protein accession	YP_480302
Protein GI	86739902
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAACG AGGGGTTCGC GGCTCACCTA GGCGTAGCCG CTCGGACCGT CGCCAACTGG 
CGGGCACGTC CAGAGGTCGT GCCGCGGCCT GCCGCTCAGG AAATCTTGGA TGCCGCGTTG 
GCGCGCGCGC CCTTCAACGT CCGGGAGCAA TTCCGGATGC TGCTGTCCGC CGACGGTCGG 
CGGGCAGATT CTCGGGAGAC TTCCAGCGAG AATAAAAATC AGGCAGAGGT TGACGCCAGC 
CCTACGGGGC TATGGACTCC GGACGGTACA CTATCGGCAG TAGCCGAAGT CTCGGAGGGA 
AGTCCAATGG ACCGAAGGCA ATTTCTTGTT CTTTCGGGTT CCACCCTCAC CTCTCCTGCA 
CATGAATGGC TCATTGCGCG GCCATCGAAC GATCTTTCGA GTCAATCAGG GAGATTCGTT 
GGAACATCGA TCGTGGACAA CCTGCGCCGT ATCACAGACG AGCTTCGCCG CATGGACGAC 
CAGATCGGGA GCGGCCCCCT GGTGCAAGTA GTCCGCAGCC AGGCATCCTA TGTCACCGAC 
CTTCTGAAGA ACGGCCGCTA CACCGACTCG GTGAGCCGAG ACCTTTACGG AATGCTTGCC 
GAGCTTCTGC GCCTGGCGGG GTGGCTCTCG TTTGACGCGG GGCGCCACGG TCAAGCGCAA 
CGCTTTTTCA CCGCAGGGCT GCGCAGCGCC CACACCGCCG GAGACCGCGC GCTCGGCGCG 
AACATCCTCG GGTTCATGAG TTGCCAGGCG AAGGACATCG GCCAGTTCAC CGAGTCAGCG 
AGATTCGCAG ACAGCGCGAG AACAGGCTAC GCCGGTACCA GCCCGACAGT TTCGGCAATC 
CTGAACATGA GGGCCGCCCA GGCGTACGCG AACCTGAAAG ACGCGGTCGA GACGCGCCGG 
GCAATCGATG CCGCCTTCGA CGTCTTCGGC GGAAATCCTC CCGGTCACGG AGAACCACCG 
TGGTCCTACT GGTTCAATGA GGCTCAGATG AATGAGCAGG TTGGCTACTG CTACATGCGC 
CTTGGGGATT GGGAGCGTGC CCGCGACCAC CTGTCCCTGT CTACCGGTGT TACAGGAGGT 
CCAGACACTC GGGAAGGGGC TTTGCGTCAA GCCCTGTTGG CTGACACCTA CGCTCAACAG 
GGTGATCCGG ACAGTGCATG CGCAATTGGC AACCAGGCGA TTGACGCTCT CACGAATGAG 
GTTGATTCAG CGCGCTGCGT CGGGCACGTA AAGCAGGTAA GACAGCATCT TGTACCGTAT 
CACAGATTGT CGGTGGTGCA GGAATTTAAC GAGCGAGTAG AGGCCCTCTC CAAATCAATC 
ACCTGA

Protein sequence

MSNEGFAAHL GVAARTVANW RARPEVVPRP AAQEILDAAL ARAPFNVREQ FRMLLSADGR 
RADSRETSSE NKNQAEVDAS PTGLWTPDGT LSAVAEVSEG SPMDRRQFLV LSGSTLTSPA 
HEWLIARPSN DLSSQSGRFV GTSIVDNLRR ITDELRRMDD QIGSGPLVQV VRSQASYVTD 
LLKNGRYTDS VSRDLYGMLA ELLRLAGWLS FDAGRHGQAQ RFFTAGLRSA HTAGDRALGA 
NILGFMSCQA KDIGQFTESA RFADSARTGY AGTSPTVSAI LNMRAAQAYA NLKDAVETRR 
AIDAAFDVFG GNPPGHGEPP WSYWFNEAQM NEQVGYCYMR LGDWERARDH LSLSTGVTGG 
PDTREGALRQ ALLADTYAQQ GDPDSACAIG NQAIDALTNE VDSARCVGHV KQVRQHLVPY 
HRLSVVQEFN ERVEALSKSI T