Gene Francci3_2889 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2889
Symbol
ID	3906020
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	3404367
End bp	3405800
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	70%
IMG OID	637880210
Product	putative DNA-binding protein
Protein accession	YP_481976
Protein GI	86741576
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0241549
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.497135
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACAGGG CATCAGGCCG GTACTGCCGC TCCTGCGGGA GCCGTCTCGC CCGCGACAAC 
GCGGCCGGGT CCTGTGCCCC CTGCCAGCGC AAACAGGAGC AGCTGCGCCT TCAGGCCCCG 
GTGGTGCCTG ATCACTTCTG GCAGACCGAT GAACTACGCG ACGCCCTGGC CAGCTGGCAC 
ATGGGCCGGG TGATCGCCGC CTACCGCCGC AACCCCTGGC ACGGCCGGGT GCTGGCGCAG 
GAACTGGTTG GCGGCTGGGC CGACCTCTCC CAGGTGCAGC TATCCCGCAT CGAGTCCGGC 
CCGCCGATCA AGGACCTGGA CCGGCTGATG ATGTGGGCGC GCACCTTGCG CATCCCCGCT 
CATCTGCTGT GGTTCCAGCT CCCCGAGCAG CGCCCCGCAC CTGTAGCGGC GGCCCCGACG 
CCGCCGGTAC CCGCGGGGCC GGACCTGCCG GCGCTGCTGG GCAGCCTGAC GGCTGGGCGC 
CTCCCGTTGG CCGCCGGCGA GACCCGTAGC CCCACCATCG GCATTTCCGC CTTCGAGGGC 
ATGACTACGG GCCAGAGCGC CGAACTGCTG CTGCAATTGT TCTTGCAGCT TGACGACGAG 
TTGGGCGGCG ACAGCCTGTA TCTGCCCCTA TCCCGGTACG TGGCCCGGAT GGCCGTGACG 
GTGGAGCAGG ACCCCGGTGA TGGTTTGCTC GCTTTCGGCC AGCTCGCCCA GATGACGGGG 
TGGCTGGCGC TGGACGCTGA CCACCACGCC CAGGCCCGCC GCTACTTCAC CACCACCATC 
TACGTGGCCC ATGAGAGCGA CGAACCGGGC CTGGCCGCCA GCGCCCTGGG TTATATGAGC 
CTTCAGGAGA CCTACCGGGG GCGGCGGGGG CCGGCGCTGT CGCTAGCGCA AACCGCGCTC 
GCCTCCGGGA CGGCCGGGCT TACGCCGCTG ACCAAGACGA TGTTGGGTAC CCGCCTGGCT 
CGGGCCCAGG CCGGCGTTGG CGACCAGGAC GGCTGCCGCC GCACCTTGGA TGCCGCCCGT 
ACCGACTTCG AGGCCGCCGG CCACCGGGAC GAGCCCATGT GGGTGTCCTA CGTCGACGAG 
GTAGAGGTAG CCGCCCAGGA AGGCGCCTGC CTGCTGGAAC TGGGCCAAAC CGGCGAGGCC 
GCCTCGGCGC TGACGCAGGC CATTGGCCTG CTTACCCAGC GCACACCCCA CCGCATCCGG 
GACCAGGTGC ATTACCTGTC CCGGCTGGCG AAGTGCCACT TGAAGGCGGG CGACGTTGAG 
CAGGCCTGCC AGACGGCGGC CGATGCCCTC TCCCTGAGCG AAGCCATCGG CTCGACGCGG 
GTAGCTCTGC GCCTGAAAGA ATTTGCGGAC GGGCTTGAGC CCTTCGGCAC CGTGCCCGCG 
GCGCGGGACT TCGGCGAGCG GTTCCGCCTG GCGACCGCTG GCCCCGGCAG TTAG

Protein sequence

MDRASGRYCR SCGSRLARDN AAGSCAPCQR KQEQLRLQAP VVPDHFWQTD ELRDALASWH 
MGRVIAAYRR NPWHGRVLAQ ELVGGWADLS QVQLSRIESG PPIKDLDRLM MWARTLRIPA 
HLLWFQLPEQ RPAPVAAAPT PPVPAGPDLP ALLGSLTAGR LPLAAGETRS PTIGISAFEG 
MTTGQSAELL LQLFLQLDDE LGGDSLYLPL SRYVARMAVT VEQDPGDGLL AFGQLAQMTG 
WLALDADHHA QARRYFTTTI YVAHESDEPG LAASALGYMS LQETYRGRRG PALSLAQTAL 
ASGTAGLTPL TKTMLGTRLA RAQAGVGDQD GCRRTLDAAR TDFEAAGHRD EPMWVSYVDE 
VEVAAQEGAC LLELGQTGEA ASALTQAIGL LTQRTPHRIR DQVHYLSRLA KCHLKAGDVE 
QACQTAADAL SLSEAIGSTR VALRLKEFAD GLEPFGTVPA ARDFGERFRL ATAGPGS