Gene Francci3_0259 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0259
Symbol
ID	3903667
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	299713
End bp	301281
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	73%
IMG OID	637877587
Product	CHAD
Protein accession	YP_479376
Protein GI	86738976
COG category	[S] Function unknown
COG ID	[COG5607] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.822007
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCAACG GAATCCGCGA GATCGAGCGC AAGTTCTCGG TCGAACCGAC CTTTGTGCTC 
CCGAAGTTGG GGGAGGTTGC GGGCGTCGCC ACCGCGCGCA CCCGCAAGAC CGTCAGCCTG 
GAGGCCGTCT ACTACGACAG CGACGATCTC CGATTGGCCC GTAACAAGAT CACGATACGG 
CGTCGGACCG GTGGGGCGGA CGCCGGATGG CACCTCAAGC TGCCCGTCCG GGTGGGGGAG 
CGGGACGAGC TCCAGCTCCC GCTCGACGCG GGCGTGGGCG TGGGCGTGGG GGCGGAGGGC 
CCGCGGTACA GCCCTCCCGC GGAGTTCGTC GATCTGGTGT CGGTCCATCT GCGCGGCGCC 
GAGCCGCGGC CGGTCGCCAG GCTGCGGACA CTGCGGACAG CGCGCCGACT GCGGGACACG 
GTCGGAGTCG ACCTGGCCGA GGTCGTCGAT GACCAGGTCT CCGCGCAGAC CCTGGGGGAG 
ACGACGGTAC TGAGCAGCTG GCGGGAGATC GAGGTCGAAC TCGTCAACGG CGGGCCCGAG 
GTGCTCGACG AGGTCGCCGG TCTGCTCACG GCCGCGGGCG CCACCCCGGC GGCGGACTCC 
TCGAAGCTCG CGCGGGTCCT GGGTGAGGCG CTGGCCGCCG GCCCCGGGCC GGACGTTCCT 
TCGCCGCCGC GCAAGCCACG ACGCGGGACG CCGGCGGGCG AGGTGGTACG GGCCTACCTG 
ATCGAACAGG CACGTGCCCT GCTCGCGGCC GATCCGCGGG TGCGGCTCGA CGAGCCCGAG 
GCGGTCCACA AGATGCGCGT CGCCTGCCGT CGGGCCCGCA GCACCCTGCG GACGTTCGCG 
CCGCTGTTCC CGCCCGAGAG AGCGCTCTTC CTGGACGGCG AGCTGCGGGA CCTCGCCGGC 
GCGCTCTCCG GCGCCCGCGA CGCCGAGGTC CAGGCCGCCT ATTTCGAGAC CCGCCTGGCG 
GAGCTGCCCA CCGAGCTGGT CGCGGGGCCC GTGCGCAAGA CGGTCACCGC GCACCTCGGC 
GCCGGCACGG CCAACGGCCG GGCGGAGGCG TTGGCCATGT TGCGCAGTGA CCGGTACTTC 
GCGCTCGTCT CCAACCTGCT CACCCTACTG CGGGGCCCGC TCACCCCCGC GGCGGCCCGT 
CCGGCCGGCA AGGCCCTCCC CGATCTGCTG CTCGGCGCCG ACCGGAAGCT GGCGAAGAAG 
GTCCGTGCCG CGAGCGCCCT GAAGGCCGGC TCGGAACGGG ACGAACTGCT GCATTCCGCC 
CGCAAGCAGG CCAAGCGGTT ACGGTACGCG GCGGAAGCCG TCGCACCGCT GTACGGGAAT 
GACGCGGCGC GGCTGGTCGA GCAGGCCCAG ATCGCGCAGG AGCTGCTCGG AACCCATCAG 
GACGCCACCA TCGCGCGCAG GCTGCTGGGG GACTGGGGGA CGGCAGCGCA GGCCCAGGGC 
GCCCCCACCG CGTTTACTCT GGGTGTCCTG CTGGGCCTGG AGGAGTGCCG GGCACGCATG 
GCGGAACGAG ACTTCTTCGA TGCGTGGCCC GCGATCTCGG CAGCCCGGCA CCGTCGCTGG 
ATCCGCTGA

Protein sequence

MVNGIREIER KFSVEPTFVL PKLGEVAGVA TARTRKTVSL EAVYYDSDDL RLARNKITIR 
RRTGGADAGW HLKLPVRVGE RDELQLPLDA GVGVGVGAEG PRYSPPAEFV DLVSVHLRGA 
EPRPVARLRT LRTARRLRDT VGVDLAEVVD DQVSAQTLGE TTVLSSWREI EVELVNGGPE 
VLDEVAGLLT AAGATPAADS SKLARVLGEA LAAGPGPDVP SPPRKPRRGT PAGEVVRAYL 
IEQARALLAA DPRVRLDEPE AVHKMRVACR RARSTLRTFA PLFPPERALF LDGELRDLAG 
ALSGARDAEV QAAYFETRLA ELPTELVAGP VRKTVTAHLG AGTANGRAEA LAMLRSDRYF 
ALVSNLLTLL RGPLTPAAAR PAGKALPDLL LGADRKLAKK VRAASALKAG SERDELLHSA 
RKQAKRLRYA AEAVAPLYGN DAARLVEQAQ IAQELLGTHQ DATIARRLLG DWGTAAQAQG 
APTAFTLGVL LGLEECRARM AERDFFDAWP AISAARHRRW IR