Gene Francci3_0404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0404
Symbol
ID	3903646
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	475165
End bp	476595
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	72%
IMG OID	637877733
Product	hypothetical protein
Protein accession	YP_479520
Protein GI	86739120
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCAGT GCAAGACCGG ATGGCATCTC GACGACGAAC CCCTTCCCGA CCCGGATCCG 
CCGTCCGACG ACGCCAAGGC ACTTGCCGTG CTGCGGGCGG ACCTGGAGGA AGCCCGCGGT 
GAGGTCCTGG CGGCCGGCGA CCTCGGGCAG GTCGGCGAGA TCGACGAACT GATCGGCCAG 
GTGGACCGGG AACTGTCAGA TCTGGGCGTG CGGGGCCGGA TCGCGCCGGC CGACCGGGAC 
CGGCCGCGCC GCGTCCGCTC GACCCGTCGT CGCCAGGATG CCCCCGATCT GCCCCGGCTG 
CCCGTTGAGC GGCGCACGGT CGGGCGGACG TTCACCGCGC CGGACGGGAC GGTGTGGCGG 
CCGTCGATGT TCCTGACCCT GACCTGTGCC TCGTACGGGC GGGTGCACTC CGACGGCACG 
CCGGTGGACC CGGCCTCCTA CGACTACCGG CAGGCGGCAC GGGACGCGAT CCACTTCCCG 
AAGCTGCTGG ATCGGTTCTG GCAGAACCTG CGCCGCGCGG TCGGCTGGGA TGTCCAGTAC 
TTCGCCGCGC TGGAACCCCA ACGGCGTCTC GCCCCGCACC TGCACGCCGC GATCCGCGGC 
ACCATCCCGC GGACCATGCT GCGGCTGGTG GCGGCAGCCA CCTACCACCA GGTCTGGCGG 
CCAGCGACGG ACCGGCCGGT CTACGACGAT CAGCATCTGC CCGTCTGGGA CGACACCATC 
GGCGCCTACC TCGACCCCGA CGCCGGCGAC CCGCTGCCCT CGTGGGATGC GGCGCTCGAC 
GCGATCGGTG AGGACGACGA ACCCGCGCAC GTCGTGCGGT TCGGTCCGCA ACTCCAGGCG 
GACGGGGTGA CGGCGAACTC GGTGAACACC GGCCGGATGA TCGGCTATCT CACCAAGTAC 
CTGACGAAGA CCCTCGACAC CTGTCACGAG ATCAGCAGTG ACCGGCAGCG GGCGCATGTG 
GAGCGGCTCG CCGATGCCCT GCGCTACGAA CCCTGCTCCC CGACCTGTGC GAACTGGCTG 
CGCTACGGCA TCCAACCCCG CAACCCCCGG CGCGGCCTCA CCCCCGGACG GTGCACCGGC 
AAAGCCCACC GGCGCGAAAC CCTCGGCTTC GGCGGCCGGC GGGTGCTGGT CTCCCGCCGC 
TGGTCTGGCA AGACCCTCAC CGACCACCGT CGTGATCGGG TCGTCTTTAT CCGCCAGCAG 
CTCGCGGCAC TGGGCGCCAC TGGCACCGGA CCGGCCGCGC CCGAGGACGA TCCGACCCGC 
ATCGCCTGGA CGCTGCTACG CCCCGGGGAC CCGGCCGCAC CCCGCCGCGA ACATCTGATC 
TTGCATGCCA TCGCCCAACG GCACGCCTGG CGCGCACAGC TCGGAATCGG CACCGAGGAA 
GGGGCCGGCG GGGATTCGGC AACAGGGCCG CCGCTGGCGG ACGCAGCCTG A

Protein sequence

MAQCKTGWHL DDEPLPDPDP PSDDAKALAV LRADLEEARG EVLAAGDLGQ VGEIDELIGQ 
VDRELSDLGV RGRIAPADRD RPRRVRSTRR RQDAPDLPRL PVERRTVGRT FTAPDGTVWR 
PSMFLTLTCA SYGRVHSDGT PVDPASYDYR QAARDAIHFP KLLDRFWQNL RRAVGWDVQY 
FAALEPQRRL APHLHAAIRG TIPRTMLRLV AAATYHQVWR PATDRPVYDD QHLPVWDDTI 
GAYLDPDAGD PLPSWDAALD AIGEDDEPAH VVRFGPQLQA DGVTANSVNT GRMIGYLTKY 
LTKTLDTCHE ISSDRQRAHV ERLADALRYE PCSPTCANWL RYGIQPRNPR RGLTPGRCTG 
KAHRRETLGF GGRRVLVSRR WSGKTLTDHR RDRVVFIRQQ LAALGATGTG PAAPEDDPTR 
IAWTLLRPGD PAAPRREHLI LHAIAQRHAW RAQLGIGTEE GAGGDSATGP PLADAA