Gene Francci3_2901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2901
Symbol
ID	3903965
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	3415734
End bp	3417299
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	71%
IMG OID	637880222
Product	hypothetical protein
Protein accession	YP_481988
Protein GI	86741588
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0623331
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.318501
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAACAT CATCCGCACC GTTGCGCTGG ACCACCCGAT GCGTCATCGC GGGCGGTGGG 
CCGGCGGGGA TGATGCTCGG TCTGTTGCTG GCCCGCGCAG GGGTGGACGT CATCGTGCTG 
GAAAAGCACG ATGATTTTGC CCGTGACTTC CGCGGTGACA CGATTCACCC GTCCACGATG 
GCAGTGATGG CGGAGCTGGG CCTGCTGACG GACTTCCTTC GCATCCCGCA CACCCGGGCC 
GCCACGCTGG CTTTGGATAT GGCGGGCCGG CGCCGGACCG TTGTGGACTT CCGGCACCTG 
CGGACGCCCT GCCCGTTCAT CGCCCTGATG CCCCAATGGG ACTTTCTCAC GTTTCTGGCC 
GAGCGGGCCG GTGCCTATCC GACGTTCCGC CTGGCGATGA GCACCGAGGC GACCGACCTG 
GTCCGGGCGA ATGGACGGGT CGTGGGCGTG CGCGCGGCCG GCCCCCTCGG GGAGGTCGAG 
ATCCGGGCGG ATCTGACGGT GGCCGCCGAC GGCCGGCACT CGACCCTGCG GTCCCGTGCC 
GGCCTGCCGG TGCGGGAGCG CGGCGCTCCC TTCGACGTCC TCTGGTTCCG GCTGCCGAAA 
GACATGGGTG ACAGGTCCGC GAGCGGCCGC CGGGCGGCGA GGGACGGGAA CGGGAACGAG 
GAGGGGAACG GGCGTGGGGA GGAGAAGGGG AACGAGCGTG GGGAGGAGGG AAACGGGGAC 
GGATTCACCC TGGCGCACCT CCGCAAGGGC CACGCCCTGA TCACCCTGGA TCGACGCGAC 
TACTGGCAGT GCGGCATGGT GGTCCGGAAG GGGTCGGCGC AGCGGCAGCC AAGGACGGCC 
GGCGGGCTGG CGGCGTTCCG TGCGCAGATC ACCACCGCGG CGCCGGCGCT GTCCGGTGCC 
GTTGACGACC TCACCGACTG GGACCAGGTG AAGACCCTGG TGGTGCAGGT CGACCGGCTT 
CGCCGATGGT TCCAGCCGGG TCTGCTCTGC ATCGGCGACG CCGCCCACGC GATGTCCCCG 
GCGGGCGGCG TCGGGGTGAA CTACGCCGTC CAGGACGCGG TGGCGACGGC GAACCTGATG 
GCCGTGACGC TGCGGGCCGG GCCACCCGAG CCGGCCGAGC TGCGGCGGGT GCAGCGCCGG 
CGGACCTGGC CGGTCGTGCT CATGCAGATG ATCCAGGTCC GGCAGGGCGC CTTCCTGGTA 
CGCCTGTTGG GTGACGACGA GCGGCCAGCG CACGGCGGCA GCCCGTCGCG CCAGGTCGCG 
CGTGCCCCCC TGACGAACGC GACGACGAAC GCGACGGCAA GGACGATGAC GGGGGCGGTG 
CGGGCCGGGA TGTCCAACCT GGTGACGGCC ATGATGTCCT ATGGGGTGAC CGCCACGGCG 
GCGCCGCGGA TCGGGCGGGT GCTCGGGCGG GTACTCGGGC GGCTACTCGG GCGAGTCATC 
GGCATCGGAT TTCGGCCCGA ACACGTCCGC ACCCCCGACG TGTTCGCCGA GGATGCCGGA 
TACACCAAGA ATGCCGGATA CGCCAAGAAT GCCGGGTACG CCGAGGGCGT CGAGCGGGCG 
AGATGA

Protein sequence

MGTSSAPLRW TTRCVIAGGG PAGMMLGLLL ARAGVDVIVL EKHDDFARDF RGDTIHPSTM 
AVMAELGLLT DFLRIPHTRA ATLALDMAGR RRTVVDFRHL RTPCPFIALM PQWDFLTFLA 
ERAGAYPTFR LAMSTEATDL VRANGRVVGV RAAGPLGEVE IRADLTVAAD GRHSTLRSRA 
GLPVRERGAP FDVLWFRLPK DMGDRSASGR RAARDGNGNE EGNGRGEEKG NERGEEGNGD 
GFTLAHLRKG HALITLDRRD YWQCGMVVRK GSAQRQPRTA GGLAAFRAQI TTAAPALSGA 
VDDLTDWDQV KTLVVQVDRL RRWFQPGLLC IGDAAHAMSP AGGVGVNYAV QDAVATANLM 
AVTLRAGPPE PAELRRVQRR RTWPVVLMQM IQVRQGAFLV RLLGDDERPA HGGSPSRQVA 
RAPLTNATTN ATARTMTGAV RAGMSNLVTA MMSYGVTATA APRIGRVLGR VLGRLLGRVI 
GIGFRPEHVR TPDVFAEDAG YTKNAGYAKN AGYAEGVERA R