Gene Francci3_1251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1251
Symbol
ID	3903550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1495355
End bp	1496584
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	70%
IMG OID	637878585
Product	alkane 1-monooxygenase
Protein accession	YP_480358
Protein GI	86739958
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.10941
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGCAC CTGTCCTCAC CGCGCCCGGC GGCCTCGCCT GGCGGGACGG CAAGCGGTAC 
ATGTGGCTCA CCGCGATCAT CGTTCCGTTG CTGGCCATCG TGGGATACGG CCTGTGGCAT 
CGGACGGGTG TCGAGCTGCA CTGGTGGATC ACCCCGCTCT TCGTCTTCGT CCTGGTTCCG 
CTGCTCGACA TGACCACACC GCCGGATCCG GTCAATCCAC CGGAGGAGAT CCGGGCCGCG 
CTGGAGGCCG ACCGTTACTA CCGCCGGTGC ACGTATCTCT ACCCGCCGCT GGCGGGCGTC 
GGCCTGCTGC TGGGCGCCTC GGCCTGGACG AACGGCGACC TGTCGTGGTC CGCCCGGATC 
GGCGTGGTGG TGTCGGTCGG CACCGTGACC GGGGTGGGCA TCACCACCGC GCACGAGCTC 
GGCCACAAGC GGGGGATTTT CGAGCGCTGG TTGGCGAGGT TGATGCTGGC GCCGGCCGCG 
TACGGTCACT TCTCCGTAGA GCACAACCGG GGCCATCACG TGCGGGTAGC GACGGCGGCG 
GACCCGGCGA GCGCCCGGTT GGGGGAGAGC TTCTGGCGGT TCTGGCCGCG GACCGTCGTC 
GGCAGCCTGC GTTCCGCCTG GTCGCTGGAG GCCGCCCGGC TACGGTTGCG CGGCCGACGG 
GTCTGGTCGG TGCGCAACGA GGTCGTGCTT GGCTGGTTGC TCACCGCGGT GTTGTTCCTG 
GCGCTGGCCG TCGAGTTCGG GCCGGCTGTA CTCGTCTTCC TCGTCGCCCA GGCGGCCTTC 
GGGTTCACCT TGTTGGAGGG GGTCAACTAC ATCGAGCACT ACGGCCTGGC CCGGGAGCTG 
ACTCCGAGCG GGCGTTATGA GAAGGTCGAC CCCCGGCACA GCTGGAACAG CGACGCCGTG 
ATCAGCAATC TGGCGCTTTA CCAGTTGCAG CGACACAGCG ACCACCACGC CAACCCGACC 
CGGCGCTACC AGGCACTGCG GTCCTTCGAG GCCTCTCCCC AGCTACCGGC GGGGTACGCC 
ACGCTCCTGC TCGCGGCGTA TCTCCCGCCG GTGTGGTTTC GGGTGATGGA CGACCGCGTC 
GTCGAGCATT ACGGCGGGGA CGTCAGCCGG GCGAACCTGC ACCCCGCGCG CCGGGCCGCT 
TTGCTGACCC GGTACCGGTC GCCGTCCGGG CCGCCGCCGT CCGGTACCGA GGTCGACGGG 
TCTCCGTCCC GGGGCGGTGT TCGTGGGTGA

Protein sequence

MAAPVLTAPG GLAWRDGKRY MWLTAIIVPL LAIVGYGLWH RTGVELHWWI TPLFVFVLVP 
LLDMTTPPDP VNPPEEIRAA LEADRYYRRC TYLYPPLAGV GLLLGASAWT NGDLSWSARI 
GVVVSVGTVT GVGITTAHEL GHKRGIFERW LARLMLAPAA YGHFSVEHNR GHHVRVATAA 
DPASARLGES FWRFWPRTVV GSLRSAWSLE AARLRLRGRR VWSVRNEVVL GWLLTAVLFL 
ALAVEFGPAV LVFLVAQAAF GFTLLEGVNY IEHYGLAREL TPSGRYEKVD PRHSWNSDAV 
ISNLALYQLQ RHSDHHANPT RRYQALRSFE ASPQLPAGYA TLLLAAYLPP VWFRVMDDRV 
VEHYGGDVSR ANLHPARRAA LLTRYRSPSG PPPSGTEVDG SPSRGGVRG