Gene Franean1_6990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6990
Symbol
ID	5675301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	8512519
End bp	8513601
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	74%
IMG OID	641245836
Product	cobalamin synthesis protein P47K
Protein accession	YP_001511227
Protein GI	158318719
COG category	[R] General function prediction only
COG ID	[COG0523] Putative GTPases (G3E family)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.81769
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGTGC GGGTGCCCGT GATCGCGCTG ACCGGATACC TGGGTGCCGG CAAGACGACG 
GTGCTCAACC ACCTGCTCCA GGCCCCTGGG GCACGCCTTG GGGTCGTGGT CAACGACTTC 
GGGGCGATCA ACGTGGACGC CGCGCTGGTC TCCGGTCAGG TGGACCAGCC GGCCTCGATC 
GCGGGCGGCT GCCTGTGCTG CCTGCCGGAC ACGGACGGCC TGGACCAGGC GCTGGAGAAG 
CTGAGCCATC CCCGGCTGCG GCTGGACGCG GTGATCGTGG AGGCCAGCGG CGTCGCCGAC 
CCGCCGGCGC TGGCCAGGCT CATCCGGTTC AGCGGTGTGG ACCGCGTGCG CCCCGGCGGT 
CTCGTCGACG TGATCGACGC CCCCGCCTAC TTCGACACCG TCGACACGGG CGGGCTGCCG 
CCGGCCCGGT TCGCGTCCGC CTCGCTCGTC GTCATCAACA AGACCGACCG GATCCCGCCG 
GCGCGGCGTG CCGAGACGTT GGCGCGGATC ACCGGCCGGG TGCGCGAGAG CAACCCGCAC 
GCCCACATCG TCGACACGAC GCACGGCCGC GTCGACCCGG TGCTCGTGTT CGACGCCGCG 
AACCCGTACG ACCCGGTCGA CGAGCTCCCG CTCGCGGCCC TGGCCCGGCA CGACCACGAA 
GACGGTCACG ACCCGCACCC GCGGGTCGAC GCGGTGACCG TTCCCGCCGC CGGTCCGATC 
GATCCCGGCC CGCTGGTCGA CCTGCTCGAG GATCCCCCCG CGAACGTCTA CCGGCTCAAG 
GGCACCGTGA CCGTGGAGAC GGCGCGGGGA CCGCGCGGCT ATGTGGTCAA CGTCGTCGGA 
CGGGAGATCA ACGTCGCGAC CAGACCCGGC GCTGTCAGAC CCGGCGCTGC CAGGCCCGGC 
ACTGCCAGGC CCGGCACTGC CAGGCCCGCG GCGGACGATG CCAGCGGTCT GGTCGCGATC 
GGCATGCGTC TCGACCAGGC CGCCGTCCGC GCCCGTCTCG AGGCGGCCCT CCAGCCGTGC 
CCCGGTCGCC CCGCCGCGGA CGGGGTCCGC CGCCTCGCCC GCTACCGGCG CCTGAGCACC 
TGA

Protein sequence

MVVRVPVIAL TGYLGAGKTT VLNHLLQAPG ARLGVVVNDF GAINVDAALV SGQVDQPASI 
AGGCLCCLPD TDGLDQALEK LSHPRLRLDA VIVEASGVAD PPALARLIRF SGVDRVRPGG 
LVDVIDAPAY FDTVDTGGLP PARFASASLV VINKTDRIPP ARRAETLARI TGRVRESNPH 
AHIVDTTHGR VDPVLVFDAA NPYDPVDELP LAALARHDHE DGHDPHPRVD AVTVPAAGPI 
DPGPLVDLLE DPPANVYRLK GTVTVETARG PRGYVVNVVG REINVATRPG AVRPGAARPG 
TARPGTARPA ADDASGLVAI GMRLDQAAVR ARLEAALQPC PGRPAADGVR RLARYRRLST