Gene Francci3_4187 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_4187
Symbol
ID	3907152
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4998542
End bp	4999633
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	68%
IMG OID	637881515
Product	biotin synthase
Protein accession	YP_483264
Protein GI	86742864
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID	[TIGR00433] biotin synthetase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGACA TGGACCTGTC AGCCACTCTG AACAGCCTTG TCAGCAAGGG GGTGAGTGGT 
CAGGCTCCGA CCCGGGACGA GGCCCTGGCC GTCCTGCGCA GTGACGACGA CGATCTCTTG 
GACGTCGTCG CCGCCGCCTA CCGGCTCCGG CGGAGGTACT TCGGCAGGCG TGTCAAGCTG 
AACTTTCTGG TGAACCTCAA GAGCGGACTC TGTCCGGAGG ACTGTTCCTA TTGCTCGCAG 
CGGCTCGGTT CGAACACGGG AATCCTGAAG TACACCTGGC TCAAGCCCGA GGAGGCCGCC 
GCGACGGCCG GCGCCGGCAT CTCGGGCGGT GCCCGCCGGG TGTGCCTGGT CGCGAGCGGC 
CGCGGGCCGA CGGACCGGGA CGTCGACCGC GTGGCGGACA CGATCGGCGC GATCAAGACC 
GCGCATCCGG ACGTGGAGGT GTGCGCGTGC CTCGGCCTGC TGTCCGACGG GCAGGCCGCA 
CAGCTGCGGG CGGCCGGTGC GGACGCCTAC AACCACAACC TGAACACGGC CGGTGAGAAG 
TACGCAGACA TCTGCACGAC GCACACCTAC AACGACCGGG TCGACACGGT GCAGGAAGCC 
AGGCACGCCG GCCTCTCACC CTGCTCGGGT ATCATCGCCG GCATGGGGGA GAGCGACGAG 
GACCTCGTCG ACGTCGCCTT CGCGCTGCGC GAGCTCGCCC CGGACTCCAT CCCGGTCAAC 
TTCCTCATGC CATTCGAGGG CACGCCCCTG GGGGCGGAAT GGAACCTCAA CCCCCGGCAG 
TGCCTGCGCA TTCTCGCCAT GGTCCGGTTC GTCAACCCCA CGGCCGAGGT GCGGCTCTCG 
GGCGGCCGGG AGATTCATCT CGGCTCGATG CAGCCCCTCG CCCTCTCGGT GGTGAACTCC 
ATCTTCCTTG GTGACTACCT GACCAGTGAG GGTCAGGAGG GCCACCAGGA CCTGAAGATG 
ATCGCCGAGG CGGGATTCAC GGTGGAAGGC CTCAACACCG ACGCCGAGGC GGCGCTGGCC 
ATGGGCGCGG GCCTGGAGCG GGTCGCGCTA CGTCAGCGCG GTGCCGGCAC CGACCTGCCG 
CCCAACGCCT GA

Protein sequence

MTDMDLSATL NSLVSKGVSG QAPTRDEALA VLRSDDDDLL DVVAAAYRLR RRYFGRRVKL 
NFLVNLKSGL CPEDCSYCSQ RLGSNTGILK YTWLKPEEAA ATAGAGISGG ARRVCLVASG 
RGPTDRDVDR VADTIGAIKT AHPDVEVCAC LGLLSDGQAA QLRAAGADAY NHNLNTAGEK 
YADICTTHTY NDRVDTVQEA RHAGLSPCSG IIAGMGESDE DLVDVAFALR ELAPDSIPVN 
FLMPFEGTPL GAEWNLNPRQ CLRILAMVRF VNPTAEVRLS GGREIHLGSM QPLALSVVNS 
IFLGDYLTSE GQEGHQDLKM IAEAGFTVEG LNTDAEAALA MGAGLERVAL RQRGAGTDLP 
PNA