Gene Francci3_3763 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3763
Symbol
ID	3906047
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	4512016
End bp	4513092
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	70%
IMG OID	637881089
Product	biotin synthase
Protein accession	YP_482843
Protein GI	86742443
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID	[TIGR00433] biotin synthetase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.47987
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.559931
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACTGCAT CCGTGACCAC GTCCGTGACC GCGCACCCCA CCGCACCTGC ACCTGCGTCG 
CAGCGGCCGC CGGCGGACCA GGACGGTGCC GACATCCTCA CCGTGGCACG GCGCGAGGTC 
CTCGATGGCG GACGGGGGCT GGACGAGGCC GGCGTGCTCG CCGTGCTCCG GCTCCCGGAC 
GAGACGCTGA CCGATCTGCT CGCCCTGGCC CACGAGGTGC GGATGCGCTG GTGTGGTCCG 
GAGGTCGAGG TGGAGGGGAT CGTCAGCCTC AAGACCGGCG GATGCCCGGA AGATTGTCAC 
TTCTGCTCGC AGTCCGGCAA GTTCGACTCG CCGGTGCGGT CCGCCTGGCT GGACGTGCCC 
TCGCTCGTCG ACGCCGCCCG GCAGACCGCG GCGACAGGCG CCACCGAGTT CTGCATCGTC 
GCGGCCGTGC GGGGCCCGGA CGCCCGGCTC ATGGCGCAGG TGCGGGAGGG GGTCGCCGCC 
ATCCGTGCGG CGGTCGACAT CAACGTCGCC TGCTCGCTGG GCATGCTGAC CTCCGAGCAG 
GTCGACGAAC TCACGGCGAT GGGTGTGCAC CGTTACAACC ACAATCTGGA GACGGCCCGC 
TCGCACTTCC CGAACGTGGT CACCACCCAC AGTTGGGAGG AGCGGTGGGA GACCTGTGAG 
ATGGTGCGGG CCGCGGGGAT GGAGCTGTGC TGCGGCGCCA TTCTGGGCGT CGGCGAGAGC 
CTCGAGCAGC GTGCCGAGCT CGCCACCCAG CTTGCGGCCC TGGAGCCCGA CGAGGTTCCG 
CTGAACTTCC TCAACCCGCG GCCGGGAACG CCCTTCGGGG ATCTTCCGCT GGTCGAGCCG 
CGTGACGCGC TGCGCGCGAT CGCGGCGTTC CGCCTCGCCA TGCCGCGCAC GATCCTGCGC 
TACTCCGGCG GACGCGAGAT CACCCTGGGC GATCTCGACG TGCAGGGGAT GCTCGGTGGC 
ATCAACGCCA TGATCGTCGG AAACTATCTG ACGACGCTGG GCCGCTCCGC GGAGGCCGAC 
CTGAAGATGC TGGCCGAGCT GAGCATGCCG ATCAAGTCCC TGCAGGCCAC TCTCTAA

Protein sequence

MTASVTTSVT AHPTAPAPAS QRPPADQDGA DILTVARREV LDGGRGLDEA GVLAVLRLPD 
ETLTDLLALA HEVRMRWCGP EVEVEGIVSL KTGGCPEDCH FCSQSGKFDS PVRSAWLDVP 
SLVDAARQTA ATGATEFCIV AAVRGPDARL MAQVREGVAA IRAAVDINVA CSLGMLTSEQ 
VDELTAMGVH RYNHNLETAR SHFPNVVTTH SWEERWETCE MVRAAGMELC CGAILGVGES 
LEQRAELATQ LAALEPDEVP LNFLNPRPGT PFGDLPLVEP RDALRAIAAF RLAMPRTILR 
YSGGREITLG DLDVQGMLGG INAMIVGNYL TTLGRSAEAD LKMLAELSMP IKSLQATL