Gene Franean1_0967 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0967
Symbol
ID	5669381
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	1129596
End bp	1130681
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	71%
IMG OID	641239895
Product	biotin synthase
Protein accession	YP_001505329
Protein GI	158312821
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID	[TIGR00433] biotin synthetase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00736488
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.128814
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGCAC CTGTGACCGC GCCTACGACC ATGCCCGCGC AGACTCCCCC GACCGTCGAG 
ACCGACGTCG TCACCGAGGC GCCCCGACCC CTCGACGACG ACATTCTCGC CCGTGCCCGC 
CGACAGGTGC TCGACGAGGG GCGCGGCCTC GACGAACAGG ACGTGCTCGC GGTCCTCCAG 
CTGCCGGACG AGGCACTGGG CGACCTGCTC GCGCTCGCCC ACGAGGTGCG GCTGCGCTGG 
TGCGGGCCGG AGGTCGAGGT TGAGGGCATC ATCAGCCTCA AGACCGGCGG CTGCCCCGAG 
GACTGCCACT TCTGCTCCCA GTCCGGGCGC TTCGACTCCC CCGTGCGCTC CGCCTGGCTG 
GACGTCCCGT CCCTGGTCGA GGCGGCGAAG GCGACGGCGG CCACCGGCGC CACCGAGTTC 
TGCATCGTCG CCGCGGTCCG CGGCCCCGAC CAGCGGCTGA TGGCGCAGAT CCGCGAGGGC 
GTGGCGGCGA TCCGGGAGGC CGTCGACATC AACGTCGCCT GCTCGCTCGG CATGCTCACC 
CAGGAGCAGG TGGACGAGCT CGCCGGCCTG GGCGTGCACC GCTACAACCA CAACCTGGAG 
ACGGCGCGCT CGCACTTCCC GAAGGTGGTC ACCACCCACA GCTGGGAGGA GCGCTGGGAG 
ACCTGCGAGC TCGTCCGCGC CGCCGGGATG GAGCTGTGCT GCGGCGCGAT CATCGGTGTG 
GGCGAGTCCC TCGAACAGCG CGCCGAGCTG GCCGCCCAGC TCGCCGCTCT GGAGCCGGAC 
GAGGTTCCGC TGAACTTCCT CAACCCGCGA CCCGGCACCC CGTTCGGTGA CCTGCCCGCG 
GTGGACTCAC GCGAGGCCCT GCGCACCATC GCCGCGTTCC GGCTGGCGCT GCCCCGCACG 
ATCCTGCGCT ACGCCGGCGG GCGCGAGATC ACGCTGGGCG ACCTGGATGT CCAGGGAATG 
CTCGGCGGCA TCAACGCGGT GATCGTTGGG AACTACCTGA CCACGCTCGG CAAGAATCCG 
GAGAGCGACC TGGCCATGCT CACCGAGCTG CGGATGCCGA TCAAGTCCCT GCAGGCCACG 
CTCTAG

Protein sequence

MTAPVTAPTT MPAQTPPTVE TDVVTEAPRP LDDDILARAR RQVLDEGRGL DEQDVLAVLQ 
LPDEALGDLL ALAHEVRLRW CGPEVEVEGI ISLKTGGCPE DCHFCSQSGR FDSPVRSAWL 
DVPSLVEAAK ATAATGATEF CIVAAVRGPD QRLMAQIREG VAAIREAVDI NVACSLGMLT 
QEQVDELAGL GVHRYNHNLE TARSHFPKVV TTHSWEERWE TCELVRAAGM ELCCGAIIGV 
GESLEQRAEL AAQLAALEPD EVPLNFLNPR PGTPFGDLPA VDSREALRTI AAFRLALPRT 
ILRYAGGREI TLGDLDVQGM LGGINAVIVG NYLTTLGKNP ESDLAMLTEL RMPIKSLQAT 
L