Gene Francci3_2245 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2245
Symbol
ID	3905013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2618950
End bp	2620509
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	68%
IMG OID	637879576
Product	AMP-dependent synthetase and ligase
Protein accession	YP_481342
Protein GI	86740942
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00923204
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0183444
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGATC TCACCGGGAA AAGTGACCTG ACCCTGAAGG CGGTGTTCGT CGACGCGTTG 
GACCGGTTCG GTGCGCGTCC CGCCCTGCAC TATCAGGGGC GGACCTACGG GTACGGCGAG 
ATCGTGGCCG CGGCGAACCA GCTCGCGCAC CGGCTGCGTG CGGCGGGGGT GGGGCCGGGG 
GTGTCGGTGG CGTTGATGAT GTCCAACCGG CCCGAGTACA TCGTCGCGGA TCAGGCGATC 
CTGCGGTGTG GCGCGGTCAA GGTGGCGCTC AACGACATGC TGTCGGCCAG CGAGATCGAC 
TACATTCTGC GGGACAGCGA GGCCCGGGTC GTCCTCGCCG ATGCGGGGAT GCTCCCGGCT 
GCGCTGCACT CCGCGCCGCC CCTGTTGGAG ACGGTCATCG CCGTCGCCGA CCCGGACGAC 
TGCCCGGGCG GGGTGGTGGC GTGGCACGAC GCGCTGGCCG GGCAGCCGAC CACCGTGCCG 
GAGGTCGACC CGACACCCAC CGACCCGGGG TTGATCGTCT ATACCGGGGG TACGACCGGT 
CTGCCCAAAG GGGTGATGCA CACCCAGCGG AATCTCGCGC TCAATCTGTT CTCGCACGTG 
ATGGAGATGG GGCTGCTCGA CGACGAGGTG CTGCTGTTGA TGTCGCCGCT GCCGCACAGC 
GCGGGTTTCC TGCTGCAGGC CGGGATGCTC AAGGGGGCCC GGCACTTCCT GGAGACCAGG 
TTCGACCCGG AGCTGGTGCT TGAGCGGATC ACCGCCGACC GGGTGACCTT CACGTTCATG 
GTGCCTACCA TGATCTACCG GGTGCTTGAC CGGGCGGCGG GCCGCGCGTT GGACCTCAGC 
TCGCTGCGGA CCATCCTGTA CGGTGCCGCG CCGATCACCC GGGAGCGGCT GGAGCAGGGC 
CTGGAGGTGC TCGGCCCGGT GTTCATGCAG CTGTACGGGC AGTCGGAGGC GCCGAACTTC 
ATCACCCGTC TTCGCCGTGA GGATCATCGT CTTGATCCTG ACGGGGAGCA TCGGCTGGCC 
AGCTGTGGTC AGCCGGTCGT CATGGCCACG GTCAGGGTGG TCGACGAGGC TGGCCGGGAG 
CTGCCCCGCG GTCAGGTCGG GGAGATCGTC GCCGCCACGC CGTACACGAT GGTGGGGTAT 
CGGGGCCGGC CCGAGCAGAC CGCCAAGGCG CTGCGGGACG GGTGGTTGCA TACTGGGGAT 
ATCGGGCGGA TGGATGCCGA GGGGTACGTC TATCTGCTGG ACCGCAAGAA CGATATGATC 
ATCACCGGTG GGATGAACGT GTACAGCACG GAGGTGGAGA ACGCGGCGGC GGCCTGTCCT 
GGGGTTGGGC AGGTCGCGGT CGTCGGGGTG CCGCATCCGG ACTGGGGTGA GGCGGTCGTG 
GCGTTCGTCG TGCCCGATGA TACCGGTGCG TTCGACGAGG CCAAGCTGCT GGCGCACTGT 
CGGGTCGAGC TTGCCCGGTA CAAGCAGCCC AAGGCCGTGC GGGTCGTCGA GGCCCTGCCG 
ACCACCGTGT ACGGCAAGCT GGACAAGAAG GCGCTGCGGG CCGGCTGGCC CGGTTGGTGA

Protein sequence

MSDLTGKSDL TLKAVFVDAL DRFGARPALH YQGRTYGYGE IVAAANQLAH RLRAAGVGPG 
VSVALMMSNR PEYIVADQAI LRCGAVKVAL NDMLSASEID YILRDSEARV VLADAGMLPA 
ALHSAPPLLE TVIAVADPDD CPGGVVAWHD ALAGQPTTVP EVDPTPTDPG LIVYTGGTTG 
LPKGVMHTQR NLALNLFSHV MEMGLLDDEV LLLMSPLPHS AGFLLQAGML KGARHFLETR 
FDPELVLERI TADRVTFTFM VPTMIYRVLD RAAGRALDLS SLRTILYGAA PITRERLEQG 
LEVLGPVFMQ LYGQSEAPNF ITRLRREDHR LDPDGEHRLA SCGQPVVMAT VRVVDEAGRE 
LPRGQVGEIV AATPYTMVGY RGRPEQTAKA LRDGWLHTGD IGRMDAEGYV YLLDRKNDMI 
ITGGMNVYST EVENAAAACP GVGQVAVVGV PHPDWGEAVV AFVVPDDTGA FDEAKLLAHC 
RVELARYKQP KAVRVVEALP TTVYGKLDKK ALRAGWPGW