Gene Francci3_2049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2049
Symbol
ID	3904622
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2410435
End bp	2412078
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	68%
IMG OID	637879386
Product	AMP-dependent synthetase and ligase
Protein accession	YP_481152
Protein GI	86740752
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.998714
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.345074
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGCCC AGAACAGCGT CGTGCACGGC TTGGTCCAGG CGGCCGGGCG GTGGGACCCA 
ACCATCCACG ACCATGCGGC GGACACCAGG GTCGGACTGG ACGCTCTGCT GGACACGGCG 
CTCAGCAATG CCTCCACGCT CGCCGGTCGG CAGGGCGAGA CGGGCCAGCT CCGGATCGGC 
ATCCTCATGC CGAACAGCCT CGCCTGGTTG GAGGCGCTCA TCACCACGCT GGCCGCCGGG 
TCGGCGGGCG TGCCGCTGCC ACTGCCGAGC GGCTTCGGCG GGCCGCAGGC GTATATGGAC 
CACATCTCCC TCTTGGCCGA CACCGCCAGA CTCGACGCGA TCATATACAA TGCCGCAGAC 
CTCGCACCGA CGGTACGCGC CCTCAGGAGC CGCCTGAACG GGGTCGAGTT CCTCGACATC 
TCAGGCTGGC CCACAGCACG GCCGGCCAGC GTCACCGAGG CGGCCGATGA TCCACGGATC 
ATTCAGTTCA CCTCGGGCAG CACATCACGG CCCAAAGGCG TCATCCTGAC CGCCGCCAAC 
ATCTCGGCCG CGGTCGCGAT CCTGGCCGAG CACTTCTTTC TCACTCCTAC CGACGCCCTG 
GGAAACTGGC TGCCGTTCTT TCATGACATG GGGCTCTTCA TGACCTTGGC GGCGCTCACC 
CACGGGTCCA GCCTGCATCT GTGGACGCCA AGCCAGGCCG CGCGCCGCCC GCTGGCCTGG 
CTCCGCCAGT TCGCCGAGAA CCGGTGCACC GTGGCGGCGG CTCCCAATTT CTTCTACAGC 
CAGCTGGCCG ATGCGGCGGC CAAGGAAGGC ACGCCGGCTG ACCTCGACCT GTCCACCTGG 
CGCGTCGCGA TCAATGGTTC CGAGACAGTG CGGGCCGACA CCATAGAACG CTTCACCAGG 
GCGTTCCGGC CGGCGGGCTT CCACGAAGCG GCGATGTGGC CGTCCTACGG GCTGGCGGAG 
GCGACGCTGC CGGCCGCGAT CCATAGGCCG GGCCTGGGCT TCACCACCCG CGCCGTCGCA 
CGCGGGGACC TCGCACCGGG GGAACCTGTG CGTTTCACGG CGGTGGGCGC CCCCGGATCG 
CGAACGGTGG TCGGCTGCGG ACGGCAGCTA CGCGGGACCG GTCTGCGGGT AACGGACCCA 
CATGGGAACC CGCTGCCCGA GGCCCATCTT GGCGAGATCC AGCTGCGCAG CCCAACCGTG 
ATGGCCGGCT ATCTCGACCG GCCGGCGGCC GAGGCACCCG TGACATCCGA AGGCTGGCTG 
ATAACCGGGG ACCTCGGCTT CCTCAGCGAC GGCGAGCTCT TCATCACAGG AAGGACCAAG 
AACGTAGCAA TCATCAATGG CCAGAACGTC TATGCCGAGG ACCTCGAACA CCTGGTAAGG 
GACGCGCTCG GCGACCAGGT TCGCTGCGGG GTCACAGCCG GCATGGATGA AGAGGACCGC 
GAGTTCATTC TGATCTGCTT CGAGCACTCG GGCACTTATG AGGAGCAGAG CGAGGCGGTC 
ACCTTGGTGC GCAACCAGGT CTCCGCGGCC CTCGGCGGAT TCCGCGCGAC CGTTGTCGCA 
CTACCTGACC GCCAGCTTCC ACACACGACC TCCGGGAAGA TTCGCCGAGC TGCCCTGGCG 
GACGTGGCGG GACGATACCT CTGA

Protein sequence

MGAQNSVVHG LVQAAGRWDP TIHDHAADTR VGLDALLDTA LSNASTLAGR QGETGQLRIG 
ILMPNSLAWL EALITTLAAG SAGVPLPLPS GFGGPQAYMD HISLLADTAR LDAIIYNAAD 
LAPTVRALRS RLNGVEFLDI SGWPTARPAS VTEAADDPRI IQFTSGSTSR PKGVILTAAN 
ISAAVAILAE HFFLTPTDAL GNWLPFFHDM GLFMTLAALT HGSSLHLWTP SQAARRPLAW 
LRQFAENRCT VAAAPNFFYS QLADAAAKEG TPADLDLSTW RVAINGSETV RADTIERFTR 
AFRPAGFHEA AMWPSYGLAE ATLPAAIHRP GLGFTTRAVA RGDLAPGEPV RFTAVGAPGS 
RTVVGCGRQL RGTGLRVTDP HGNPLPEAHL GEIQLRSPTV MAGYLDRPAA EAPVTSEGWL 
ITGDLGFLSD GELFITGRTK NVAIINGQNV YAEDLEHLVR DALGDQVRCG VTAGMDEEDR 
EFILICFEHS GTYEEQSEAV TLVRNQVSAA LGGFRATVVA LPDRQLPHTT SGKIRRAALA 
DVAGRYL