Gene Francci3_1602 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1602
Symbol
ID	3903737
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1922655
End bp	1924391
Gene Length	1737 bp
Protein Length	578 aa
Translation table	11
GC content	70%
IMG OID	637878939
Product	AMP-dependent synthetase and ligase
Protein accession	YP_480707
Protein GI	86740307
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.484756
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGCACG CGACATTGCT GCCGGAAGTC CTACAGAACC GCGCCGCCCG CCAGCCGGCC 
AGGCGGGCCT ACGTGTTCGT GGATGAACAC GAGGCGGAAA AGGCGGTACT GACGTACGGC 
GACCTGCACG CGCGGGCGCT CGCCGTGGCC GGGGAGCTGA TCCGGCGCTG CCGGCCCGGC 
GACCGGGCGC TGCTGCTCTT CCCGCCGGGT CTGGATTTCA TCGTCGCCTA CTTCGGCTGC 
CTCTACGCGC AGGTGATCGC GGTCCCCGTC AACCCCCCGC GCAGGAACCT GATCCAGGAC 
GCGACCCGGA GCATCATCAA GGACTGCGAG CCTTCGGCCG TGCTCACCGT CGGCGCGATG 
GTCGAGCACA TCAGGCCCGT CGTGGAATCG ATCCGTGGCC CCCTCCCCTG GCTGCCGGTC 
GACCAGGTGG CGGACGAGAC GAACGAGACG GACCAGGCGG GCACGAGCTT CCGCCCCCGG 
CCCTGTCCGC CGGATTCCGT CGCCTTCCTT CAGTACACCT CCGGTTCCAC GTCCGATCCG 
AAGGGGGTCA TGGTCTCCCA CCGGAACCTC GCCGCGAACC AGGAGATGAT CCGGCGCGCG 
TTCGACCACG ATCAGGACTC GACGTTCGTC GGCTGGGCAC CGTTCTTCCA TGACCAGGGG 
CTGATCGGCA ACATCCTGCA GCCGCTCTAC CTCGGGGCGA CCAGCATCCT CATGGCGCCG 
ATGACGTTCA TCCGGTGGCC CCTGCGCTGG CTGTCGGCCA TCTCCCGGTA CCGGGCCCAC 
ACCAGCGGCG GGCCCAACTT CGCCTTCGAT GTCTGCGTCG CACGGGCCGC CCGGGGGGAT 
GTGCCGGACC TCGACCTCAG CTGTTGGAAG GTCGCGTTCA ACGGGGCCGA GCCCATCCGT 
CACGAGACCC TGCGCCGGTT CTCGGCGATC TTCGCGCCCC ACGGGTTCGA CGAGAAGGCG 
TTCTACCCGT GCTACGGCCT GGCCGAGGCG ACCCTGCTCG TGACCGGCAG CCGGAAGGGC 
CGCGGTCCCC GCGCCCTCGA GGCGGACGTC GAGGCGCTCG GTCACCGGCG CTATGTGCCG 
GCATCGGGCG GACGCGGCCG GAGTCTCGTC GGATCCGGGC TCGTCCTCCC GGAGGAGGAG 
CTCCGGATAG TGGACCCCGA AACGGGACGC CCGTGCCCCG CGGACGAGGT GGGCGAGATC 
TGGGTCTCCG GCGACCAGGT GGCGCAGGGA TACTGGCGCC GCCCGGAGGC GACGGCCGAG 
GTGTTCCACG CCGAGTTCGA CGGCGAGACC GGCCGGGCTT ACCTGCGCAC CGGCGATCTC 
GGCCTGCTGG TCGACGGCGA GGTCTACGTC GTGGGCAGGC TGAAGGACCT GGTGATCATT 
CGGGGCCGGA ACTACTATCC CCACGACATC GAGCTCACCG TCCAGTCGGC CCACCCCGCG 
TTGCGCCCCG GCGGGTGCGC CGCGTTCTCG GTTCCCGGTG CCGACAGCGA GAAGCTGGTC 
GTCGTGCAGG AGATCAGGGA CGAGCAGCGC CTCACCGCCG ACGCGAGGGA CGTCGCTGCG 
TCGATCCGGG CGGCGGTGAC GCGGGAACAC GACCTCTCGG TGAACGACCT CGTGCTGGCC 
CTGCCGGGCC GGCTACAGAA GACCAGCAGC GGCAAGATCA TGCGAGCCGC GGCCAGGAAC 
CGCTACCTGG CGGCCGGGTT CGAGATCTGG GAACCGGGGA TGTCCTCCGT CGCCTGA

Protein sequence

MPHATLLPEV LQNRAARQPA RRAYVFVDEH EAEKAVLTYG DLHARALAVA GELIRRCRPG 
DRALLLFPPG LDFIVAYFGC LYAQVIAVPV NPPRRNLIQD ATRSIIKDCE PSAVLTVGAM 
VEHIRPVVES IRGPLPWLPV DQVADETNET DQAGTSFRPR PCPPDSVAFL QYTSGSTSDP 
KGVMVSHRNL AANQEMIRRA FDHDQDSTFV GWAPFFHDQG LIGNILQPLY LGATSILMAP 
MTFIRWPLRW LSAISRYRAH TSGGPNFAFD VCVARAARGD VPDLDLSCWK VAFNGAEPIR 
HETLRRFSAI FAPHGFDEKA FYPCYGLAEA TLLVTGSRKG RGPRALEADV EALGHRRYVP 
ASGGRGRSLV GSGLVLPEEE LRIVDPETGR PCPADEVGEI WVSGDQVAQG YWRRPEATAE 
VFHAEFDGET GRAYLRTGDL GLLVDGEVYV VGRLKDLVII RGRNYYPHDI ELTVQSAHPA 
LRPGGCAAFS VPGADSEKLV VVQEIRDEQR LTADARDVAA SIRAAVTREH DLSVNDLVLA 
LPGRLQKTSS GKIMRAAARN RYLAAGFEIW EPGMSSVA