Gene Francci3_2982 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2982
Symbol
ID	3905478
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	3531549
End bp	3533045
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	75%
IMG OID	637880302
Product	acyl-CoA synthetase
Protein accession	YP_482068
Protein GI	86741668
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.186331
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.190971
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCCTGC TCCCACTGCC TGCCGGCGAG CACGACGGCC CCGCCGTCCG GGTCGGGGAG 
GTCGAGTTCA CCCGCGCAGA GCTCTTCGCG GCCGCGTCCG TCGTCGCCGG TCGGGTGGCC 
GGCGCGCCGG CGGTGGCCGT GCACGCCGAG GCGACGATGG CCACCGTCGT CTCGGTCGTC 
GGCTGCCTGC TCGCCGGGGT GCCGGCGGTA CCCGTGCCGC CTGACTCCGG GCCGCGGGAA 
CGCGGTCACA TCCTGCGCGA CTCGGGCGCC GCCCTGCTGC TCGGCAGGCC CGCCTGGGAC 
AACCTCGCGA TCCCCACCGT GCCGGTCGAT CTCACCGCAC GGTCGGGGTC TGCCGGCTCC 
GGCTCCGGGT CCGGGTCCGG GGAAACCGGA CCGGCGCTCA TCCTCTACAC CTCCGGGACG 
ACCGGAGCCC CCAAGGGCGT GGTGCTGTCC GCCCCGGCCA TCGCCGCCGA TCTGGACGCC 
CTCGCCGACG CCTGGGCCTG GACGCCCGAG GACACGCTCG TGCACGGGCT GCCGCTGTTC 
CACGTCCACG GCCTGGTCCT GGGTGTGCTC GGGGCGCTGC GGGTCGGCAG CCGGTTGATC 
CACACCGTCC GCCCGACCCC GACGGCGTAC GCGGCGGCCG GGGGGACCCT GTACTTCGGC 
GTGCCGACCG TGTGGTCCCG GGTCTGCGAC GATCCGACCA CCGCCCGCGC CCTGGTCTCG 
GCCCGGCTGC TCGTCTCGGG CAGTGCCCCC CTGCCGAGGC CGGTGATCGA CCGGCTCACC 
GGGCTCACCG GCCTCGCCCC GATCGAACGG TACGGGATGA CCGAGACGTT GATCACCATC 
AGCGCCCGGG CGGACGGGGA GCGCCGGGCG GGCTGGGTCG GTACCACCCT GCCGGGGGTG 
CGGGCCCGGC TCGTGGACGA CGAGACGGGG ACCGAGCTGC CCGCGGACGG GGAGAGCATC 
GGCGAGTTGC AGGTCCGCGG TGCCACCCTG TTCGACGGGT ACCTGGGGCG CCCGGAGGTC 
ACCGCCGCGT CGTTCACCGC GGACGGCTGG TTCCGCACCG GTGACGCCGC GGTCGTCGCC 
CCGGACGGCC ACCACCGAAT CGTCGGGCGC CGATCCACCG ACCTCATCAA GAGCGGCGGT 
TACCGGGTGG GCGCGGGCGA GGTCGAGGCC GTACTGCTGG CCCACCCGGC CGTGCGCGAG 
GCCGCCGTCG TCGGGCTGCC GGACGACGAC CTCGGGCAGC GCATCGCCGC CTTCGTCGTC 
GCCCCCGACC TGGCCGGTGC GGCGGGCGGG GCACCAGGCG GGATACCGGG CAGGGCGTCG 
GACGGGACAC CGAGCGAGAC GGCAAACGAG ACGGCGAGCG AGGCGCTCAT CGACTTCGTG 
GCGCGGGAGC TGTCCATCCA CAAGCGGCCC CGGGAGATCC ACCTGGTGGC CGAGCTCCCC 
CGCAACTCGA TGGGCAAGAT CCGCAAGTCC GCCCTGGCTC CCCCGGAAAC GCCCTGA

Protein sequence

MTLLPLPAGE HDGPAVRVGE VEFTRAELFA AASVVAGRVA GAPAVAVHAE ATMATVVSVV 
GCLLAGVPAV PVPPDSGPRE RGHILRDSGA ALLLGRPAWD NLAIPTVPVD LTARSGSAGS 
GSGSGSGETG PALILYTSGT TGAPKGVVLS APAIAADLDA LADAWAWTPE DTLVHGLPLF 
HVHGLVLGVL GALRVGSRLI HTVRPTPTAY AAAGGTLYFG VPTVWSRVCD DPTTARALVS 
ARLLVSGSAP LPRPVIDRLT GLTGLAPIER YGMTETLITI SARADGERRA GWVGTTLPGV 
RARLVDDETG TELPADGESI GELQVRGATL FDGYLGRPEV TAASFTADGW FRTGDAAVVA 
PDGHHRIVGR RSTDLIKSGG YRVGAGEVEA VLLAHPAVRE AAVVGLPDDD LGQRIAAFVV 
APDLAGAAGG APGGIPGRAS DGTPSETANE TASEALIDFV ARELSIHKRP REIHLVAELP 
RNSMGKIRKS ALAPPETP