Gene Francci3_2474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2474
Symbol
ID	3904852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2918242
End bp	2919426
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	70%
IMG OID	637879804
Product	lipid-transfer protein
Protein accession	YP_481570
Protein GI	86741170
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.093907
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGTC GGGTGATGGT GGCGGGCGTC GGCATGGTGC CGTTCGCGAC GCCGAGCAGG 
AGCGACAGCT ACGACGTGCT GGCCGAGGGG GCGGTCAGGG CGGCGTTGGC CGATGCCGGG 
ATCGACCTGG CGGCGGTCCA GCAGACGTAC GCCGGCTATG TGTACGGCGA CTCGACGAGC 
GGGCAGAAGG CGCTGTACCG GGTGGGGATG ACCGGGGCGC CGGTGGTGAA CGTGAACAAC 
AACTGCTCTA GTGGGTCGTC GGCGCTGTTC CTGGCGCGGC AGGCGGTGGC TTCCGGGGCG 
GCGGACTGCG TGCTGGCGTT CGGGTTCGAG CAGATGCGGC GCGGCGCGCT GACGATGCAG 
TGGGACGACC GGCCCAACGC CTTCGAGCGG TTCGACGAGG TGGTCACCAA GGTGCAGGGC 
GAGGTCGAGG GGGTGCCGTT CGCACCGCGG TACTTCGCCG GTGCGGGTGC GGCCTACTGT 
GAGAAGTACG GGATGGACCC GGCGGTATTC GCGCGGATCT CGGTGAAGTC GCGCCGGCAC 
GCGGCCAACA ACCCGTATGC GGTGTTCACT GATCCGGTGA CCGTGGAGGA GGTTCTTGCC 
TCGCCGCGGA TCCTCGGTTG GCTGACCCGG CTGCAGTGCT GCCCGCCCAC CTGTGGCGCG 
GCCGCCGCGG TGGTCGTTTC CGAGGACTTC GCGCGCGCCC ACGGCCTGCG CGCCGATGTG 
GCGATCACCG CGCAGGCGAT GACCACGGAT ACCCCGTCCT CGTTCGACGG GGACCTGATG 
CGCCTGGTCG GTTACGACAT GACCGCGGCC GCCGCGCGGC AGGTGTACGA GGTGGCCGGG 
GTGGACCCGC TCGATGTGCG CGTGGTGGAG CTGCACGACT GCTTCACCAC CAATGAGCTG 
ATGACCTACG AGGCGCTGGG GCTGACTCCG GAGGGCACGG CGGAGAAGTT CATCGTCGAC 
GGCGACAACA CCTACGGCGG CCGGGTGGTG ACCAATCCGT CGGGTGGGCT GCTGTCCAAG 
GGGCACCCGC TGGGCGCGAC CGGGTTGGCG CAGTGCGCGG AGCTGGTGTG GCAGCTGCGC 
GGCGAGGCCG ACAAGCGCCA AGTCGAGGAC GTGACCGTGG CGCTGCAGCA TAACATCGGC 
CTCGGCGGCG CCGCCGTGGT CACCCTCTAC GAGAAGGTAG GCTGA

Protein sequence

MSGRVMVAGV GMVPFATPSR SDSYDVLAEG AVRAALADAG IDLAAVQQTY AGYVYGDSTS 
GQKALYRVGM TGAPVVNVNN NCSSGSSALF LARQAVASGA ADCVLAFGFE QMRRGALTMQ 
WDDRPNAFER FDEVVTKVQG EVEGVPFAPR YFAGAGAAYC EKYGMDPAVF ARISVKSRRH 
AANNPYAVFT DPVTVEEVLA SPRILGWLTR LQCCPPTCGA AAAVVVSEDF ARAHGLRADV 
AITAQAMTTD TPSSFDGDLM RLVGYDMTAA AARQVYEVAG VDPLDVRVVE LHDCFTTNEL 
MTYEALGLTP EGTAEKFIVD GDNTYGGRVV TNPSGGLLSK GHPLGATGLA QCAELVWQLR 
GEADKRQVED VTVALQHNIG LGGAAVVTLY EKVG