Gene Franean1_2361 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2361
Symbol
ID	5670757
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	2805470
End bp	2806654
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	72%
IMG OID	641241278
Product	lipid-transfer protein
Protein accession	YP_001506699
Protein GI	158314191
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0692288
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGCG GGTTCATCCG GGACGCCGCG TGCATCGTCG GGATCGGTCA CTCACAGTAC 
GGAACCCGCG GCTCGCTGGC GCCGCTCGGC CTGACCCGCA TCGCCTTCGA CGCCGTCCAC 
GACGCCTGCG CCGACGCCGG GCTCGACGCC AGGGACATCG ACGGGTTCGC CGGCTACTGC 
GACGACCCGA CCCTGCCCGC CGACCTGGCC GTAGCGCTCG GCACCCGGGA GCTGCGGTAC 
GCCGGCATGA CCTGGGGCGG TCGTGGCTCG GGGCTGCCCG GCGCGGTGGC GGGAGCTTAC 
GCCGCGGTCG CCACCGGACT GGCCGACCAC GTCGTGGTCG TGCGCTCGAT CATCCAGCAG 
GCGCGGCTGG GGCAGTCGGT GGCCGCCGGT GTGCAGCCGG GGCAGGCGAT TCCGCTGTCG 
GCGTCCTACA CCTCGCCGTT CGGCATGGCG CTGCCGGCCG CGATCTACGC GATGAAGGCC 
CGCCGGCACA TGGCGCTGCA CGGCACGACG ACCGAGCAGT TCGCGCAGGT CGCCATCAAC 
GCGCGGCGCA ACGCGGTGAA CAACCCCGAC GCGCGTTTCC GCACGGAGAT CACCGTTGAG 
GATCATCACG CCTCCCGGCT GATCTGTGAC CCGCTGCGGC TGCTGGACTG CTGCATGGAG 
TCCGACGGCG CCGCCGCCGT GATCATCACG ACGCCCGAGC GTGCCCGGGA CCTGCGCCAG 
CCACCCGTGC GCATCCGCGC GGTCGCGGCG ACCGGCGAGT ACAAGTGGGC CACCGCGTCG 
TTCAACACCG TCGACGAGGA TTTCGTCAGC ACCGGGCACC GCCGAGCCGC CCGCGATCTC 
TACCAACGGG CGGGCCTGGG CCCCGAGGAC GTCGACGTCG CACTGGTCTA CGACGGGTTC 
ACGCCGTCGG TGATCATGAG CCTCGAGGAT TTCGGCTTCT GCGGTATCGG CGAGGGCGGC 
CCGTTCGTCG AAGGGGGCGC CATCCGGCGG GAGGGCAGCA TTCCCGTCAA CACCCACGGC 
GGGAATCTCG CCGAGGTCTA TCTGCAGGGC ATCACCCACC TGCTCGAAGG CGTCCGGCAA 
CTGCGCGGGA CGGCCGTCAA CCAGGTGGCC GGCGCCGACG TCGCCCTCTA CGCTTCCGGG 
GTCGGCGCCT CGCCGGGCGG CGGGGTGCTG CTCCGCCGCT GGTGA

Protein sequence

MSGGFIRDAA CIVGIGHSQY GTRGSLAPLG LTRIAFDAVH DACADAGLDA RDIDGFAGYC 
DDPTLPADLA VALGTRELRY AGMTWGGRGS GLPGAVAGAY AAVATGLADH VVVVRSIIQQ 
ARLGQSVAAG VQPGQAIPLS ASYTSPFGMA LPAAIYAMKA RRHMALHGTT TEQFAQVAIN 
ARRNAVNNPD ARFRTEITVE DHHASRLICD PLRLLDCCME SDGAAAVIIT TPERARDLRQ 
PPVRIRAVAA TGEYKWATAS FNTVDEDFVS TGHRRAARDL YQRAGLGPED VDVALVYDGF 
TPSVIMSLED FGFCGIGEGG PFVEGGAIRR EGSIPVNTHG GNLAEVYLQG ITHLLEGVRQ 
LRGTAVNQVA GADVALYASG VGASPGGGVL LRRW