Gene Franean1_0900 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0900
Symbol
ID	5669314
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1051978
End bp	1053417
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	74%
IMG OID	641239827
Product	stress protein
Protein accession	YP_001505262
Protein GI	158312754
COG category	[T] Signal transduction mechanisms
COG ID	[COG2310] Uncharacterized proteins involved in stress response, homologs of TerZ and putative cAMP-binding protein CABP1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.204273
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACAGG TGCTAAGCAA GGGCGCGAAC GCCCCGCTTC CGACGACGGA TGTGCGGGTC 
GAGGTGTCTT CGTCCACCCC GCTCGACATC GCCGCGTTGC TGGTCACCCC GTCCGGCAAG 
GTGCGGGGGG ACGCCGACTT CGTCTTCTTC AACCAGCCGG CCGGTCCGGG GGTGCGCCTC 
GCGCCGCCGT CGGCGCTGGA GTTCATGCTC ACCGCGGTGC CGCCCGACAT CGACAAGGTC 
GTGGTCACAG GCAGCCTGGA CGGCGCCGGC CCGCCGACCT TCGCCGGCGT GCGCGGCCTG 
GCCGTGATCG TGCGGGACGC GCGCGGCCAG GAGGTCGTCC GGTTCGACCC GGCCGGGATG 
AGCAGCGAGA CGGCCCTCGT GCTGGTCGAG CTGTACCGCC GTGCCGGGAG CTGGAAGGTG 
CGTGCCGTCG GCCAGGGCTA CGCCTCCGGC CTGGCCGGGA TCGCCACCGA CTTCGGGATC 
ACCGTCGACG ACCCGGGCTC CGGGAACACC GCGGCGGCAC CAGCGTCCGC GGGCCCCGGA 
GCCGGAACGG GGGCCCCGCC ACCGTCGCAG TACGACGCCC CGACGCAGGT CGTCTCGCCC 
CCGCCCGGTC AGCAGTGGGG TCCGCCGCCT GGCGCGCCGC CGCAGGCTCC GCCGCCGCCG 
AACCCGCAGC AGTGGGGCCC GCCGCCGGGC CAGCAGTGGG GTCCCCCGCC GGGCCAGCAG 
TGGGGTCCGC CGCCCGGCGC GCCGCCGCAG GCTCCGCCGC CGCCGAACCC GCAGCAGTGG 
GGCCCGCCGC CGGGCCAGCA GTGGGGTCCG CCGCCCGCCG GCCCGCCCGG CCCGGGTGCT 
CCCGCCGGCG CGGTGCCCGG CCGGGTGAAC CTGGACAAGG GCCGGGTCTC GCTGCGCAAG 
GGCCAGAGCG TGTCCCTGGT CAAGACCGGC GCCCCGCCGC TGGTCCGGGT CCGGATGGGT 
CTCGGCTGGG ATCCCGCGCA GCAGGGCCGC TCCATCGACC TCGACGCGTC CTGCATCCTG 
TTCGACGACC GCGGGAAGGA CGTCGACAAG GTCTGGTTCA TGTCGAAGAA GGGGGCGCGT 
GGCGCTGTCC GCCACTCGGG GGACAACCTC ACCGGCCAGG GCGAGGGCGA TGACGAGACC 
ATCTTCGTCG ATCTCGGCGC GCTGCCGCAG AACGTCGTCA GCCTGATCTT CACGGTGAAC 
AGCTTCCAGG GGCAGTCCTT CACCGACATC CGCAATGCCT TCTGCCGGCT CGTCGACGAC 
CAGACCAACC AGGAGCTGGT GCGGTTCGAC CTGTCCGAGT CGAAGCCGGC GACGGGACTG 
GTGATGTGCC GTCTCCAGCG GGAGCCGGGG GCGCCAACCT GGGTGATGAC CGCGATCGGC 
GAGTTCCACG ACGGGCGTAC CGTGCGCGCG ATGGTCGGGC CGTCCCGCCA GTACCTCTGA

Protein sequence

MAQVLSKGAN APLPTTDVRV EVSSSTPLDI AALLVTPSGK VRGDADFVFF NQPAGPGVRL 
APPSALEFML TAVPPDIDKV VVTGSLDGAG PPTFAGVRGL AVIVRDARGQ EVVRFDPAGM 
SSETALVLVE LYRRAGSWKV RAVGQGYASG LAGIATDFGI TVDDPGSGNT AAAPASAGPG 
AGTGAPPPSQ YDAPTQVVSP PPGQQWGPPP GAPPQAPPPP NPQQWGPPPG QQWGPPPGQQ 
WGPPPGAPPQ APPPPNPQQW GPPPGQQWGP PPAGPPGPGA PAGAVPGRVN LDKGRVSLRK 
GQSVSLVKTG APPLVRVRMG LGWDPAQQGR SIDLDASCIL FDDRGKDVDK VWFMSKKGAR 
GAVRHSGDNL TGQGEGDDET IFVDLGALPQ NVVSLIFTVN SFQGQSFTDI RNAFCRLVDD 
QTNQELVRFD LSESKPATGL VMCRLQREPG APTWVMTAIG EFHDGRTVRA MVGPSRQYL