Gene Franean1_0875 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0875
Symbol
ID	5669289
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1020729
End bp	1021727
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	75%
IMG OID	641239802
Product	hypothetical protein
Protein accession	YP_001505237
Protein GI	158312729
COG category	[R] General function prediction only
COG ID	[COG1611] Predicted Rossmann fold nucleotide-binding protein
TIGRFAM ID	[TIGR00725] conserved hypothetical protein, DprA/Smf-related, family 1 [TIGR00730] conserved hypothetical protein, DprA/Smf-related, family 2

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.237559
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACTCGGC CCGCCCACCC TGATCCGCCG GGCGGCGGAT CGACGTCCCA GCCGATCGTT 
CCGACGGCGG CCGCGCGCCC AGCCGGTGAT GGTCCGGCGG ACGTCCCCCC GCCCGTTCCC 
GCCGTCGCGC CCGGGCCCGC GGTTGCTCCC GCGGCCGCGG TGTCCAGGCG TACCCGGCGG 
GGTGGCGGGC CGCCGCCCGA GCAGCGCCGC GGCCCGGTCA CGGCGCGGCG CGGGCAGGTG 
GAGCACTCCA CCACCGACCA ACGCCTGCTC GACACCCGCA GCCCGGCCTC GTTCGTCCAC 
AGTGACCCGT GGCGCGTCCT GCGCATTCAG AGCGAGTTCG TCGAGGGCTT CGGGCTGCTG 
GCGGATCTGC CCCCAGCCGT CACGGTCTTC GGGTCGGCCC GGGTCGGCCG GGACGAACCC 
GAGTACGAGC TGGGACGCCG GCTCGGCGCC GCGCTGGCCG ACGCCGGCTA CGCGGTGATC 
ACCGGCGGCG GGCCGGGCGC GATGGAGGCG GTCAACCGGG GGGCGCAGGA GGCCGGCGGG 
CTCTCGGTCG GCCTCGGCAT CGAGCTGCCC TTCGAGCAGG ATCTCAACGA CTGGGTCGAT 
CTGGGCGTCA GCTTCCGGTA CTTCTTCGTC CGCAAGACGA TGTTCGTGAA GTACGCCGAG 
GCCTTCGTCA TCATGCCGGG CGGGTTCGGC ACCCTCGACG AGCTCTTCGA GGCCCTCACC 
CTGCTGCAGA CGGGCAAGGT GACCCGGTTC CCGGTGGTGC TCATGGGCAC GGCCTACTGG 
TCGGGCCTGC TGGAGTGGCT GCGCTCGACC GTCCTCGGCT CCGCCCGGAT CAAGCCGGGC 
GACCTCGACC TGGTGACCAT GACCGACGAC GTCGACGAGG CCGTGCGCCT GATCCTCGAG 
GGGACCGGCC GTGCCGGCCC GCCCGCCGCG GCCACCTCCG GCGACGAGAC CGCCAGCGAG 
GTCGGCGGGG CCGCCGCGGC CGGTGGGGCG CCCTCGTGA

Protein sequence

MTRPAHPDPP GGGSTSQPIV PTAAARPAGD GPADVPPPVP AVAPGPAVAP AAAVSRRTRR 
GGGPPPEQRR GPVTARRGQV EHSTTDQRLL DTRSPASFVH SDPWRVLRIQ SEFVEGFGLL 
ADLPPAVTVF GSARVGRDEP EYELGRRLGA ALADAGYAVI TGGGPGAMEA VNRGAQEAGG 
LSVGLGIELP FEQDLNDWVD LGVSFRYFFV RKTMFVKYAE AFVIMPGGFG TLDELFEALT 
LLQTGKVTRF PVVLMGTAYW SGLLEWLRST VLGSARIKPG DLDLVTMTDD VDEAVRLILE 
GTGRAGPPAA ATSGDETASE VGGAAAAGGA PS