Gene Franean1_6439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6439
Symbol
ID	5674754
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7829184
End bp	7830443
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	76%
IMG OID	641245287
Product	putative RNA-binding protein
Protein accession	YP_001510682
Protein GI	158318174
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.351487
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0469485
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGGGG CTCCTTCGGC CGCGCTGCCA CGGCAGCGAC CCGCGGCCGT ACCGGTGGCG 
TTGCCTGGGC TGATTCCCTT CACGCCACCA CCAGCCGCCG CGTCCGCGCG CCGCGCCGGC 
GCGGCGCACG CCGGCGCGCC GCCCGGCCTG GGTGACGCGC CGCCCGCCGG GGCGGGGGCC 
GTGGCCTGGC TCGCCCGCGT CGGGTCGTGG CCCTCGCACG CCTTCGAGCG GGTGCGCCCG 
CGGTGGGCGG GAGCGCGGCT CGGCCTGCTC GCCTACACGG TGGGCCAGGT CATCCTGCTC 
GGGCTGCTCT ACGTCGGCTA CAGCCTGAGC CGGCACCTGG CTACCGGCCG CGAGCCCGAC 
GCACTCGGGC ACGCTGTTGA CGTCTGGCGG CTGGAGCGGT TCCTGCGCCT GCCCGACGAG 
GCCTCGCTGC AGGGCGTCGC GCTGGCGCAC CAGTGGCTGC CGCACGGGGC GAACTGGTAC 
TACGTCGGCG TCCACTTCCC GGCGGCTATC CTGCTGCTGG TGTGGGTGTT CGCCCGGCAC 
CGCGACCACT GGCGCCGAGT CCGCAACGTG ATCATCCTGG CGACGGGCGC CGGCCTGGGG 
ATCCACCTGC TCTACCCGCT CGCGCCGCCG CGTTTCCTCC CACGGGTCGA CTCGTCGGTC 
GGCCTGGTCG ACACCGGCAT GCTCTTCGGG CCGTCACCGT ACGGGAAGGG CAGCGGCGGG 
GTCGCCAACC AGTACGCCGC GATGCCCAGT CTGCACGTGG GGTGGGCGAT CCTCGAGGCG 
TGGGCGGTGG TCACCATCCT GCGCCACCGG ATGCGCTGGC TCGCGGTGAT CCAGCCGCTG 
GCGACCGTCG CCGTGGTCGT GCTGACCGCC AACCACTTCT GGCTGGACGG CATCGTGGGC 
GGCACCCTGG TCGCGGGCGC GGTGCTGCTC GTCGGCCGCC GTCGCCCGGT GCCGGAGCAG 
CCCGCCCTGG TGAGCCTCGG GTTCCGGCCG GCCGTGGCCC CGCGGCCGGC CGCATCCGCG 
GGGTCCGCGG AGGTCTCGGC TGTGTCCCCG GGTGTCTCGG CGGTGCCTCC GGCGGTCGTG 
CCCTTGGCGG TCGTGCCCGC GGAGCCGGCA GTGCCCACGC AGTCATCAGC GCCCGTGGAG 
CCGGCGGTAC CTGCGGAGCC GGCAGTGCCG CCCCAGCACG GGCTCGAGAG CCCCGGAACC 
GGGAATGCCC CGGGGGACAG GCCGACTGCG CACGCCGATC CCGTGTCGGC CGTTACGTAG

Protein sequence

MVGAPSAALP RQRPAAVPVA LPGLIPFTPP PAAASARRAG AAHAGAPPGL GDAPPAGAGA 
VAWLARVGSW PSHAFERVRP RWAGARLGLL AYTVGQVILL GLLYVGYSLS RHLATGREPD 
ALGHAVDVWR LERFLRLPDE ASLQGVALAH QWLPHGANWY YVGVHFPAAI LLLVWVFARH 
RDHWRRVRNV IILATGAGLG IHLLYPLAPP RFLPRVDSSV GLVDTGMLFG PSPYGKGSGG 
VANQYAAMPS LHVGWAILEA WAVVTILRHR MRWLAVIQPL ATVAVVVLTA NHFWLDGIVG 
GTLVAGAVLL VGRRRPVPEQ PALVSLGFRP AVAPRPAASA GSAEVSAVSP GVSAVPPAVV 
PLAVVPAEPA VPTQSSAPVE PAVPAEPAVP PQHGLESPGT GNAPGDRPTA HADPVSAVT