Gene Franean1_5727 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5727
Symbol
ID	5674053
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	6956175
End bp	6958019
Gene Length	1845 bp
Protein Length	614 aa
Translation table	11
GC content	69%
IMG OID	641244580
Product	hypothetical protein
Protein accession	YP_001509983
Protein GI	158317475
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.58442
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACATTG AATTCCATCG GCTCGCGCTG GCCGACTTCG ACGACCTCGC GGCCGGTGGC 
GGGCGCACGG GAATCGTGCT CGGCCTGCGG AGAACGCAGC TGAGCAAGCG GCTACTCGCA 
CTCCACACGG TGATGACGGA CGCCGGCGAG CGGGCCCCGG CGGCCGTCGC CGCCGGTGGC 
CTGACAAACG CCTACGGCGT GCTCGCCACA GCCCAGCGGC AGGCCCCGGA GACGACCGAG 
ACAGTCCTGC TGTCACCAGG CCTCGGCCTG TGGGCGATGC ACTGCCTGCG TCGGCTCCAC 
GGGAGCGCCA ACCCTGCCAC GCCGCTGGAG GAGGATCTCG GGATCCTCGG CAGCTACGCC 
GTCGCCGCCG CCCTGCGCGC CGGCCTGTGC GCAACGGTGG CCGTCCCGCT CCGGGACGGC 
CACCTGCTCA TCCCGGCCGT CGGCCGGGTC CAGGTCGGAC TAGCTGGCTG GGCCACGGTC 
CGGATCGAGG GGACGGTCCT GCACCTGACC CCCGGCCAGG TCGACAACCC GCAGAGCGAC 
TCCCTGGCGT TGGAGATCCC GAGCGATCCG GCCGCGAAGC CTCCTTTCCC GGCTCAGTCG 
CAGGCCAGCC AGTGGCACAT GGTCCCGGAG CTGGTGAGCA TCGCGAACCG CCGGCGCATC 
GCCCTCCTGC TCGACGATGT CGACCCGGCC CGAGGGCTAC TCAAGCTGCC GATAGCGCCC 
GACACGGCGA CCGAGAATGT CGACGTCTGG CAGCAACGCC TCGACGACGG CTGGCACATC 
CTCGGCGACT ACGATCCGTT GATCGCGGAG GCCGTCGCGG CCGGGCTGGC CACCATCTTT 
CCGCTGGCCT CCTCGTCATG GGCCGAGGAG CTCAGCGCCT CGTCCGGCGA GGCCTTCGGC 
GCGGTGGCCC TCACGCTTCC CCGGGATGGG CTCTCGTTCG CCGCGGCGCT GGTCCACGAG 
TTCCAGCACA CGAAGCTCTC CGCGTTGCTT GATCTGGTGA CCCTGGTCAA GCCGGCCGAC 
GAACGGCTGT TCTACGCGCC CTGGCGACGT GACCCGCGCC CCCTTCCAGG TTTGCTACAG 
GGCGCCTACG CCTATCTCGG GCTGACCGGA TTCTGGGATT ATCGACGCCT TGCGGAAAGC 
GGGGACGAAT TTGCCCACTT CGAGTTCGCG CGATGGCGGG ATGAGGTTTG GCGGGTCCTG 
AGCACGCTGC GCTTCTCCGG CGCGATGACA CCGCTCGGGC TACGTTTTCT GGACGGCATG 
CAGTCAACCA TCTGGTCCAG TCGCCAGAAA CCTGTTCCCG ACGGGCCTGG CGAACTCGCA 
CGTAGGACTT CTGACGACAC GAGAATTACC TGGCAGCTCC GTAACGCTGA GCCCTCGCCG 
GCTCAGATCA CGCTGTTGGC CAAGGCCTGG ATCGAGGGCA GCCAGCCACC GCCGAAGACG 
CGGATACCGA CGCGCATCGT CCCGGGGCGC CGCGGCCTGG TCACCAGCTC GCGGCTTGCG 
CTCACCCAGC TTCGTCTGCT GGACCCGAAA CGATTCGAGG CCGCTCGACA GGGCGTTCCC 
CATGTTCTCG ACGCCACCGT CTCCGCGGCC GATCGGGCTC TCGCGTTCGG GGATACCCAG 
ACCGCGGCAC AGGTATACAA GGAAGAAATA GAATGTGAGC CCGACCTGCT CGACGCCTGG 
GCCGGCCTGG CATTGTGCCG GCGGCAGCAC GCCGCACCGG GATCTCGCAC CCTGGTCGCC 
CGGCCGGAAG TCGTTCAGCG GTTGCACCGA AGAATCGAGG AACTGTCCGG CCTCCGCGCC 
GATCCGGACG CCGTCGCCTC CTGGCTACCC GAACCGGTGC CCTGA

Protein sequence

MNIEFHRLAL ADFDDLAAGG GRTGIVLGLR RTQLSKRLLA LHTVMTDAGE RAPAAVAAGG 
LTNAYGVLAT AQRQAPETTE TVLLSPGLGL WAMHCLRRLH GSANPATPLE EDLGILGSYA 
VAAALRAGLC ATVAVPLRDG HLLIPAVGRV QVGLAGWATV RIEGTVLHLT PGQVDNPQSD 
SLALEIPSDP AAKPPFPAQS QASQWHMVPE LVSIANRRRI ALLLDDVDPA RGLLKLPIAP 
DTATENVDVW QQRLDDGWHI LGDYDPLIAE AVAAGLATIF PLASSSWAEE LSASSGEAFG 
AVALTLPRDG LSFAAALVHE FQHTKLSALL DLVTLVKPAD ERLFYAPWRR DPRPLPGLLQ 
GAYAYLGLTG FWDYRRLAES GDEFAHFEFA RWRDEVWRVL STLRFSGAMT PLGLRFLDGM 
QSTIWSSRQK PVPDGPGELA RRTSDDTRIT WQLRNAEPSP AQITLLAKAW IEGSQPPPKT 
RIPTRIVPGR RGLVTSSRLA LTQLRLLDPK RFEAARQGVP HVLDATVSAA DRALAFGDTQ 
TAAQVYKEEI ECEPDLLDAW AGLALCRRQH AAPGSRTLVA RPEVVQRLHR RIEELSGLRA 
DPDAVASWLP EPVP