Gene Franean1_6669 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6669
Symbol
ID	5674984
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	8099189
End bp	8100610
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	72%
IMG OID	641245520
Product	hypothetical protein
Protein accession	YP_001510912
Protein GI	158318404
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00124083
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.737923
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCAGATT CACCGCAGAC TTCCGAACAT TCCCGCGAAC GACCGCGCCG TCCTGGCCCG 
GTACGGGCTT TCGGGGACAT GCTGGCATTC TTCGCCGGTG CGCAGGCGAA ATTCCTCCCG 
CCGACGGAGC GCGCCCGTTT CGTCACGGCC GGCGCGCTGA TGCTTCTGAC AGCGGCACTT 
GCCACCTGTG CGGGGGCGAC GGTGGTGGCC CTCGGTTTCG GCATCGGGAC CCTCCAGGCG 
CTGCCGTTCG GCATCTTCTA CGCGCTGTTC ATCTTCTTCA TCGACCGGTC CGTCCTGCTG 
ACCCAGACCC CGTACCGCTA TGGCGCGGAC GGCGGTGTGG AAACCGGCCG GGCTGGATTC 
TCCGTGGCGG TCCGCGTGTT CATCGCGGTG TGCGCGGCGA TAATCGTCGG GGAGACGGTA 
CTGCTCCGGA TCTTCGAGTC CTCGATCGCG AGCCGGGTCG CCGAGATACA GCAGGAGGAC 
GCCGGGCACC TACTGGCCGG GTGGGACGCG AACCAGGAGA GCGAGCTCGC CGCCCGCACG 
GCCGATCTCG CGGCGAAACA GAAAGGCCTC GACGCCGCCG ACGATCTCGT CGAGGCGAAG 
ACGGCGGAGG TGAACTGCCA GCTCACCGGT GGCCAGTCCG GCGATGGCCA GTCCGGCGAT 
GGCCCGGCCT GCCTGGGCGG GGCCGGCCCG GTCTACCAGA TCAAGCTGGC CGAGCTGGCC 
GCGGCCACCG CCGCCGTCAC CGACGCCACC CGGCTGCGCG ACGCCGCCCA ACGTGATCTT 
GACGAGTTTC GGGCTGCGCA GAAGGCCAGG CGCTCCGACT TCGCGGCCAC GGTGCAGACC 
ACGACGGGCG CGGCCGACGA CCTGCTGATG CGGGAGAAGG CGTTCTGGCG GCTGACCACC 
GAGGACCGCT CCGTCCTGGT GTGGCGCCTG TTGCTGACGT TGCTCCTGCT CGGCATCGAC 
CTCGCCCCGC TGCTGTTCAA GCGTGGTCTG GACCGCACCT CCTACCGGCA GCGCGAGCGC 
CTCGAGCGCT GGCGGGACGA GACCTCCGTC GAGGTCGACG CGCTGCAGGT CGGGCACACC 
GCCCGCGAGC GCCGCGACCT GGCCCCGGTG GTCGCGGCGC GTCTCGCCGG GCGCTGGGAG 
GACTACCTGC TGCGCCGCGA CAGCGTCGAG ACCGCCGTGC GCTGGACGGC CGACACGGCG 
CAGGCGCGCC TCGCCGAGGA GGAGATCAGC GCAGACCAGG AGTCGCGGCT GCGTGAGCTG 
CGGCGACGGC ACGGCATCGT CGCCGTGCCG CGCGTCCCGA CCTCCGACGC GGAGCCGTCC 
ACCCCGGCTG TCACCACCGG TTCGGCCGCG GCAGCCTCAG CCGCAACCGG ATCGGCGGTG 
GCCACCGGCC CGGCGGTGCC GGCGCCGCCG GAACCGCCGT GA

Protein sequence

MPDSPQTSEH SRERPRRPGP VRAFGDMLAF FAGAQAKFLP PTERARFVTA GALMLLTAAL 
ATCAGATVVA LGFGIGTLQA LPFGIFYALF IFFIDRSVLL TQTPYRYGAD GGVETGRAGF 
SVAVRVFIAV CAAIIVGETV LLRIFESSIA SRVAEIQQED AGHLLAGWDA NQESELAART 
ADLAAKQKGL DAADDLVEAK TAEVNCQLTG GQSGDGQSGD GPACLGGAGP VYQIKLAELA 
AATAAVTDAT RLRDAAQRDL DEFRAAQKAR RSDFAATVQT TTGAADDLLM REKAFWRLTT 
EDRSVLVWRL LLTLLLLGID LAPLLFKRGL DRTSYRQRER LERWRDETSV EVDALQVGHT 
ARERRDLAPV VAARLAGRWE DYLLRRDSVE TAVRWTADTA QARLAEEEIS ADQESRLREL 
RRRHGIVAVP RVPTSDAEPS TPAVTTGSAA AASAATGSAV ATGPAVPAPP EPP