Gene Franean1_7234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_7234
Symbol
ID	5675535
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	8832521
End bp	8833903
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	77%
IMG OID	641246071
Product	hypothetical protein
Protein accession	YP_001511459
Protein GI	158318951
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.273739
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.522383
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCCGC GGTCAGAGGC TTCCTGCTGT GCTGTCGCGA TGACGCAGGC GGTGCAGTGG 
GATCAGGGCG TCTCGGACGC GTGGTCACGG ATCGCGCAGA TCGGTCCCAA GATCCTGGTC 
TTCGCGCTCG TCCTCACCGT CGGAGCCGTG GTCGTCCGCG GCGCGCTCCA CGCCGCGGAC 
CGGGTGCTGG AGCAGGCCGG CCTCGACGGC GCGCTCGACC GGGCCGGCGC GTCGCGGCTG 
CTGCGCTGCC AGACCGGGGT GATCAGGGGA TGGCTGCTGC GGGTGGTGGC CGTGATCTGC 
CTGTTGGCCA TCCTGCGTGC GGCGCTCGGG GTGTTCGGGC CGAGTCCCGC CGACCGGATG 
GCCGGCACAG CGCTGGCGCT GCTCGCCCGC GCGCTGCTCG CGGCCGTCAT CGCGCTGCTC 
GGGCTGGCGC TGGCCGCCTG GGCGCGGCGC CTGGTCACCG AGTCGTTCGC CGGGCTGCGG 
CACGGCAACG CGCTGAGCCG GGCCGTTGCC GGGTTCGCCG TCCTCGCCTT CGGCAAGGCG 
GCGCTGGACG AGCTCGGCAT CGGGACGTCG GTCACCACAC CACTGCTCTA CGCAGTGCTC 
GCGGCCTGCA CCGGAGTGGT GGTGGTCGGA GTGGGCGGCG GTCTCGTCCG GCCGATGCAG 
AGCCGCTGGG AGAAGATCCT CGACCGGGCC GAGGACGGCG CCGGAGAGGC CCGCGCCGCC 
TGGCACGCGA ACCGGGGCGC GGCGCGGTGG GCACCGCCGA GCAGCGCCGG CCAGAGCCCC 
CCGGGACGGC CGTCCACACC GCCCGGCGGC ACGCCCCCAC CACCCGCGCC AGCCAGCCGT 
GACACAGCCA CGCCGCCCTG CGGCACGCCC ATGGCACCCC TCGGTGAGCC GGGGCCGGAC 
CGCGGCGTGC CCGTACCCGA CCCGGGTACG GCGGTGGCAC GCCGCACCGC GCCTCAGACG 
CGCCCGCACC CGGGGCCAGC GACGGAACCG GCGTCCGTGC CCACGCCGAC TCCGGTGCCG 
CCGCGGGCGC CGGCGCCCAC ACCGGCGGCG GCGCCGGCAC CGCGGCACCC GCCCGTCCCG 
CTACCGGGCG AGCGGGGAAC GGCGTCGGAG CGGCGTCGGA CCCCGGCGCC GTCAGCGGTA 
CCCGTGCCAC CGCCCCCGCC GCGATCGGCT CCGCCGAGCA CAGCACGGCC TGGAGCGTCC 
TCCCCGCCGG GAGCGCTACC GCGGGCCCCC TCGGCGGCCG ACGTGCCGGG ACGGGTACCG 
TCCACGGATC CCGCACCCGC GTCGCCACGC ACAACCCTGC CATCGCCGTC GGTGCTCCCC 
GGCACGCCAC CGACATCCCC TGTTCGGGGG GAGGACCAGC TCCCCGGCAC TGTTTCCGAC 
TGA

Protein sequence

MDPRSEASCC AVAMTQAVQW DQGVSDAWSR IAQIGPKILV FALVLTVGAV VVRGALHAAD 
RVLEQAGLDG ALDRAGASRL LRCQTGVIRG WLLRVVAVIC LLAILRAALG VFGPSPADRM 
AGTALALLAR ALLAAVIALL GLALAAWARR LVTESFAGLR HGNALSRAVA GFAVLAFGKA 
ALDELGIGTS VTTPLLYAVL AACTGVVVVG VGGGLVRPMQ SRWEKILDRA EDGAGEARAA 
WHANRGAARW APPSSAGQSP PGRPSTPPGG TPPPPAPASR DTATPPCGTP MAPLGEPGPD 
RGVPVPDPGT AVARRTAPQT RPHPGPATEP ASVPTPTPVP PRAPAPTPAA APAPRHPPVP 
LPGERGTASE RRRTPAPSAV PVPPPPPRSA PPSTARPGAS SPPGALPRAP SAADVPGRVP 
STDPAPASPR TTLPSPSVLP GTPPTSPVRG EDQLPGTVSD