Gene Franean1_5522 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5522
Symbol
ID	5673852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6689148
End bp	6690857
Gene Length	1710 bp
Protein Length	569 aa
Translation table	11
GC content	72%
IMG OID	641244378
Product	replication initiator protein
Protein accession	YP_001509782
Protein GI	158317274
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0195674
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGCC TCACCTCGAC TGACCCTGAC GCTTCCGCCG GCCGTGACGA TCGTCCGGGT 
TCCCGGGCGG CGCGGATGCG GACGCCGCTC GCTCGTCAGG TCGTGGAAAC GGTCGCAGTG 
GAGAACGGGG TGTGCGTCCG GCCGATGGCG ATGCGCCGGA CGAACCTCGA CACCGGCGAG 
ACCGAGATCA TCCCCGTACC GTGCGGCGCC ACGCTGGCGA GCAAGTGTCC GACCTGCGCG 
GAGAAGGCCC GGCGGCTGCG GATGGCGCAG TGCAAGGCAG GCTGGCATCT CGACGACGAA 
CCGCTACCCG ACCCGGACCC GCCCACGGAT GAGGCGAAGA CCCTCGCGGG CTTCCGTGCC 
GATCTCGAAA CCGTCCGGAT CGACGCTGAA CGCGACGGGG ACGCGGCCGG CGTCGCCGAG 
ATCGACGAAC TCATCGGCCA GGTGGACGAG GAACTCAACG CGCTGGGTGT GCGGGGGAAG 
GCGGCGCCGG AGGATCGGGA TCGGCCTCGC CGTGTCCGCT CGACCCGCCG GCGGCAGGAT 
GCCCCCGACC TGCCCCGGCT CCCGGTGGAC AAGCGGACAG TCGGGCGGAC CTTCGAAGCG 
GCGGACGGCA CCACCTGGCG GCCGTCGATG TTCCTGACCC TGACCTGCGA CTCGTACGGG 
CGGGTCACGA GTGAGGGAAC CCCGGTCGAT CCGGGCTCGT ACGACTACCG GCGGGCGGCC 
CGGGACGCGA TCCACTTCCC GAAGCTGATC GACCGGTTCT GGCAGAACCT GCGCAGGGCG 
GTCGGCTGGG ATGTGCAGTA CTTCGCCACC CTCGAACCGC AACGGCGGCT CGCCCCGCAC 
CTGCACGCGG CCATCCGCGG AACGGTGCCC CGGGTCCTGC TGCGGCAGGT GGCGGCGGCC 
ACGTATCAGC AGGTCTGGTG GCCGTCGTGT GACCGGCCGG TCTATGACGA CACGTGCCTC 
CCGGTCTGGG ACGACACTGC GGCCGGCTAC CTCGACCCGG ACACGTCCCG GCCGCTCCCG 
ACCTGGGATG AGGCAGTGGA CGCGATCGGC GACGATGCCG AACCGGCCCA CGTCGTCCGC 
TTCGGGCCCC AGCTCCGCGC GGACGGTGTC ACGGCGAACT CGGCGAACAC CGGCCGGATG 
ATCGGCTACC TGACCAAGTA TCTGGTGAAG AGCCTCGACG CCTGCCACGC CGTCACTACC 
GACGCCCAGC GGCGGCACGT CGATCGGCTC GCGGACGCGC TGCGCCACGA ACCGTGCTCG 
CCCACCTGCG CGAACTGGCT GCGCTACGGC GTCCAACCAC GCCACCCGAA ACCGGGCCTC 
GTCCCGGGCC GGTGCCGGGG CAAGGTCCAC CGGCGCGAGA CGCTCGGGTT CGGTGGCCGG 
CGGGTGCTCG TCTCGCGGCG CTGGTCCGGC AAAACCCTGA CCGACCACAA GCACGACCGG 
GTCGCGTTCA TCCGGGAGCA GCTCGAAGCC CTCGGCCAGG TGGCGACCGG CCCGGCAGCC 
ACTGGCACCG ACCCGGCACG GACGGTGTGG ACGCTGCTCC GGCCCGGTGA CCCGGCGGCC 
CCTCGCCGCG AACACCTGCT GTTGCAGGCA GTCGCGCAAC GGCATGCCTG GCGCGCACAA 
CTCGACGCGG CCCGCGCTGC CACGGCCGGC ACCGTCACGA CCGGCGGATC TCCGGGAACC 
GGCCCACCGG CGGTGGCTGA CGCTGCCTGA

Protein sequence

MTGLTSTDPD ASAGRDDRPG SRAARMRTPL ARQVVETVAV ENGVCVRPMA MRRTNLDTGE 
TEIIPVPCGA TLASKCPTCA EKARRLRMAQ CKAGWHLDDE PLPDPDPPTD EAKTLAGFRA 
DLETVRIDAE RDGDAAGVAE IDELIGQVDE ELNALGVRGK AAPEDRDRPR RVRSTRRRQD 
APDLPRLPVD KRTVGRTFEA ADGTTWRPSM FLTLTCDSYG RVTSEGTPVD PGSYDYRRAA 
RDAIHFPKLI DRFWQNLRRA VGWDVQYFAT LEPQRRLAPH LHAAIRGTVP RVLLRQVAAA 
TYQQVWWPSC DRPVYDDTCL PVWDDTAAGY LDPDTSRPLP TWDEAVDAIG DDAEPAHVVR 
FGPQLRADGV TANSANTGRM IGYLTKYLVK SLDACHAVTT DAQRRHVDRL ADALRHEPCS 
PTCANWLRYG VQPRHPKPGL VPGRCRGKVH RRETLGFGGR RVLVSRRWSG KTLTDHKHDR 
VAFIREQLEA LGQVATGPAA TGTDPARTVW TLLRPGDPAA PRREHLLLQA VAQRHAWRAQ 
LDAARAATAG TVTTGGSPGT GPPAVADAA