Gene Franean1_3556 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3556
Symbol
ID	5671925
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4219798
End bp	4221447
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	77%
IMG OID	641242442
Product	ABC transporter related
Protein accession	YP_001507862
Protein GI	158315354
COG category	[R] General function prediction only
COG ID	[COG1123] ATPase components of various ABC-type transport systems, contain duplicated ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACCA GAACGACCGG CGCACCGGAC GTCGGCCACA CCCCCGAGGG CTCCGAGGGG 
CCCGCCGCGG ACGTCGTCGT GACCGATCTG AGCATCGCCG CGGCCGGCGG GCGCGCGGTC 
CTCCACCGCG TCTCCTGTGA CCTGCCCGCC GGTGGGACCC TTGCCGTCGT CGGCACCTCC 
GGCGCGGGCA AGACGACGTT CGCGCTCGCG TTGGTGGGCC ATCTCGGGCC GGGCCTGACC 
CGGACCTCGG GCGGCGTGAC GATCGGCGGG GTCGACGTGT TCACCCGGCG CGCATCCCGC 
GCGCGGGAGC TGCGCCGCCA CCGGATCCGC TACCTGCCCC AGGATCCGGC GGCCTCGCTC 
ACCCCGACCA TGCGCGTCTC AGCGCTCCTG TCGGAGATGA TCCGCCTCGT CGGCGGCCGT 
CGGGCGGACG CGCGGGCGAG GGCCGCCGCG GCGTTGCGCG CGGTCGGGCT GCCCGACGAT 
CCGACCTTTC TCGCGCGGTA TCCCCACCAG CTCTCCGGCG GGCAGCGTCA GCGGCTGCTG 
CTCGCGCTGG CGCTGACCGG CGAGCCGGAC GTGCTCGTCC TCGACGAGCC GACCGCGAAC 
GTGGACCCCG ACCAGGCGGC CGCCCTGCTG GCCCTGATCG AGCAGCGCCG GGCGGGGCGC 
TCGTTCTCGC TCGTGCTGGT CAGCCATGAC CTGGCGGCCG TTGCCGCGCT GCCGGGCGCG 
CCGGAGCTCG TCGTGCTGGA CGGCGGGCGG CTCGTGGAGC GGGGAGCGCC CCGCGACGTC 
CTCGACCGGC CGCGCACCGG CCCGGCCCGG GCGCTGAGCA CCGCCAGCCG GCGGCTGAGC 
CACCCACCGG AGCAGGCGAC GGCGCAGCCA CCGGCACAGG CGTCGCCGCG TGCGGCCGGG 
CCCGAGCCCG GGCCCGCCGC TGTTCCCTCC CTCTCCCCCG GGCCGGACGC GGTGACGCTG 
CGTGTCGCCG GGCTGCGGGT CTCCACCGGG ACGGCACGCC GCCGGGCCGA GGTGCTGCGC 
GGTGTCGACC TGACCGTGCG GCGGGGCGAA TGCGTCGGCG TCGTCGGTGT CTCCGGCAGC 
GGGAAGACCA CGCTGGCCCG TGCCGTCATC GGCCTGCACC CGTGGGACGG CGGGACCGTG 
AAGCTCGGCG GAGTGCCGCT GGCACCCGCG GCGACGGACC GCCCGCCGCC GCAGCGCCGC 
CGGATCGGCT ACGTCTTCCA GGACCCGTAC ACGTCTCTCA ACCCGCGCCG GCCGGTCGGT 
GAGGCGGTGA CCCGCGCCTA CGCCCTCGCC GCGGGCGACG CTCGGCAGGG CGGACTGGGC 
GAGGAGGTCG CCGCGCTGCT CGCGGATCTG GGGCTCGACC CCGAGCTGGC GGCCCGCCGC 
CCGGAGCGGC TCTCCGGCGG CCAGCGCCAG CGGTTCGCCC TGGCCCGGGC CCTCGCCACG 
GCTCCGGACC TGCTGATCTG CGACGAGGTG ACGTCGGCGC TGGATCCCGT GTCAGCCAGC 
GCGATCTGCG GGCTGGTCCG TGGCCTGGTC ACCGAGCGCG GCCTGGCCGC CGTGTTCATC 
AGCCACGACC GGGGTGCCGT CGGCGCGGTG GCCGACCAGG TCCGGGAGCT GCGGGACGGG 
CTGCTCGCCG CCCCACCTCC CGGGCCCTGA

Protein sequence

MTTRTTGAPD VGHTPEGSEG PAADVVVTDL SIAAAGGRAV LHRVSCDLPA GGTLAVVGTS 
GAGKTTFALA LVGHLGPGLT RTSGGVTIGG VDVFTRRASR ARELRRHRIR YLPQDPAASL 
TPTMRVSALL SEMIRLVGGR RADARARAAA ALRAVGLPDD PTFLARYPHQ LSGGQRQRLL 
LALALTGEPD VLVLDEPTAN VDPDQAAALL ALIEQRRAGR SFSLVLVSHD LAAVAALPGA 
PELVVLDGGR LVERGAPRDV LDRPRTGPAR ALSTASRRLS HPPEQATAQP PAQASPRAAG 
PEPGPAAVPS LSPGPDAVTL RVAGLRVSTG TARRRAEVLR GVDLTVRRGE CVGVVGVSGS 
GKTTLARAVI GLHPWDGGTV KLGGVPLAPA ATDRPPPQRR RIGYVFQDPY TSLNPRRPVG 
EAVTRAYALA AGDARQGGLG EEVAALLADL GLDPELAARR PERLSGGQRQ RFALARALAT 
APDLLICDEV TSALDPVSAS AICGLVRGLV TERGLAAVFI SHDRGAVGAV ADQVRELRDG 
LLAAPPPGP