Gene Franean1_5318 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5318
Symbol
ID	5673652
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6405505
End bp	6407187
Gene Length	1683 bp
Protein Length	560 aa
Translation table	11
GC content	70%
IMG OID	641244175
Product	putative ABC transporter ATP-binding protein
Protein accession	YP_001509582
Protein GI	158317074
COG category	[R] General function prediction only
COG ID	[COG0488] ATPase components of ABC transporters with duplicated ATPase domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.134924
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.268079
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCAGT ACGTCTTCCA GATGCGCAAG GCCCGCAAGG CCCACGGCGA CAAGGTGATC 
CTCGACGACG TCACCCTGGC GTTCCTGCCC GGCGCGAAGA TCGGCGTCGT CGGGCCGAAC 
GGTGCCGGGA AGTCGTCGCT ACTCAAGATC ATGGCCGGCC TCGACCACCC GAGCAACGGC 
GACGCGATCC TGAGCCCCGG CTACACGGTC GGCATGCTCG CGCAGGAGCC GCGGCTCGAC 
GAGGCCAAGG ACGTCCGCGG CAACGTCGAG GACGGCGTCC GCGAGATCCG CGCGGTGCTT 
GCCCGGTACG AGGAGATCAA CGAGAAGATG GCCGCGCCCG ACGCGGACTT CGACACGCTC 
CTCGCCGACC AGGCGGCGCT GATCGACAAG ATCGAGGCGG CGAACGCCTG GGAGCTCGAC 
AGCCAGATCG ACCAGGCGAT GGACGCCCTG CGCCTGCCGC CCGGCGACGC GGACGTCACC 
GCGCTCTCCG GTGGTGAGCG CCGCCGGGTG GCGCTGTGCA AGCTGCTGCT CGAGGCGCCC 
GACCTGCTGC TGCTGGACGA GCCGACCAAC CACCTCGACG CGGAGAGCGT CGCCTGGCTG 
GAGCAGCACC TGGCCCGCTA CGCCGGGGCG GTGCTGGCCG TCACGCACGA CCGGTACTTC 
CTCGACAACG TCGCCGGCTG GATCCTCGAG CTCGACCGCG GCCGCGCCCA CCCCTACGAG 
GGCAACTACT CCACCTACCT GGAGAACAAG GCGTCCCGGC TCAAGGTCGA GGGCCAGAAG 
GACGCCAAGC GCCGCCGGGC GCTCGCCCAG GAGCTCGAGT GGGTCCGCTC GAACCCGAAG 
GCCCGCCAGG CCAAGAGCAA GTCCCGCCTC GCCCGTTACG AGGAGCTGGC CGCCGAGGCG 
GACAAGGCCA GGCCGCGCGA CTTCGAGGAG ATCCAGATCC CGCCCGGCCC GCGGCTGGGC 
AGCCTGGTGA TCGAGACGAA GAAGCTCACC AAGGGCTTCG GTGAGCGGGT GCTCATCGAC 
GACCTGTCGT TCAGCCTGCC GCGCGGTGGC ATCGTCGGCG TGATCGGCCC GAACGGCGTC 
GGCAAGACCA CGCTGTTCAC GATGCTTGTC GGCCAGGCGT CGCCTGATTC CGGCGAGCTG 
CAGATCGGCG AGACGGTCGA CATCGCCTAC GTGGACCAGT CCCGCGGCGG TCTCGACGCG 
AAGAAGAACG TGTGGGAGAT CGTCTCCGAC GGGCTGGACC ACATCGTCGT CGGGAAGACC 
GACATCCCGA GCCGGGCGTA CGTGTCGTCG TTCGGGTTCA AGGGGCCTGA CCAGCAGAAG 
CCGGTCGGCG TGCTCTCCGG CGGAGAGCGC AACCGGCTGA ACCTGGCGCT GACCCTCAAG 
CGCGGCGGCA ACGTGCTGCT GCTCGACGAG CCCACGAACG ACCTGGACGT CGAGACCCTG 
CGGTCGCTGG AGGAGGCGCT GCTGGAGTTC CCGGGCTGCG CCGTGGTCGT CTCCCACGAC 
CGGTGGTTCC TGGACCGGGT CGCGACGCAC ATCCTGGCCT GGGAGGGCAC CGAGGCCGAC 
CCGGCCCGCT GGTTCTGGTA CGAGGGCAAC TTCGCCGACT ACGAGACCAA CAAGGTCGAG 
CGGCTCGGTG CGGACGCGGC CCGCCCGCAC CGGGTGACGT ACCGCAAGCT CACCCGCGAC 
TAG

Protein sequence

MAQYVFQMRK ARKAHGDKVI LDDVTLAFLP GAKIGVVGPN GAGKSSLLKI MAGLDHPSNG 
DAILSPGYTV GMLAQEPRLD EAKDVRGNVE DGVREIRAVL ARYEEINEKM AAPDADFDTL 
LADQAALIDK IEAANAWELD SQIDQAMDAL RLPPGDADVT ALSGGERRRV ALCKLLLEAP 
DLLLLDEPTN HLDAESVAWL EQHLARYAGA VLAVTHDRYF LDNVAGWILE LDRGRAHPYE 
GNYSTYLENK ASRLKVEGQK DAKRRRALAQ ELEWVRSNPK ARQAKSKSRL ARYEELAAEA 
DKARPRDFEE IQIPPGPRLG SLVIETKKLT KGFGERVLID DLSFSLPRGG IVGVIGPNGV 
GKTTLFTMLV GQASPDSGEL QIGETVDIAY VDQSRGGLDA KKNVWEIVSD GLDHIVVGKT 
DIPSRAYVSS FGFKGPDQQK PVGVLSGGER NRLNLALTLK RGGNVLLLDE PTNDLDVETL 
RSLEEALLEF PGCAVVVSHD RWFLDRVATH ILAWEGTEAD PARWFWYEGN FADYETNKVE 
RLGADAARPH RVTYRKLTRD