Gene Francci3_1148 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1148
Symbol
ID	3903576
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1364471
End bp	1366153
Gene Length	1683 bp
Protein Length	560 aa
Translation table	11
GC content	68%
IMG OID	637878480
Product	putative ABC transporter ATP-binding protein
Protein accession	YP_480256
Protein GI	86739856
COG category	[R] General function prediction only
COG ID	[COG0488] ATPase components of ABC transporters with duplicated ATPase domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.493052
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCAGT ACGTCTTCCA GATGCGCAAA GCGCGCAAGG CCCATGGCGA CAAGGTCATC 
CTCGATGATG TGACCCTGTC GTTCCTCCCC GGAGCCAAGA TCGGGGTAGT CGGCCCGAAC 
GGCGCGGGGA AGTCGTCCCT GCTCAAGATC ATGGCCGGCC TCGATCAGCC GAGTAACGGC 
GAGGCGACCC TGAGCCCCGG CTACACGGTC GGCATGCTCG CCCAGGAACC CCCGCTGGAC 
GAGACCAAGG ACGTCCGCGG CAACGTCGAG GACGGCGTGC GCGAGATCCG CCGGGTGCTC 
GCCCGCTACG AGGAGATCAA CGAGAAGATG TCCGCGCCCG ACGCGGACTT CGACTCCCTC 
CTCGCCGAGC AGGCCGAGCT TATCGACAAG ATCGAGGCCG CGAACGCCTG GGAGCTCGAC 
AGCCAGCTCG ACCAGGCCAT GGACGCGCTG CGGCTGCCGC CCGGCGATGC CGACGTCACC 
CTGCTCTCCG GCGGTGAGCG CCGCCGGGTC GCGCTGTGCA AGCTCCTGCT TGAGGCTCCC 
GACCTACTCC TGCTCGACGA GCCGACCAAC CACCTCGACG CCGAGAGCGT CGCCTGGCTG 
GAGCAGCACC TCGCCCGCTA TGCGGGCGCC GTGCTGGCCG TCACCCACGA CCGGTACTTC 
CTGGACAACG TCGCCGGCTG GATCCTCGAG CTCGACCGGG GCCGTGCCTT GCCCTACGAG 
GGCAACTACA CCACCTACCT GGAGAACAAG GCGGCCCGGC TGAAGGTCGA AGGCCAGAAG 
GACGCCAAGC GGCGCCGGGT GCTCGCCCAG GAACTCGAGT GGGTCCGGTC CAACCCGAAG 
GCCCGCCAGA CCAAGAGCAA GTCGCGTCTC GCCCGCTACG AGGAGCTGGC CGCCGAGGCG 
GACCGGGCGC GCCCGCGCGA CTTCGAGGAC ATCCAGATCC CGCCCGGCCC CCGGCTCGGC 
AACCAGGTCA TCGAGGCCAA GGGGCTCACC AAGGGCTTCG ATGACCGGCT TCTCATCGAC 
AACCTGTCGT TCACCCTGCC GCGCGGCGGC ATCATCGGCG TGATCGGCCC CAACGGCATC 
GGTAAGACGA CCCTGTTCAA GATGTTGACC GGCCAGGAGG CGCCGGACGC CGGAGAGCTC 
GTCATCGGCG ACACCGTCGA CATCGCCTAT GTCGACCAGA CCCGCTCGGG CCTGGACCCG 
AAGAAGAACG TCTGGCAGGT CGTCTCCGAC GGCCTCGACC ACATCGTCGT CGGCAAGGTC 
GACTTCCCGA GCCGGGCGTA CGTGTCGTCA TTCGGGTTCA AGGGGCCGGA CCAGCAGAAG 
CCCGTCGGTG TGCTGTCCGG TGGGGAGCGT AACCGGCTGA ACCTCGCGCT CACCCTCAAG 
CGTGGCGGCA ACGTCCTGCT TCTCGACGAG CCCACCAACG ACCTCGACGT GGAGACGCTG 
CGCTCCCTGG AGGACGCGCT GCTGGAGTTC GCCGGCTGCG CCGTGGTCAT CTCCCACGAC 
CGCTGGTTCC TCGACCGGGT CGCCACCCAC ATCCTGGCCT GGGAAGGAAC CGACGAGGAC 
CCGGCGCGCT GGTTCTGGTT CGAGGGGAAC TTCGCCGACT ACGAGACCAA CAAGATCGAC 
CGTCTCGGGC AGGAGGCGGC CCGCCCGCAC CGCGTCACCC ACCGCAAGCT CACCCGGGAC 
TGA

Protein sequence

MAQYVFQMRK ARKAHGDKVI LDDVTLSFLP GAKIGVVGPN GAGKSSLLKI MAGLDQPSNG 
EATLSPGYTV GMLAQEPPLD ETKDVRGNVE DGVREIRRVL ARYEEINEKM SAPDADFDSL 
LAEQAELIDK IEAANAWELD SQLDQAMDAL RLPPGDADVT LLSGGERRRV ALCKLLLEAP 
DLLLLDEPTN HLDAESVAWL EQHLARYAGA VLAVTHDRYF LDNVAGWILE LDRGRALPYE 
GNYTTYLENK AARLKVEGQK DAKRRRVLAQ ELEWVRSNPK ARQTKSKSRL ARYEELAAEA 
DRARPRDFED IQIPPGPRLG NQVIEAKGLT KGFDDRLLID NLSFTLPRGG IIGVIGPNGI 
GKTTLFKMLT GQEAPDAGEL VIGDTVDIAY VDQTRSGLDP KKNVWQVVSD GLDHIVVGKV 
DFPSRAYVSS FGFKGPDQQK PVGVLSGGER NRLNLALTLK RGGNVLLLDE PTNDLDVETL 
RSLEDALLEF AGCAVVISHD RWFLDRVATH ILAWEGTDED PARWFWFEGN FADYETNKID 
RLGQEAARPH RVTHRKLTRD