Gene Francci3_2118 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2118
Symbol
ID	3905508
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2484319
End bp	2486136
Gene Length	1818 bp
Protein Length	605 aa
Translation table	11
GC content	73%
IMG OID	637879453
Product	oligopeptide/dipeptide ABC transporter, ATP-binding protein-like
Protein accession	YP_481219
Protein GI	86740819
COG category	[R] General function prediction only
COG ID	[COG1123] ATPase components of various ABC-type transport systems, contain duplicated ATPase
TIGRFAM ID	[TIGR02323] phosphonate C-P lyase system protein PhnK

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.227418
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.486625
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCCGG ACGTGACCGC CGCCGAGCCG ACCCTGGTCG TCGAGCGGCT GGACGTGACG 
TTTCGGGACG GCGTCGCCGG CGTGCGTGCG GTGCGGGACG TGTCGATCGC CGTCCGTCCC 
GGCGAGTGTC TCGCGGTCGT GGGCGAGTCC GGTGCCGGCA AGAGCGTGCT CGCCCGGACG 
CTGATCGGAC TGGCCGGGCG CGGTGCGATG GTCCGTGCTG GCCGGCTGGA CCTGCAGGGC 
GTGGATCTGA CCGCCTTGAC CGAACCGGGG TGGCGGGTGT TGCGAGGCCG CCGGATCGGG 
TTGGTGCCCC AGGACGCGTT GGCCTCCCTG GATCCGCTGC GGACGGTGGG AGCGGAGGTG 
GCCGAGCCCC TGCGCGTCCA CCGGATCGTG GCCCGTCGCG ACGTCCGCGA GCGGGCCGTC 
GCGACGCTTG GGCAGGTGGG GGTGCCGGAG CCGGCCCGGC GCGCCGGGCA GTACCCGCAT 
CAGCTCTCTG GCGGTCTGCG ACAGCGGGCC CTGATCGCCT CGACGGTCGC GGCCGGACCC 
GACCTGCTGC TGGTCGACGA ACCCACGACC GCGTTGGATG CCGCCTCCCG GGAGCGGATC 
GTCGAGGTGC TGCGCGGCCT GGTACGCGGC GGTGTCGCTC TGCTGTTGAT TAGTCACGAT 
CTTGCCACGG TGGCCGCCGT CGCCGACCGG GTGGCGGTCA TGTACGAGGG GCGGATCATC 
GAGCAGGGAC CGGCCGTCGA CGTGCTTGGC GGTCCACGGC ATCCGTACAC CTGCGCGTTG 
CTCGCGGCGG CCCCCTCGCG GCACTCGCGG GGCACCGTGC TGTCCCCGGA CCTGCCGCGC 
CGTCCACCGG CCGGGCCGGA CGGCTGCCCA TACGCGGTGC GCTGCCCACT CGCCGACCAC 
TGGTGCCGCG AGGAACTGCC GCGCCCCGAT CACCCGGGTC TCGAACCCGG CGTCCTGTGC 
TGGCGGCCCG GAACGGAAAC GGAGCGGGCC GGACCGCCAC GGGTCGTCGC CCCGGCCCGC 
AGGGACACCG CCGAGGCTCT CGTCGAAGCC ACCGGCATCA CCAAACGTTT CCGCGATCCC 
GACGGGGGGT GGCGGGACGC CGTCCGTGCC GTGACGTTCG AGCTTCGTGC CGCCGAGACA 
CTCGGCGTCA TCGGTGGGTC CGGGTCCGGC AAGACCACGC TGGCCCGCAT CGTGCTCGGC 
CTGCTCGAAC CGGACGAGGG TACCGTCCGG TTCGCCGGCG CGCCCTGGGT GGCGGCCGCG 
GCGGCGACCG CCTCGCCCAG CCGGGTACGC GAACGTGACC GCAGGCCTCG GCGGCACCGG 
ATACAGGCCG TCCACCAGGA CTGCCTGAGC TCATTCGACC CGCGTCACAC CGCCGAGCGG 
ATCGTCGGCG ACGCCATGTC CGGTCCGGAT CGGGGCCGGG CGCGACGAGA TCGGATCGTC 
GCACTCCTCG ACCAGGTAGG GCTGTCCGAA CAGGTGCTGC GACGCCACCC TCGCGAGCTG 
TCCGGCGGGC AGCGTCAGCG GCTGGCGATC GCGCGTGCGC TCGCGCCGTC ACCCGAGGTC 
CTCGTCTGCG ACGAACCGGT GTCCGCGCTC GACCTGTCGG TGCAGGCCCA GATCCTCGAC 
CTGCTGGCGG GACTGCGCGA CGAACTCGGC TTGGCCCTGC TGTTCATCTC CCACGATATC 
GCAGTGATCC GGCACGTCAG CGACCGCGTC CTGGTGATGA AGGACGGGCA GGTGGCCGAG 
ATCGGCGGCG CGGAGCAGGT GCTCGAGCGC CCCGCGCACC CGTACACCCG GCATCTGCTG 
GCCGCGGCCC GCACCTGA

Protein sequence

MSPDVTAAEP TLVVERLDVT FRDGVAGVRA VRDVSIAVRP GECLAVVGES GAGKSVLART 
LIGLAGRGAM VRAGRLDLQG VDLTALTEPG WRVLRGRRIG LVPQDALASL DPLRTVGAEV 
AEPLRVHRIV ARRDVRERAV ATLGQVGVPE PARRAGQYPH QLSGGLRQRA LIASTVAAGP 
DLLLVDEPTT ALDAASRERI VEVLRGLVRG GVALLLISHD LATVAAVADR VAVMYEGRII 
EQGPAVDVLG GPRHPYTCAL LAAAPSRHSR GTVLSPDLPR RPPAGPDGCP YAVRCPLADH 
WCREELPRPD HPGLEPGVLC WRPGTETERA GPPRVVAPAR RDTAEALVEA TGITKRFRDP 
DGGWRDAVRA VTFELRAAET LGVIGGSGSG KTTLARIVLG LLEPDEGTVR FAGAPWVAAA 
AATASPSRVR ERDRRPRRHR IQAVHQDCLS SFDPRHTAER IVGDAMSGPD RGRARRDRIV 
ALLDQVGLSE QVLRRHPREL SGGQRQRLAI ARALAPSPEV LVCDEPVSAL DLSVQAQILD 
LLAGLRDELG LALLFISHDI AVIRHVSDRV LVMKDGQVAE IGGAEQVLER PAHPYTRHLL 
AAART